Читаем Об ИИ без мифов. Путеводитель по истории Искусственного Интеллекта полностью

До появления нынешних мультимедийных средств казалось, что роботы могут иметь только материальное воплощение для занятия физическим трудом. Но с появлением разнообразных устройств, поддерживающих человеко-машинный интерфейс, с одной стороны, с другой, с возрастанием роли данных в современной экономике, изменилось представление о труде. Умственный труд оказался не менее важен, чем физический и, как следствие, оказалось насущным создание виртуальных роботов для автоматизации такого труда. Виртуальные роботы, не рассматриваются в качестве замены человеческого интеллекта, а как средство для его расширения (Augmented AI, AuI). Это направление роботизации находится на начальном уровне развития, пока самыми распространенными приложениями, относимыми к роботам, остаются речевые технологии (conversation-based technology). В их числе разговорные роботы чатботы (chatbot), речевые агенты (conversational agent) и виртуальные помощники (virtual assistant). В порядке возрастания сложности они могут быть упорядочены:

• Чатбот, действует в режиме один вопрос – один ответ (single-turn exchanges), например, «Гугл, какая гора самая высокая на Земле?»

• Речевой агент, вступает в диалог с пользователем, стремясь понять его проблему. Такой агент обучен задавать заранее подготовленные вопросы, чтобы выйти на возникающую проблему и по возможности ее решить, например, при обращении в банк: «Моя карта не срабатывает».

• Виртуальный помощник, настраивается на индивидуальные запросы клиента, пользуется накопленной о нем информацией, по мере взаимодействия с клиентом обучается и повышает качество ответов. Он может напомнить расписание полетов или список дел.

Создание виртуальных роботов требует решения двух проблем. Одна в большей мере формальная или техническая, она делится на две составляющие: распознавание и воспроизведение речи, задачи из этой категории уже имеют более или менее удовлетворительные решения. Другая категория – то есть содержательная – «понимание» обращений пользователя и формирование ответов.

Свою историю речевые боты ведут от программы ELIZA, написанной в 1966 году профессором МТИ Джозефом Вейцбаумом. Качественно новый шаг через 30 лет совершил Ричард Уоллес (1960), создатель виртуального собеседника «Искусственное лингвистическое интернет-компьютерное существо» A. L. I. C. E. (Artificial Linguistic Internet Computer Entity). Уоллес создал AIML язык разметки для AI по образу и подобию XML.

Между ELIZA и современными речевыми технологиями возник разрыв на несколько десятилетий, в первую очередь он был обусловлен отсутствием необходимых средств для распознавания речи (Automatic speech recognition, ASR) и воспроизведения голоса (Speech synthesis). Первая из этих задач оказалась чрезвычайно наукоемкой и потребовала более полувека работы большого числа специалистов. Нетрудно догадаться, что в ее решении были заинтересованы многочисленные спецслужбы разных государств, начало деятельности в этом направлении описано в «Круге первом» А. И. Солженицына. На речевой ввод возлагались огромные надежды – еще в 1977 году Билл Гейтс заявил, что через десять лет клавиатуры станут не нужны, компьютеры смогут понимать человеческую речь. В 1987 году он оказался скромнее, выразив убеждение в том, что через пять лет большая часть интернет-запросов будет совершаться с помощью речи, а не клавиатуры. И это предсказание тоже не сбылось, и в 2021 году клавиатура не исчезла и она успешно используется для запросов.

Для создания чатботов нужны еще средства распознавания речи, работы в этом направлении начались еще в 50-е годы, первые шаги в этом направлении были сделаны в процессе совместной работы лабораторий из нескольких университетов по программе автоматической транскрипции речи (Robust Automatic Transcription of Speech, RATS), спонсированной DARPA. Она завершилась созданием Harpy System, способной распознавать речь примерно на уровне трехлетнего ребенка. В последующем продолжались многочисленные эксперименты и исследования, но конца 90-х годов трудно было говорить о практической реализации технологий распознавания речи.

Решающий прорыв в этом направлении был сделан Google в 2001 году с изобретением Google Voice Search, использовавшем вычислительные мощности больших ЦОДов, хранящих сотни миллиардов речевых образцов.

Перейти на страницу:

Похожие книги

Иная жизнь
Иная жизнь

Эта книга — откровения известного исследователя, академика, отдавшего себя разгадке самой большой тайны современности — НЛО, известной в простонародье как «летающие тарелки». Пройдя через годы поисков, заблуждений, озарений, пробившись через частокол унижений и карательных мер, переболев наивными представлениями о прилетах гипотетических инопланетян, автор приходит к неожиданному результату: человечество издавна существует, контролируется и эксплуатируется многоликой надгуманоидной формой жизни.В повествовании детективный сюжет (похищение людей, абсурдные встречи с пришельцами и т. п.) перемежается с репортерскими зарисовками, научно-популярными рассуждениями и даже стихами автора.

Владимир Ажажа , Владимир Георгиевич Ажажа

Альтернативные науки и научные теории / Прочая научная литература / Образование и наука
100 великих загадок Африки
100 великих загадок Африки

Африка – это не только вечное наследие Древнего Египта и магическое искусство негритянских народов, не только снега Килиманджаро, слоны и пальмы. Из этой книги, которую составил профессиональный африканист Николай Непомнящий, вы узнаете – в документально точном изложении – захватывающие подробности поисков пиратских кладов и леденящие душу свидетельства тех, кто уцелел среди бесчисленных опасностей, подстерегающих путешественника в Африке. Перед вами предстанет сверкающий экзотическими красками мир африканских чудес: таинственные фрески ныне пустынной Сахары и легендарные бриллианты; целый народ, живущий в воде озера Чад, и племя двупалых людей; негритянские волшебники и маги…

Николай Николаевич Непомнящий

Приключения / Научная литература / Путешествия и география / Прочая научная литература / Образование и наука