Трамп, конечно, не умеет говорить по-китайски. Но ИИ действительно изменяет мир, и такие передовые китайские компании, как iFlyTek, прокладывают путь для этих изменений. Обучив свои алгоритмы на больших выборках выступлений президента Трампа, iFlyTek создала почти идеальную цифровую модель его голоса: совпадало все – интонация, тональность, манера речи. Потом эту вокальную модель перенастроили на китайский язык и продемонстрировали всему миру, как могла бы звучать речь Дональда Трампа, если бы он вырос в деревне неподалеку от Пекина. Движение губ было синхронизировано с китайскими словами не точно, но достаточно правдоподобно, чтобы обмануть случайного зрителя. Президент Обама тоже получил сувенир от iFlyTek: это была видеозапись реальной пресс-конференции, только говорил он на идеальном мандаринском наречии, причем в свойственном ему «профессорском» стиле.
«С помощью iFlyTek я выучил китайский язык, – сказал Обама корреспондентскому корпусу Белого дома. – Думаю, что говорю на нем лучше, чем Трамп. А вы как считаете?» iFlyTek может сказать то же самое своим конкурентам: эта китайская компания одержала победы на ряде престижных международных конкурсов ИИ по распознаванию и синтезу речи, распознаванию изображений и машинному переводу. Даже в обработке естественного языка (то есть способности ИИ понимать общий смысл высказывания) на «втором» языке компании, английском, iFlyTek часто оставляет позади команды Google, DeepMind, Facebook и IBM.
Этот успех пришел не сразу. Еще в 1999 году, когда я начинал работу над проектом Microsoft Asia, моим лучшим помощником некоторое время был одаренный молодой человек с докторской степенью по имени Лю Цинфэн. Он входил в число тех студентов, которые после моей лекции в Хэфэй покидали общежитие, чтобы продолжить читать учебники при свете уличных фонарей. Свойственные ему трудолюбие и творческий подход к научным исследованиям делали его одним из самых перспективных молодых исследователей в Китае. Но когда мы предложили ему грант и стажировку в Microsoft с последующим трудоустройством, Лю не согласился. Он хотел начать свою деятельность в компании, занимающейся разработками в области ИИ. Я сказал ему, что признаю его выдающиеся исследовательские способности, но Китай слишком сильно отстал от таких американских гигантов в области распознавания речи, как компания Nuance, и что в Китае не так много пользователей, которых могла бы заинтересовать эта технология. Лю, к его чести, не поверил моим словам и стал основателем iFlyTek. Прошло почти 20 лет, были одержаны десятки побед на конкурсах в области ИИ, и в конце концов iFlyTek значительно превзошла Nuance и по техническим возможностям, и по рыночной капитализации, став самой дорогой в мире компанией, занимающейся распознаванием речи. Сочетание передовых достижений iFlyTek в распознавании, переводе и синтезе речи приведет к созданию новаторских продуктов на основе ИИ, таких как наушники с синхронным переводом, мгновенно преобразующие ваши слова и голос в речь на любом языке. Подобные продукты скоро произведут революцию в международных поездках, бизнесе и культуре и высвободят новые огромные запасы времени для творчества и созидательного труда.
Несколько волн ИИ
Но это произойдет не сразу. Полная революция займет некоторое время и будет состоять из четырех волн – то есть этапов внедрения ИИ. Первым мир покорит ИИ интернета, затем ИИ для бизнеса, потом наступит черед ИИ восприятия и автономного ИИ. На каждом из этих этапов ИИ будет захватывать новые области нашей повседневной жизни.
Первые две волны – ИИ интернета и ИИ для бизнеса – уже накрыли нас, почти неощутимо меняя цифровой и финансовый мир. Они настойчиво привлекают наше внимание к интернет-компаниям, заменяют юристов среднего звена алгоритмами, ведут торговлю акциями и диагностируют болезни.
ИИ восприятия сейчас оцифровывает наш физический мир, учится распознавать лица, понимать просьбы и «видеть» окружающее. Эта волна обещает изменить наше восприятие реальности и взаимодействие с ней, размывая границы между цифровым и физическим миром. Автономный ИИ придет последним, но окажет сильнейшее влияние на нашу жизнь. Как только самоуправляемые автомобили заполнят улицы, автономные дроны поднимутся в небо, а интеллектуальные роботы начнут трудиться на фабриках, они изменят до неузнаваемости все стороны нашей жизни – от выращивания органических овощей и фруктов до вождения и питания. Для каждой из этих волн нужны разные виды данных, и каждая из них дает Соединенным Штатам и Китаю шанс захватить лидерство. Китай может занять лидирующие позиции в области ИИ интернета и ИИ восприятия, и, скорее всего, быстро догонит Соединенные Штаты в области автономного ИИ. В настоящее время ИИ для бизнеса остается единственной ареной, где Соединенные Штаты бесспорно сохраняют первенство.