Многие из последних достижений в области искусственного интеллекта, упоминаемых в новостях, так или иначе связаны с искусственными нейронными сетями — большими системами простых элементов, сложным образом взаимодействующих между собой. Эти системы созданы по аналогии с простотой и сложностью нейронов и мозга соответственно. Новые методы построения глубинных сетей со множеством слоев нейронов подходят для решения актуальных проблем или даже превосходят требования, предъявляемые такими разнообразными задачами, как распознавание речи, идентификация изображений и перевод с одного языка на другой. У всякого, кто интересуется искусственным и естественным интеллектом, эти достижения вызывают два вопроса: во-первых, должны ли все разумные машины иметь сходство с мозгом и, во-вторых, что мы узнаём о настоящем мозге и разуме, исследуя искусственный мозг и разум?
Когда человек начинает интерпретировать данные, — не важно, выясняет ли он значение слова или пытается понять действия коллеги, — он может пойти по одному из двух неверных путей: оказаться чересчур предвзятым или слишком довериться данным. Ваши предположения введут вас в заблуждение, если вы решите, что слово на новом для вас языке значит то же самое, что и слово с тем же звучанием на языке, который вы знаете, например французское gâteau и испанское gato[48] (что может иметь неприятные последствия и для домашнего животного, и для праздника). Чрезмерное доверие данным подведет вас, если вы решите, что ваша идея очень не понравилась коллеге, тогда как на самом деле он просто на взводе, потому что всю ночь просидел без сна с простудившимся ребенком (а это не имеет к вам вообще никакого отношения).
Компьютеры, пытающиеся интерпретировать входящие данные, чтобы извлечь из них какие-либо закономерности, сталкиваются с такими же проблемами. Значительная часть исследований в области машинного обучения наталкивается на существенные противоречия между строгостью и гибкостью. Большая строгость означает большую предвзятость, что бывает полезно для вынесения суждений на основе ограниченных объемов данных, но может также приводить к систематическим ошибкам, снижающим эффективность работы. Большая гибкость означает больше возможностей для обнаружения закономерностей, проявляющихся в данных, но также и более высокий риск принятия за паттерны то, что не является таковыми.
В исследованиях по искусственному интеллекту эти противоречия между строгостью и гибкостью проявляются в различиях между видами систем, которые можно использовать для решения различных ресурсоемких задач, таких как распознавание речи, компьютерное зрение и машинный перевод. В течение многих десятилетий системы, которые лучше всего справлялись с такими задачами, тяготели к строгости. Они были результатом тщательного планирования, разработки и совершенствования целыми поколениями инженеров, которые обдумывали особенности речи, образов и синтаксиса и пытались выстроить в систему лучшие из своих предположений насчет того, как следует интерпретировать каждый из отдельных видов данных. Недавние открытия, использующие искусственные нейронные сети, сделаны, напротив, с помощью гибких алгоритмов. Они используют набор принципов, которые в равной степени могут быть применены в множеству различных контекстов, то есть у этих алгоритмов нет предрасположенности к какой-то конкретной информации, что позволяет системе самостоятельно выяснять, как интерпретировать входные данные.
Искусственные нейронные сети теперь, возможно, лучше справляются с распознаванием речи, изображений и смысла в предложениях, чем системы, разрабатывавшиеся поколениями инженеров, и в этом ключ к их высокой эффективности. Победа гибкости над строгостью — отчасти результат инноваций, которые позволяют нам строить искусственные нейронные сети большего масштаба и быстро их обучать. Но отчасти это также результат увеличения объемов данных, которые можно скормить нейронным сетям. У нас теперь больше записанной речи, больше оцифрованных изображений, больше документов на разных языках, чем когда-либо прежде, и объем доступных данных меняется так, что в конце концов должно быть достигнуто равновесие между строгостью и гибкостью.
Когда у вас нет большого количества данных, то есть когда вам приходится строить допущения на основе ограниченных сведений, строгость важнее. Под руководством грамотных инженеров компьютерам проще делать разумные предположения. Когда у вас много данных, важнее оказывается гибкость. Здесь вам уже не нужно, чтобы система ограничивалась только теми идеями, которые смогли найти инженеры, если у вас достаточно данных для того, чтобы позволить компьютеру предложить идеи получше. Так что системы машинного обучения, в которых упор сделан на гибкость, как в искусственных нейронных сетях, успешнее всего справляются с задачами, в которых доступны большие объемы данных.