Читаем Млечный Путь, 21 век, No 3(48), 2024 полностью

Для этого мы не заставляем ИИ выбирать точное слово для каждого нового разговора, а заставляем выводить распределение вероятностей по всему словарю. Другими словами, модель ранжирует известные ей слова (словарный запас) в зависимости от того, насколько они статистически обоснованы как продолжение входной последовательности.

Однако, как ни странно, мы не всегда выбираем наиболее вероятное слово. Фактически, мы случайным образом выбираем одно из слов из топ-k, поскольку все они, вероятно, являются разумными продолжениями (на изображении выше все 5 вариантов семантически действительны). Это делается для повышения творческих способностей модели, что иногда желательно и считается, что это повышает мастерство модели в языковом моделировании.

LLM включают гиперпараметр под названием "температура", который позволяет вам контролировать, насколько "креативной" вы хотите, чтобы модель была. Но всякий раз, когда модель ошибается в этом процессе и выдает какое-то диковинное утверждение, действительно ли она "галлюцинирует", как это делают люди?

Исследователи говорят, что это вопиюще неверно. Галлюцинация подразумевает неправильное восприятие мира, которое заставляет человека высказывать утверждения, не подкрепленные реальностью. Но вот в чем дело: LLM не способны воспринимать реальность. Они видят реальность через призму текста, что не позволяет им по-настоящему пережить ее.

Этот мыслительный процесс, вероятно, будет учитывать, что наш недавно обсуждавшийся "Платонический ИИ" также не совсем точен (или, по крайней мере, неполон), поскольку моделям не хватает перцептивной способности наблюдать реальность: он наблюдает созданное человеком представление реальности (текст и изображения), что не является самой реальностью.

Таким образом, хотя модели могут сближаться, они все равно должны быть наделены способностью воспринимать реальный мир. По этой причине называние этого "галлюцинацией" приносит больше вреда, чем пользы.

Но почему бы просто не назвать это ложью?

Понимание цели ChatGPT

Исследователи также заявляют: утверждение, что "ChatGPT лжет", искажает истинную природу программ LLM. Чтобы солгать, кто-то должен знать правду о чем-то и намеренно выбрать альтернативное неточное утверждение. Это НЕ то, что делает ChatGPT.

Фактически, команда утверждает, что модель не может различать правду и ложь потому не пытается сказать правду; это просто имитация человеческого языка. По этой причине "чушь" или распространение неточных утверждений без осознания их неточности - вот термин, который больше применим к LLM.

Но почему? Поскольку модель "говорит правду", ее точность зависит от правдивости ее обучающих данных. Модель не оценивает правдивость каждого слова и утверждения; скорее, она генерирует ответы, основанные на статистических закономерностях и вероятностях, независимо от их истинности или ложности.

Другими словами, для ChatGPT, если два поколения одинаково статистически достоверны, но одно истинно, а другое ложно, модели действительно все равно, какое из них будет выведено для пользователя, поскольку оба достигают цели разумной имитации человеческого языка.

Следовательно, даже если может показаться, что модель активно ищет правильный ответ, когда вы с ней общаетесь, на самом деле она извлекает решение из своих собственных основных знаний на основе предоставленной входной последовательности; она не ищет истину, она ищет наиболее статистически правдоподобное продолжение заданной последовательности.

Но есть ли способ сделать модели более точными?

В поисках истины

Если мы предположим, что рассуждение - это форма поиска в пространстве возможных решений до тех пор, пока не будет найдено правильное (то, что кажется общепринятой точкой зрения независимо от того, могут ли эффективно рассуждать), то сочетание LLM с поиском во время выполнения расширяет возможности рассуждения LLM и, таким образом, уменьшает неточности.

Однако в этом режиме модель по-прежнему не ищет истину, поскольку цель остается той же: имитация человеческой письменной речи. Тем не менее, возможно, есть способ неявно повысить достоверность. Это исследователи уже некоторое время изучают двумя способами: минимизацией энтропии и (в последнее время) точной настройкой во время тестирования.

∙ При минимизации энтропии модель имеет индуктивный уклон в сторону более низких энтропийных реакций. Другими словами, она генерирует множественные ответы и в качестве способа различения принимает гипотезу о том, что ответ с наименьшим возможным количеством предположений, то есть самый простой, является лучшим ответом, что некоторые из вас сочтут похожим на бритву Оккама.

Например, предположим, что у нас есть модель, которая должна решить, является ли животное собакой или нет. 1) Ответом с низкой энтропией будет: "Это собака, потому что она лает". 2) Ответом с высокой энтропией будет: "Это собака, потому что она лает с интенсивностью 80 дБ и под углом 87 градусов относительно меня".

Перейти на страницу:

Похожие книги

Аччелерандо
Аччелерандо

Сингулярность. Эпоха постгуманизма. Искусственный интеллект превысил возможности человеческого разума. Люди фактически обрели бессмертие, но одновременно биотехнологический прогресс поставил их на грань вымирания. Наноботы копируют себя и развиваются по собственной воле, а контакт с внеземной жизнью неизбежен. Само понятие личности теперь получает совершенно новое значение. В таком мире пытаются выжить разные поколения одного семейного клана. Его основатель когда-то натолкнулся на странный сигнал из далекого космоса и тем самым перевернул всю историю Земли. Его потомки пытаются остановить уничтожение человеческой цивилизации. Ведь что-то разрушает планеты Солнечной системы. Сущность, которая находится за пределами нашего разума и не видит смысла в существовании биологической жизни, какую бы форму та ни приняла.

Чарлз Стросс

Научная Фантастика
Дневники Киллербота
Дневники Киллербота

Три премии HugoЧетыре премии LocusДве премии NebulaПремия AlexПремия BooktubeSSFПремия StabbyПремия Hugo за лучшую сериюВ далёком корпоративном будущем каждая космическая экспедиция обязана получить от Компании снаряжение и специальных охранных мыслящих андроидов.После того, как один из них «хакнул» свой модуль управления, он получил свободу и стал называть себя «Киллерботом». Люди его не интересуют и все, что он действительно хочет – это смотреть в одиночестве скачанную медиатеку с 35 000 часов кинофильмов и сериалов.Однако, разные форс-мажорные ситуации, связанные с глупостью людей, коварством корпоратов и хитрыми планами искусственных интеллектов заставляют Киллербота выяснять, что происходит и решать эти опасные проблемы. И еще – Киллербот как-то со всем связан, а память об этом у него стерта. Но истина где-то рядом. Полное издание «Дневников Киллербота» – весь сериал в одном томе!Поздравляем! Вы – Киллербот!Весь цикл «Дневники Киллербота», все шесть романов и повестей, которые сделали Марту Уэллс звездой современной научной фантастики!Неосвоенные колонии на дальних планетах, космические орбитальные станции, власть всемогущих корпораций, происки полицейских, искусственные интеллекты в компьютерных сетях, функциональные андроиды и в центре – простые люди, которым всегда нужна помощь Киллербота.«Я теперь все ее остальные книги буду искать. Прекрасный автор, высшая лига… Рекомендую». – Сергей Лукьяненко«Ироничные наблюдения Киллербота за человеческим поведением столь же забавны, как и всегда. Еще один выигрышный выпуск сериала». – Publishers Weekly«Категорически оправдывает все ожидания. Остроумная, интеллектуальная, очень приятная космоопера». – Aurealis«Милая, веселая, остросюжетная и просто убийственная книга». – Кэмерон Херли«Умная, изобретательная, брутальная при необходимости и никогда не сентиментальная». – Кейт Эллиот

Марта Уэллс , Наталия В. Рокачевская

Фантастика / Космическая фантастика / Научная Фантастика