The Echo Nest началась как попытка с помощью данных и машинных алгоритмов, имеющих функцию самообучения, понять безграничный мир музыки путем слияния двух его основных качеств: как это звучит и как мы об этом рассказываем. За несколько лет до этого Уитмен записывал «умную танцевальную музыку» (как он шутит, «единственный жанр, который не стесняется сам себя похвалить уже в названии») под псевдонимом Blitter. Как многие музыканты, он обнаружил, что успешно заниматься этим «на должном уровне» трудно. В переводе с фанатского никто эту музыку не слушал. Он вспоминает, что аудитория «была, но найти ее оказалось сложно». Как отыскать этих фанатов и как с ними связаться? Поступив в аспирантуру, он начал работать в области числовой обработки естественных языков и вновь задумался о своей первоначальной проблеме. «Все эти люди пишут о музыке в Интернете, и должен найтись способ автоматически выяснить, что они говорят!»
То, как мы разговариваем о музыке, оказывается, довольно предсказуемо. «Мы видим, что люди говорят о контексте в связи со всем остальным, что они знают. И это именно тот текст, который вы хотите читать», – говорит Уитмен. По его утверждению, музыковедческие подробности относительно неважны: знание о ключе или тональности песни не может помочь слушателям выбрать следующую песню. Вы хотите знать, где появилась группа, кто на них повлиял.
Еще один основатель The Echo Nest, Тристан Йохан, трудился на ниве «Извлечения музыкальной информации» – это обширная дисциплина, которая ставит целью конвертацию музыки в данные для лучшего понимания музыки. Попытка оценить эмоциональную значимость песен выводит машины из строя. Вот, например, песня «Церемония» группы New Order: пульсирующий мажор, но слегка мрачная – это грустная или веселая песня? Компьютер с трудом отличает клавесин от гитары. «В конце концов, и те и другие звуки – результат колебания струн. Разница только в технике игры», – говорит стильный француз Йохан – его длинные жидковатые волосы делают его похожим скорее на того, кто исполняет, а не анализирует музыку.
Компьютеры также не очень хорошо справляются – по крайней мере с точки зрения звука – с пониманием человеческой жанровой системы классификации. В пространном проекте, названном «Весь шум сразу», Макдональд использовал семантическую систему The Echo Nest для создания карты всего объема музыкальных жанров, имеющихся в мире: от «румынской попсы» до «финского хип-хопа» и «польского регги». Что любопытно, для идентификации жанров он совсем не полагался на то, как они звучат (там, где компьютер испытывает затруднения, люди узнают жанр быстрее, чем произносится само слово «жанр»).
Жанрам, перефразируя музыкального критика Саймона Фриса, столь же присущи отличия социальные, как и музыкальные. Для человеческого уха польский регги существует; Макдональд описывает его как регги-стиль «с примесью польки и польского фолка». Слова на польском языке. Для компьютера, однако, отличия малопонятны. Группы, играющие регги, существуют от Болгарии и до Омахи, и в аспекте звукового сигнала они звучат похоже. «Но «польский регги» – это отдельное явление, и все группы от Болгарии до Омахи не являются его частью, как бы они ни звучали», – говорит Макдональд. Компьютеры The Echo Nest могут кое-что сказать нам о музыке: мы утверждаем, что нам нравится, как это звучит, но зачастую на самом деле нам нравится то, что вся эта музыка значит. И кое-что еще: если мы знаем, как это назвать, это поможет музыке нам понравиться.
Лэймер привел в пример Майли Сайрус – несколько лет назад ее творчеством увлеклась его пятнадцатилетняя дочь. В плане звучания Сайрус можно поместить в один ряд с «немногими инди – исполнителями собственных песен». И на бумаге все они выглядят одинаково. Но вряд ли вам захочется послушать на музыкальном сервисе какого-нибудь другого инди-рокера после того, как вы поставите Майли Сайрус. «Будет слишком сильное рассогласование культурной нагрузки», – сказал Лэймер.
То, о чем он говорит слегка корявым языком программиста, – возможно, сложнейшая задача из всех, какие приходится решать самообучающимся машинным алгоритмам: речь идет об оценке человеческого вкуса. Именно люди считают, что Майли Сайрус не стоит прослушивать вместе с другими похоже звучащими артистами. Это люди решают, в каком жанре работает артист и что именно является жанром; и эти жанры постоянно меняются.