1. Введение
Вкратце об истории проблемы
В литературе и истории часто возникает вопрос об атрибуции литературных произведений — действительно ли они принадлежат одному автору. В самом ли деле диалоги Платона написаны одним человеком? Правда ли, что пьесы Шекспира — творения одного гения? Или же они созданы разными людьми? Кто в действительности скрывается под именем «Шекспир»? Особый интерес приобретают подобные проблемы, когда возникает подозрение в плагиате. Задачи такого сорта возникают и при исследовании древних текстов, данные об авторах которых утрачены или сомнительны. Укажем лишь на некоторые подходы к решению таких проблем.
Например, в работе В. Фукса [ф1] изучался вопрос об авторстве некоторых древних текстов на основе статистического анализа различных грамматических структур их языка.
Много исследований посвящено обнаружению количественных закономерностей, позволяющих различать между собой разные литературные жанры — поэзию, драматургию, публицистику и пр. [ф2].
Попытка использования точных математических приемов для решения проблемы плагиата изложена, например, в книге [ф10].
Проблеме обнаружения авторских инвариантов посвящена значительная научная литература. Так например, структура языка различных авторов изучалась с помощью отдельных распорядительных слов, в частности, предлога «в», частицы «не» [ф3], или при помощи длины предложений и слов [ф4]. Однако, как показали эксперименты, использование лингвистических спектров ОТДЕЛЬНЫХ распорядительных слов не позволяет обнаружить устойчивые инварианты. На это указал еще в 1916 году академик A.A. Марков [ф5], отметивший, что при больших объемах выборок результаты такого типа должны «колебаться около среднего числа, подчиняясь общим законам языка», что естественно затрудняет различение авторов.