Для каждой точки t(X,i) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(Y,1), t(Y,2), …, t(Y,M). Пусть это будет не которая точка t(Y,k). Обозначим через p(i) — расстояние между ними, измеренное в годах, то есть — абсолютную величину разности t(X,i) — t(Y,k). Другими словами, выясняем — какой локальный максимум Y ближе всего расположен к выбранному локальному максимуму X.
Совершенно аналогично, меняя ролями X и Y, для каждой точки t(Y,j) найдем БЛИЖАЙШУЮ К НЕЙ ТОЧКУ из последовательности t(X,l), t(X,2), …, t(X,N). Пусть это будет некоторая точка t(X,s). Обозначим через q(j) — расстояние между ними, измеренное в годах, то есть — абсолютную величину разности t(Y,j) — t(X,s).
Наконец, в качестве «расстояния между X и Y» мы возьмем следующую сумму: R(X,Y) = p(1)+ p(2) +… + p(N)+ q(1)+ q(2) +… + q(M).
Смысл расстояния R(X,Y) совершенно прозрачен. Для каждого локального максимума функции vol X(t) мы находим ближайший к нему локальный максимум функции vol Y(t), определяем рас стояние между ними в годах, после чего суммируем получившиеся числа. Затем повторяем ту же операцию, поменяв местами хроники X и Y. Складывая полученные числа, получаем R(X,Y). Ясно, что R(X,Y) = R(Y,X).
Если расстояние R(X,Y) равно нулю для некоторой пары текстов X и Y, следовательно, графики их функций объемов делают всплески ОДНОВРЕМЕННО. Чем больше это расстояние, тем хуже коррелируют их точки локальных максимумов. Можно рассматривать также и несимметричное расстояние от X до Y, положив p(X,Y) = p(1) +p(2) +… + p(N).
Аналогично определяется и несимметричное расстояние от Y до X, а именно, q(Y,X) = q (1)+ q(2) +…+ q(M).
Оценим численно степень зависимости между собой исторических текстов 1-22, перечисленных выше. Для этого подсчитаем квадратную матрицу размера 22x22 попарных расстояний R(X,Y), где X и Y независимо друг от друга пробегают все тексты 1-22. Далее подсчитаем гистограмму частот. Для этого рассмотрим горизонтальную ось, на которой отметим целые точки: 0, 1, 2, 3…. и построим следующий график. Подсчитаем — сколько в получившейся ранее матрице {R(X,Y)} имеется нулей. Полученное число отложим по вертикали в точке с координатой 0. Затем подсчитаем — сколько в матрице {R(X,Y)} имеется единиц. По лучившееся число отложим по вертикали в точке с координатой 1. И так далее. Получается график, который и называется гистограммой частот. Что можно сказать, изучая получившуюся гистограмму?
Если выбранные для анализа хроники ЗАВИСИМЫ, то большинство попарных расстояний между хрониками должно выражаться МАЛЫМИ ЧИСЛАМИ, то есть хроники должны «быть близки». Другими словами, большинство элементов матрицы {R(X,Y)} должно быть близко к нулю, «быть мало». Но в таком случае абсолютный максимум гистограммы частот должен смещаться ВЛЕВО, то есть должно быть особенно много малых час тот. И напротив, если среди исследуемых текстов много НЕЗАВИСИМЫХ, то максимум гистограммы частот смещается направо, рис. 3.14. Здесь увеличивается доля «больших» и «средних» попарных расстояний между хрониками.
Это наблюдение позволяет оценивать степень зависимости или независимости группы хроник путем построения соответствующей гистограммы частот по матрице {R(X,Y)}. А именно, смещение максимума ВЛЕВО указывает на возможную ЗАВИСИМОСТЬ хроник, а смещение максимума НАПРАВО, указывает на возможную НЕЗАВИСИМОСТЬ.
Эта идея применена для оценки степени зависимости перечисленных исторических текстов 1-22. На рис. 3.15 показана экспериментальная гистограмма матрицы {R(X,Y)} для текстов 1-22. В этой матрице оказалось много малых чисел, поэтому максимум гистограммы заметно смещен влево. ЭТО УКАЗЫВАЕТ НА ЗАВИСИМОСТЬ ИСТОРИЧЕСКИХ ТЕКСТОВ 1-22.
Для сравнения построим гистограмму для независимых текстов. В качестве примера мы решили сравнить указанные ниже три хроники А, В, С, с предыдущими текстами 1-22. Три дополнительные хроники таковы:
А: Повесть Временных Лет, якобы 850-1110 годы н. э.,
В: Академическая летопись, якобы 1336–1446 годы н. э.,
С: Никифоровская летопись, якобы 850-1430 годы н. э.
Для каждой из них вычислена функция объемов и найдены все ее локальные максимумы. Подсчитаем все попарные расстояния R(X,Y), где X пробегает три хроники А, В, С, а Y пробегает исторические тексты 1-22. В результате получается прямоугольная матрица {R(X,Y)} размера 3x22. Далее подсчитана гистограмма частот. Результат показан на рис. 3.16. Отчетливо виден СОВЕРШЕННО ДРУГОЙ ХАРАКТЕР гистограммы — ее максимум переместился НАПРАВО. Что указывает на НЕЗАВИСИМОСТЬ двух групп текстов: {А, В, С} и {текстов 1-22}. Конечно, внутри каждой из этих групп могут быть зависимые тексты.