Глава 1
Математические методы датирования древних событий
Основной задачей при анализе хронологии является создание
новых независимых статистических методик датирования древних событий.
Только после этого можно приступать к воссозданию всей хронологии в целом
на основе получающихся результатов. Одной методики, - даже такой эффективной,
как описанная астрономическая, - совершенно недостаточно для глубокого
изучения проблемы, поскольку задача датировки исключительно сложна и требует
перекрестных проверок дат разными методами. Развитая в настоящее время
методология современной математической статистики позволяет предложить
новый подход к задаче датирования событий, описанных в древних летописях.
В настоящей главе кратко излагаются новые эмпирико-статистические методики,
разработанные автором и его коллегами, и некоторые их применения к анализу
хронологии.
Эта программа была реализована в следующей форме.
1) Разработаны новые эмпирико-статистические методики датирования древних событий. Они основаны на нескольких статистических принципах (моделях), предложенных А.Т.Фоменко в научных публикациях [884], [885], [886], [888], [889], [890], [891], [895], [896], [897], [898], [899], [900], [901], [902], [903], [904], [905], [1129], [1130], [1131], [1132], [1135]. Подробное изложение дано в книгах [МЕТ1] и [МЕТ2]. Основные принципы и основанные на них модели были сформулированы А.Т.Фоменко в докладе на 3-й Международной Вильнюсской конференции по теории вероятностей и математической статистике в 1981 году [885].
А.Т.Фоменко были предложены:
принцип корреляции максимумов,
принцип малых искажений (для династий правителей),
принцип затухания частот, принцип дублирования частот, принцип "улучшения" географических карт.
Развитие этих методов было затем изложено А.Т.Фоменко в докладах на 4-й Международной Вильнюсской конференции по теории вероятностей и математической статистике [901] в 1985 году, и на Первом всемирном Конгрессе Общества математической статистики и теории вероятностей имени Бернулли [1130] в 1986 году. Затем новые эмпирико-статистические модели были также предложены и экспериментально проверены в серии работ В.В.Калашникова,
Г.В.Носовского, С.Т.Рачева, В.В.Федорова, А.Т.Фоменко [357], [590],
[591], [592], [593], [594], [595], [596], [597], [598], [599], [600],
[601], [602], [603], [604], [605], [606], [607], [608], [609], [610],
[611], [612], [613], [723], [1140], [868].
2) Эти принципы, модели и их эффективность были проверены на достаточно большом достоверном материале средневековой и новой истории XVI-XX веков. Эта проверка подтвердила правильность результатов, получаемых при помощи методик.
3) Затем эти же методики были применены к хронологическому материалу древней истории, обычно датируемому ранее X-XIV веков н.э. См. [884], [886], [887], [888], [891], [895], [897], [898], [900], [903], [905]. Здесь неожиданно были обнаружены странные "повторы", "периодичности" в скалигеровской версии древней и средневековой истории. Мы условно назвали их "фантомными дубликатами".
4) Все эти фантомные дубликаты были собраны и систематизированы в виде глобальной хронологической карты, кратко описанной в статьях автора [886], [888], [894], [896], [905]. Предлагаемые методики отнюдь не рассматриваются нами как универсальные. Все они имеют вполне определенные границы применимости, см. ниже. Единственным критерием правильности полученных результатов может служить обнаруженное нами согласование дат, вычисляемых применением разных методов. В том числе, и методики астрономического датирования, описанной в предыдущей книге.
5) На основе глобальной хронологической карты, изображающей "скалигеровский учебник по древней истории", мне удалось восстановить предположительный механизм возникновения скалигеровской версии древней и средневековой хронологии. Весьма кратко изложим суть некоторых из этих методов.
1. Метод локальных максимумов
1.1. Функция объема исторического текста
Принцип корреляции максимумов и основанный на нем метод относительного датирования исторических хроник был предложен и разработан А.Т.Фоменко в [884], [885], [888], [1129].
Пусть обнаружен какой-то исторический текст X, например ранее неизвестная летопись, описывающая некие неизвестные нам ранее события на довольно значительном интервале времени, от какого-то года A до года B. Причем, годы эти могут быть записаны в неизвестном нам летосчислении. В дальнейшем будем обозначать этот интервал времени через (A,B). Типичная ситуация такова: даты событий, описываемых в летописи, отсчитываются от какого-то события местного значения. Например, от основания какого-то города, или от момента воцарения того или иного правителя и т.п. В таких случаях будем говорить, что датировка событий дана в летописи в ОТНОСИТЕЛЬНОЙ хронологии. Этот термин позволит нам отличать подобные датировки от АБСОЛЮТНЫХ дат событий в терминах годов до н.э. или годов н.э. Возникает естественный вопрос - как восстановить АБСОЛЮТНЫЕ даты событий, описанных в древнем документе? Например, как вычислить юлианскую дату основания города, от которой отсчитываются даты интересующих нас событий?
Конечно, если некоторые из описанных событий уже известны нам по другим, уже датированным летописям, это позволяет "привязать" события к современной шкале отсчета времени. Но если такое отождествление не удается, то задача датировки усложняется. При этом может оказаться, что описываемые в найденной летописи события нам уже фактически известны. Однако их описание пока по внешности неузнаваемо, поскольку летопись написана на другом языке, летописец употребляет совсем другие имена, прозвища, географические названия и т.п. Поэтому полезно располагать методикой эмпирико-статистического характера, которая иногда позволяет датировать события на основании формальных количественных характеристик исследуемого текста.
Предположим, что исторический текст X разбивается на куски, фрагменты X(t), каждый из которых описывает сравнительно малый по длине промежуток времени, например год (или десятилетие) с номером t. Примеры таких текстов многочисленны. Таковы ПОГОДНЫЕ летописи, - то есть описывающие события ГОД ЗА ГОДОМ, "по годам". Таковы дневники, многие исторические произведения, учебники и монографии по истории. Куски, фрагменты X(t) мы будем условно называть "главами". Они естественно выстраиваются в хронологическую последовательность, согласно внутренней относительной хронологии данной летописи. Во многих исторических текстах подобное "разбиение на главы", - каждая из которых описывает свой отдельный год, - присутствует в явном виде. Таковы, например, многие русские летописи [671], [672], в том числе знаменитая Радзивиловская летопись (Повесть Временны'х Лет) [715]. Такова, например, известная римская книга Liber Pontificalis, изд.
Т.Моммзена "Gestorum Pontificum Romanorum" (1898).
Разнообразные характеристики объема информации, сообщаемой летописью X о годе с номером t, могут быть измерены, например, так.
1) vol X(t) = количество страниц в "главе" X(t). Это число назовем ОБЪЕМОМ "главы" X(t). Объем может равняться нулю, если год t вообще не описан в летописи X, то есть пропущен. Вместо количества страниц можно, конечно, подсчитывать число строк, число знаков и т.п. Это не влияет на идею и на применение методики.
2) Количество упоминаний года t во всей летописи X.
3) Количество имен всех исторических персонажей, упомянутых в
"главе" X(t).
4) Количество упоминаний какого-то конкретного имени (персонажа) в "главе" X(t).
5) Количество ссылок в "главе" X(t) на некоторый другой текст.
Запас подобных количественных характеристик достаточно велик и весьма важен. Каждая характеристика, как мы видим, приписывает каждому году t, описанному в летописи, определенное число. Разным годам будут отвечать, вообще говоря, разные числа. Поэтому объемы "глав" X(t) будут, вообще говоря, меняться с изменением номера (года) t. Последовательность объемов X(A),...,X(B) мы назовем ФУНКЦИЕЙ ОБЪЕМА данного погодного текста X.
1.2. Принцип корреляции максимумов
Итак, пусть некоторый исторический период от года А до года B в истории одного государства Г описан в какой-то достаточно обширной погодной летописи Х. То есть, летопись X уже разбита, или может быть разбита, на куски - "главы" Х(t), каждый из которых описывает один свой год t. Подсчитаем объем каждого такого куска, например, число слов или число знаков, страниц и т.п. Затем изобразим полученные числа в виде графика, отложив по горизонтали годы t, а по вертикали - объемы "глав", то есть vol X(t), см. рис.1n_5.1(рис.1). В результате мы изобразили функцию объема данной летописи X в виде графика.
Для другой погодной летописи Y, то есть тоже описывающей "поток событий" этой же эпохи (А,В) по годам, ее соответствующий график функции объема будет иметь, вообще говоря, другой вид, см. рис.1n_5.1(рис.1). Дело в том, что большую роль в распределении объемов играют личные интересы летописцев X и Y. Например, хроника X по истории искусств и военная летопись Y существенно по-разному расставляют акценты и по-разному распределяют объем информации по годам. Вот, например, летописец X "проигравшей стороны" описывает поражение своей армии в войне весьма скупо и сдержанно, лишь в нескольких строчках. Напротив, летописец Y "победившей стороны" рассказывает об этом же сражении очень подробно, восторженно и многословно, на нескольких страницах.
Насколько существенны эти различия? То есть, существуют ли такие характеристики графиков объема, которые определяются только интервалом времени (А,В), историей государства Г и которые однозначно характеризуют все, или почти все летописи, описывающие этот временной интервал и данное государство?
Оказывается, важной характеристикой графика объема vol X(t) являются годы t, в которые график делает ВСПЛЕСК, то есть достигает своих ЛОКАЛЬНЫХ МАКСИМУМОВ. То обстоятельство, что в некоторой точке t график делает всплеск, означает, что этот год описан в летописи БОЛЕЕ ПОДРОБНО. Например, большим количеством страниц, чем соседние годы. Следовательно, всплески графика, то есть его локальные максимумы, указывают нам годы, подробно описанные летописцем на отрезке времени (А,В). B разных летописях X и Y "подробно описанными" могут оказаться, вообще говоря, разные годы.
Чем объясняется такая неравномерность в описании разных годов? Одно из объяснений таково. Летописец более подробно описал данный "древний год", поскольку от этого "древнего года" до него дошло больше уцелевшей информации. Например, больший объем старых документов, чем от соседних лет.
Схема дальнейших наших рассуждений такова.
1) Мы сформулируем ТЕОРЕТИЧЕСКУЮ МОДЕЛЬ, то есть СТАТИСТИЧЕСКУЮ ГИПОТЕЗУ, позволяющую предсказывать - какие именно годы из интервала времени (A,B) будут подробно описаны позднейшим летописцем, уже не являющимся современником описываемых им древних событий.
2) Затем мы математически формализуем эту статистическую модель, гипотезу.
3) Проверим ее справедливость на достаточно большом достоверном историческом материале XVI-XX веков.
4) Обнаружив, что теоретическая модель подтверждается в эксперименте, мы предложим методику датирования древних событий.
Пусть С(t) - объем всех текстов, написанных о годе t современниками этого года, см. рис.1n_5.2(рис.3). Как и выше, построим числовой график объема на интервале времени (A,B). Конечно, точный вид этого графика С(t) сегодня нам НЕИЗВЕСТЕН. Дело в том, что с течением времени первичные тексты, написанные современниками событий года t, постепенно утрачиваются. До наших дней дошла лишь какая-то их часть. График C(t) можно назвать ГРАФИКОМ ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ. Пусть из эпохи (A,B) современники наиболее подробно описали некоторые годы, то есть зафиксировали об этих годах особенно много информации. Причины такой "первичной неравномерности" мы здесь обсуждать не будем, так как они для нас сейчас не важны. На языке графика объема C(t) такие "подробно описанные современниками" годы будут выделяться тем, что именно в эти годы график объема делает всплески.
Спрашивается, каков механизм потери и забывания письменной информации, приводящий с течением времени к уменьшению высоты графика C(t) и к его искажению? Сформулируем МОДЕЛЬ ПОТЕРИ ИНФОРМАЦИИ.
Хотя с течением времени высота графика C(t) уменьшается, тем не менее, ОТ ТЕХ ЛЕТ, В КОТОРЫЕ ИХ СОВРЕМЕННИКАМИ БЫЛО НАПИСАНО ОСОБЕННО МНОГО ТЕКСТОВ, - БОЛЬШЕ И ОСТАНЕТСЯ.
Для переформулировки этой модели полезно поступить следующим образом. Фиксируем какой-то момент времени M справа от точки B на рис.1n_5.2(рис.3) и построим график C_M (t), показывающий объем текстов, которые "дожили" до момента времени M и описывают события года t из исторической эпохи (A,B).
Другими словами, число C_M (t) указывает объем первичных древних текстов от года t, сохранившихся до "момента наблюдения фонда" в год M. График C_M (t) можно условно назвать графиком "остаточного фонда информации", сохранившегося от эпохи (A,B) до года M. Теперь наша модель может быть переформулирована таким образом.
ГРАФИК ОБЪЕМА ОСТАТОЧНОГО ФОНДА C_M (t) ДОЛЖЕН ИМЕТЬ ВСПЛЕСКИ ПРИМЕРНО В ТЕ ЖЕ ГОДЫ НА ИНТЕРВАЛЕ ВРЕМЕНИ (A,B), ЧТО И ИСХОДНЫЙ ГРАФИК ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ C(t).
Разумеется, проверить модель в таком ее виде трудно, поскольку график C(t) первоначального фонда информации сегодня нам точно неизвестен. Но одно из следствий теоретической модели (гипотезы) проверить все-таки можно.
Поскольку более поздние летописцы Х и Y, описывая один и тот же исторический период (А,В) и один и тот же "поток событий", уже не являются современниками этих древних эпох, то они вынуждены опираться на приблизительно один и тот же набор дошедших до них текстов. Следовательно, они должны "в среднем" более подробно описать именно те годы, от которых сохранилось больше текстов, и менее подробно
- годы, о которых сохранилось мало сведений. Другими словами, летописцы должны увеличивать подробность изложения при описании тех лет, от которых до них дошло больше старых текстов.
На языке графиков объема эта модель выглядит так. Если летописец X живет в эпоху M, то он будет опираться на остаточный фонд C_M (t).
Если другой летописец Y живет в эпоху N, отличную, вообще говоря, от эпохи M, то он опирается на сохранившийся фонд информации C_N (t).
См. рис.1n_5.3(рис.3).
Естественно ожидать, что "в среднем" летописцы X и Y работают более или менее добросовестно, а потому они должны подробнее описать те годы из древней (для них) эпохи (A,B), от которых до них дошло больше информации, больше старых текстов.
Другими словами, график объемов vol X(t) будет иметь всплески примерно в те же годы, где делает всплески график C_M (t). В свою очередь, график vol Y(t) будет иметь всплески примерно в те же годы, где делает всплески график C_N (t), см. рис.1n_5.3(рис.3).
Но точки всплесков графика остаточного фонда C_M (t) БЛИЗКИ к точкам всплесков исходного, первичного графика C(t) . Аналогично, и точки всплесков графика остаточного фонда C_N (t) близки к точкам всплесков первичного графика C(t) . Следовательно, графики объемов летописей X и Y, - то есть графики vol X(t) и vol Y(t), - должны делать всплески ПРИМЕРНО ОДНОВРЕМЕННО, "в одних и тех же" точках на оси времени. Другими словами, точки их локальных максимумов должны заметно коррелировать, см. рис.1n_5.1(рис.1).
При этом, конечно, АМПЛИТУДЫ графиков vol X(t) и vol Y(t) могут быть существенно различны, см. рис.1n_5.4(рис.4). Что, очевидно, не влияет на изложенные соображения.
Окончательно ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ формулируется так. Предыдущие рассуждения могут сейчас рассматриваться лишь как наводящие соображения.
ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ:
а) Если две летописи (текста) X и Y ЗАВЕДОМО ЗАВИСИМЫ, - то есть описывают один и тот же "поток событий" исторического периода (A,B) одного и того же государства Г, - то графики объемов летописей X и Y ДОЛЖНЫ ОДНОВРЕМЕННО ДОСТИГАТЬ ЛОКАЛЬНЫХ МАКСИМУМОВ (ДЕЛАТЬ ВСПЛЕСКИ) на отрезке (А,В). Другими словами, годы, "подробно описанные в летописи Х", и годы, "подробно описанные в летописи Y", должны быть близки или совпадать, см. рис.1n_5.4(рис.4).
б) Напротив, если летописи Х и Y ЗАВЕДОМО НЕЗАВИСИМЫ, то есть описывают либо разные исторические периоды (А,В) и (C,D), либо разные "потоки событий" в разных государствах, то графики объемов для летописей Х и Y достигают локальных максимумов В РАЗНЫХ ТОЧКАХ. Другими словами, точки всплесков графиков vol X(t) и vol Y(t) не должны коррелировать, см. рис.1n_5.5(рис.5). При этом считается, конечно, что для сравнения двух графиков мы должны предварительно совместить отрезки (А,В) и (C,D) одинаковой длины.
Все другие пары текстов, - то есть не являющиеся ни заведомо зависимыми, ни заведомо независимыми, - мы условно назовем НЕЙТРАЛЬНЫМИ. Относительно них никакого утверждения не делается.
Этот принцип подтвердится, если для большинства пар реальных, достаточно больших ЗАВИСИМЫХ летописей Х и Y, то есть описывающих одни и тот же "поток событий", графики объема для Х и Y действительно делают всплески приблизительно одновременно, в одни и те же годы. При этом ВЕЛИЧИНА ЭТИХ ВСПЛЕСКОВ МОЖЕТ БЫТЬ СУЩЕСТВЕННО РАЗЛИЧНОЙ.
Напротив, для реальных НЕЗАВИСИМЫХ хроник какая-либо корреляция точек всплесков должна отсутствовать. Конечно, для конкретных зависимых хроник одновременность всплесков графиков объема может иметь место лишь приблизительно.
1.3. Статистическая модель
Грубая идея состоит в следующем. Для количественной оценки близости точек всплесков поступим так. Вычислим число f(Х,Y) - сумму квадратов чисел f[k], где f[к] - расстояние в годах от точки всплеска с номером "k" графика объема Х до точки всплеска с номером "k" графика объема Y. Если оба графика делают всплески одновременно, то моменты всплесков с одинаковыми номерами совпадают, и все числа f[k] равны нулю. Рассмотрев достаточно большой фиксированный запас различных реальных текстов Н и вычисляя для каждого из них число f(Х,Н), отберем затем только такие тексты Н, для которых это число не превосходит числа f(Х,Y). Подсчитав долю таких текстов во всем запасе текстов Н, получаем коэффициент, который, - при гипотезе о распределении случайного вектора Н, - можно интерпретировать как вероятность р(Х,Y) [904], [908], [1137], [884]. Если коэффициент р(X,Y) мал, то летописи Х и Y зависимы, то есть описывают приблизительно один и тот же "поток событий". Если же коэффициент велик, то летописи X и Y независимы, то есть сообщают о разных "потоках событий".
Перейдем теперь к более детальному описанию статистической модели. Конечно, для реальных графиков объема одновременность их всплесков может иметь место лишь приблизительно. Для оценки того, насколько одновременно оба графика делают всплески, математический аппарат статистики позволяет определить некоторое число p(X,Y), измеряющее несовпадение лет, подробно описанных в летописи X, и лет, подробно описанных в летописи Y. Оказывается, если рассматривать наблюдаемую близость всплесков обоих графиков как случайное событие, то число p(X,Y) можно рассматривать как вероятность этого события (что, впрочем, вовсе не обязательно для эффективности метода). Чем меньше это число, тем лучше совпадают годы, подробно описанные в X, с годами, подробно описанными в Y. Дадим математическое определение коэффициента p(X,Y).
Рассмотрим интервал времени (A,B) и график объема vol X(t), который достигает локальных максимумов в некоторых точках m_1,...,m_n-1. Мы считаем для простоты, что каждый локальный максимум (всплеск) достигается ровно в одной точке. Эти точки, то есть годы, m_i разбивают интервал (A,B) на некоторые отрезки, вообще говоря, разной длины, см. рис.1n_5.6(рис.6). Измеряя длины получившихся отрезков в годах, то есть измеряя расстояния между точками соседних локальных максимумов m_i и m_i+1, мы получаем последовательность целых чисел a(X)=(x_1,...,x_n). То есть, число x_1 - это расстояние от точки A до первого локального максимума. Число x_2 - это расстояние от первого локального максимума до второго. И так далее. Число x_n - это расстояние от последнего локального максимума m_n-1 до точки B.
Эту последовательность можно изобразить вектором a(X) в евклидовом пространстве R^n размерности n. Например, в случае двух локальных максимумов, то есть если n=3, мы получаем целочисленный вектор a(X)=(x_1,x_2,x_3) в трехмерном пространстве. Назовем вектор a(X)=(x_1,...,x_n) ВЕКТОРОМ ЛОКАЛЬНЫХ МАКСИМУМОВ летописи X.
Для другой летописи Y мы получим, вообще говоря, другой вектор a(Y)=(y_1,...,y_m). Будем считать, что летопись Y описывает события на интервале времени (C,D), длина которого равна длине интервала (A,B), то есть B-A=D-C. Чтобы сравнить графики объемов летописей X и Y, мы предварительно совместим друг с другом два отрезка времени (A,B) и (C,D) одинаковой длины, наложим их друг на друга. Конечно, число локальных максимумов у графиков vol X(t) и vol Y(t) может быть различно. Однако без ограничения общности можно считать, что число максимумов одинаково, а потому векторы a(X) и a(Y) двух сравниваемых летописей X и Y имеют одинаковое число координат. В самом деле, если число максимумов у двух сравниваемых графиков различно, то можно поступить так. Будем считать некоторые максимумы КРАТНЫМИ, то есть считать, что в этой точке слились вместе несколько локальных максимумов. При этом, длины соответствующих отрезков, отвечающих этим кратным максимумам, можно считать равными нулю. Пользуясь этим соглашением, можно очевидно уравнять число локальных максимумов у графиков объемов летописей X и Y. Конечно, такая операция, - введение кратных максимумов, - неоднозначна. Фиксируем пока какой-либо вариант введения кратных максимумов. В дальнейшем мы избавимся от указанной неоднозначности, минимизировав нужные нам коэффициенты близости по всем возможным способам введения кратных максимумов. Отметим, что введение кратных максимумов означает, что у вектора a(X) на некоторых местах появляются нулевые компоненты, то есть отрезки нулевой длины.
Итак, сравнивая летописи X и Y, можно считать, что оба вектора a(X)=(x_1,...,x_n) и a(Y)=(y_1,...,y_n) имеют одно и то же число координат и поэтому лежат в одном и том же евклидовом пространстве R^n. Отметим, что у каждого из этих векторов сумма его координат - одна и та же и равна B-A=D-C, то есть длине интервала времени (A,B). Итак:
x_1 + ... + x_n = y_1 + ... + y_n = B-A.
Рассмотрим теперь множество всех целочисленных векторов c=(c_1,...,c_n), у которых все координаты неотрицательны и их сумма c_1+...+c_n равна одному и тому же числу, а именно B-A, то есть длине временно'го интервала (A,B). Обозначим множество всех таких векторов через S. Геометрически эти векторы можно изобразить так. Будем считать, что все они выходят из начала координат, то есть из точки O в R^n. Рассмотрим концы всех таких векторов c=(c_1,...,c_n). Все они лежат на "многомерном симплексе" L, определяемом в пространстве R^n одним уравнением
c_1 + ... + c_n = B-A,
где все координаты c_1,...,c_n являются вещественными неотрицательными числами. Множество S геометрически изображается как множество "целых точек" на симплексе L, то есть множество всех точек из L, имеющих целочисленные координаты.
Ясно, что концы векторов локальных максимумов a(X) и a(Y) для летописей X и Y принадлежат множеству S, см. рис.1n_5.7(рис.7).
Фиксируем теперь вектор a(X)=(x_1,...,x_n) и рассмотрим все векторы c=(c_1,...,c_n) с вещественными координатами, принадлежащие симплексу L и такие, что они удовлетворяют еще одному дополнительному соотношению:
(с_1 - x_1)^2 + ... + (c_n - x_n)^2 < |
- |
(y_1 - x_1)^2 + ... + (y_n - x_n)^2. |
Множество всех таких векторов c=(c_1,...,c_n) мы обозначим через K.
Математически эти векторы описываются как удаленные от фиксированного вектора a(X) на расстояние, не превышающее расстояния r(X,Y) от вектора a(X) до вектора a(Y). Говоря здесь о расстоянии между векторами, мы имеем в виду расстояние между их концами. Напомним, что величина
(y_1 - x_1)^2 + ... + (y_n - x_n)^2
равна квадрату расстояния r(X,Y) между векторами a(X) и a(Y). Поэтому множество K - это часть симплекса L, попавшая в "n-мерный" шар радиуса r(X,Y) с центром в точке a(X).
Подсчитаем теперь, сколько "целочисленных векторов" содержится в множестве K и сколько - в множестве L. Полученные числа обозначим через m(K) и m(L) соответственно. В качестве "предварительного коэффициента" p'(X,Y) мы возьмем отношение этих двух чисел, то есть
p'(X,Y)=m(K)/m(L),
то есть количество "целых точек" в множестве K | |
p'(X,Y)= | ----------------------------------------------------------------------- |
количество "целых точек" в множестве L |
Так как множество K составляет лишь часть множества L, то число p'(X,Y) заключено на отрезке [0,1].
Если векторы a(X) и a(Y) совпадают, то p'(X,Y)=0. Если векторы, напротив, далеки друг от друга, то число p'(X,Y) близко к единице и даже может оказаться равным единице.
Отметим здесь полезную, хотя и необязательную для дальнейшего, интерпретацию числа p'(X,Y). Предположим, что вектор c=(c_1,...,c_n) случайным образом пробегает все векторы из множества S, причем он с одинаковой вероятностью может оказаться в любой точке этого множества. В таком случае говорят, что случайный вектор c=(c_1,...,c_n) распределен РАВНОМЕРНО на множестве S, то есть на множестве "целых точек" (n-1)-мерного симплекса L. Тогда определенное нами число p'(X,Y) допускает вероятностную интерпретацию. Оно просто равно вероятности случайного события, заключающегося в том, что случайный вектор c=(c_1,...,c_n) оказался на расстоянии от фиксированного вектора a(X), не превышающем расстояния между векторами a(X) и a(Y). Чем меньше эта вероятность, тем менее случайна наблюдаемая нами близость векторов a(X) и a(Y). Другими словами, в этом случае их близость указывает на наличие какой-то ЗАВИСИМОСТИ между ними. И эта зависимость тем больше, чем меньше число p'(X,Y).
Равномерность распределения случайного вектора c=(c_1,...,c_n) на симплексе L, - точнее, на множестве S его "целых точек", - может быть обоснована тем, что этот вектор изображает расстояния между соседними локальными максимумами функции объема "глав" исторических летописей или каких-то аналогичных текстов, описывающих заданный период времени (A,B). При рассмотрении всевозможных летописей, говорящих об истории всевозможных государств во всевозможные исторические эпохи, естественно предполагать, что локальный максимум может "с равной вероятностью" появиться в произвольной точке временно'го интервала (A,B).
Описанное построение было выполнено в предположении, что мы фиксировали некоторый вариант введения кратных максимумов у графиков объема летописей. Таких вариантов, конечно, много. Рассмотрим все такие варианты и для каждого из них подсчитаем свое число p'(X,Y), после чего возьмем наименьшее из всех получившихся чисел. Обозначим его через p''(X,Y). То есть, мы минимизируем коэффициент p'(X,Y) по всем возможным способам введения локальных максимумов у графиков vol X(t) и vol Y(t).
Наконец, вспомним, что при подсчете коэффициента p''(X,Y) летописи X и Y оказались в неравноправном положении. Дело в том, что выше мы рассматривали "n-мерный шар" радиуса r(X,Y) с центром в точке a(X). Чтобы устранить возникшее неравноправие между летописями X и Y, просто поменяем их местами и повторим описанную выше конструкцию, взяв теперь за центр "n-мерного шара" точку a(Y). В результате получится некоторое число, которое мы обозначим через p''(Y,X). В качестве "симметричного коэффициента" p(X,Y) мы возьмем среднее арифметическое чисел p''(X,Y) и p''(Y,X), то есть
p''(X,Y) + p''(Y,X) | |
p(X,Y)= | ----------------------------- |
2 |
Для наглядности поясним смысл предварительного коэффициента p'(X,Y) на примере графиков объема с всего лишь двумя локальными максимумами. В этом случае оба вектора
a(X) = (x_1, x_2, x_3) и a(Y) = (y_1, y_2, y_3)
являются векторами в трехмерном евклидовом пространстве. Концы этих векторов лежат на двумерном равностороннем треугольнике L, отсекающем от координатных осей в пространстве R^3 одно и то же число B-A.
См. рис.1n_5.8(рис.8). Если расстояние от точки a(X) до точки a(Y) обозначить через |a(X)-a(Y)|, то множество K - это пересечение треугольника L с трехмерным шаром, центр которого находится в точке a(X), а радиус равен |a(X)-a(Y)|. После этого нужно подсчитать количество "целых точек", то есть точек с целочисленными координатами, в множестве K и в треугольнике L. Взяв отношение получившихся чисел, мы и получим коэффициент p'(X,Y).
При конкретных вычислениях удобно пользоваться приближенным способом вычисления коэффициента p(X,Y). Дело в том, что подсчет числа целых точек в множестве K довольно затруднителен. Но оказывается эту трудность можно обойти, перейдя от "дискретной модели" к "непрерывной модели". Хорошо известно, что если (n-1)-мерное множество K в (n-1)-мерном симплексе L достаточно велико, то число целых точек в K примерно равно (n-1)-мерному объему множества K. Поэтому с самого начала в качестве предварительного коэффициента p'(X,Y) можно брать просто отношение (n-1)-мерного объема K к (n-1)-мерному объему L, то есть
(n-1)-мерный объем K | |
p'(X,Y)= | ----------------------------- |
(n-1)-мерный объем L |
Например, в случае двух локальных максимумов в качестве коэффициента p'(X,Y) следует взять отношение:
площадь множества K |
----------------------------- |
площадь треугольника L |
Конечно, при малых значениях B-A, "дискретный коэффициент" и "непрерывный коэффициент" различны. Но в наших исследованиях мы будем иметь дело с временны'ми интервалами B-A в несколько десятков и даже сотен лет, так что для интересующих нас целей можно, не делая большой ошибки, уверенно пользоваться "непрерывной моделью" p'(X,Y). Точные математические формулы для подсчета "непрерывного коэффициента" p'(X,Y), для его оценки сверху и снизу, приведены в работе [884], с.107.
Укажем еще одно уточнение описанной статистической модели. При работе с конкретными графиками объема исторических текстов следует "сглаживать" эти графики, чтобы устранить мелкие случайные всплески. Мы проводили такое сглаживание графика, "усредняя по соседям", то есть заменяя значение функции объема в каждой точке t на среднее арифметическое трех значений функции, а именно, в точках t-1, t, t+1. В качестве "окончательного коэффициента" p(X,Y) следует взять его значение, подсчитанное для таких "сглаженных графиков".
Сформулированный выше принцип корреляции максимумов подтвердится, если для большинства пар заведомо зависимых текстов X и Y коэффициент p(X,Y) окажется "малым", а для большинства пар заведомо независимых текстов, напротив, - "большим".
1.4. Экспериментальная проверка принципа корреляции максимумов. Примеры зависимых и независимых исторических текстов
В 1978-1985 годах автором был проведен первый обширный вычислительный эксперимент по подсчету чисел р(Х,Y) для нескольких десятков пар конкретных исторических текстов - хроник, летописей и т.п. Детали см. в [904], [908], [1137], [884].
Оказалось, что коэффициент р(Х,Y) достаточно хорошо различает ЗАВЕДОМО ЗАВИСИМЫЕ и ЗАВЕДОМО НЕЗАВИСИМЫЕ пары исторических текстов. Было обнаружено, что для всех исследованных нами пар реальных летописей Х,Y, описывающих ЗАВЕДОМО РАЗНЫЕ события (разные исторические эпохи или разные государства), - то есть для НЕЗАВИСИМЫХ текстов, - число р(Х,Y) колеблется от 1 до 1/100 при количестве локальных максимумов от 10 до 15. Напротив, если исторические летописи Х и Y ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают одни и те же события, то число р(Х,Y) не превосходит 10^-8 для того же количества максимумов.
Таким образом, между значениями коэффициента для зависимых и независимых текстов обнаруживается разрыв на несколько порядков. Подчеркнем, что здесь важны не абсолютные величины получающихся коэффициентов, а тот факт, что "зона коэффициентов для заведомо зависимых текстов" отделена НЕСКОЛЬКИМИ ПОРЯДКАМИ от "зоны коэффициентов для заведомо независимых текстов". Приведем типичные примеры. Точные значения функций объемов для особо интересных летописей приведены в книге А.Т.Фоменко "Методы".
ПРИМЕР 1.
На рис.1n_5.9(рис.9), рис.1n_5.10(рис.10) и рис.1n_5.11(рис.11) показаны графики объемов двух заведомо зависимых исторических текстов.
А именно, в качестве текста Х мы взяли историческую монографию современного автора В.С.Сергеева "Очерки по истории древнего Рима", тома 1-2, М., 1938, ОГИЗ.
В качестве текста Y мы взяли "античный" источник, а именно, "Римскую историю" Тита Ливия, тома 1-6, М., 1897-1899.
Согласно скалигеровской хронологии, эти тексты описывают события на интервале якобы 757-287 годы до н.э. Итак, здесь A = 757 год до н.э., B = 287 год до н.э. Оба текста описывают одну и ту же историческую эпоху, примерно одни и те же события. Наглядно видно, что графики объемов делают свои ОСНОВНЫЕ всплески практически одновременно. Для количественного сравнения функций следует предварительно сгладить "мелкую зыбь", то есть вторичные всплески, накладывающиеся на основные, первичные колебания графиков. При вычислении коэффициента p(X,Y) мы сгладили, усреднили эти графики, чтобы выделить лишь их ОСНОВНЫЕ локальные максимумы, в количестве не превышающем пятнадцати. Оказалось, что здесь р(Х,Y) = 2x10^-12. Малая величина коэффициента указывает на ЗАВИСИМОСТЬ сравниваемых текстов. В данном случае это неудивительно. Как мы уже отмечали, оба текста описывают один и тот же период в истории "античного" Рима. Малое значение коэффициента p(X,Y) показывает, что если рассматривать наблюдаемую близость точек всплесков обоих графиков как случайное событие, то его вероятность чрезвычайно мала. Как мы видим, современный автор В.С.Сергеев достаточно аккуратно воспроизвел в своей книге "античный" оригинал. Конечно, он дополнил его своими соображениями и комментариями, но, как выясняется, они не влияют на характер зависимости этих текстов.
Теперь в качестве "летописи" Х' возьмем снова книгу В.С.Сергеева, а в качестве "летописи" Y' - ее же, но заменив порядок лет в тексте на противоположный. То есть, грубо говоря, прочитав книгу Сергеева "задом наперед". Оказывается, в этом случае р(Х',Y') будет равняться 1/3. Таким образом, получается значение, существенно более близкое к единице, чем предыдущее, и указывающее на независимость сравниваемых текстов. Что и неудивительно, так как проведенная нами операция "перевертывания летописи" очевидно дает два заведомо независимых текста.
ПРИМЕР 2.
Возьмем следующие заведомо зависимые исторические тексты, две русские летописи:
Х - Никифоровская летопись [672],
Y - Супрасльская летопись [672].
Следующий интервал времени описан в обеих летописях: якобы, 850-1256 годы н.э.
Графики их объемов приведены на рис.1n_5.12(рис.12). Оба графика объемов "глав" на интервале якобы 850-1255 годы н.э. имеют 31 всплеск и делают эти всплески практически одновременно, в одни и те же годы. Подсчет дает, что здесь р(Х,Y) = 10^-24. Это значение весьма мало', что подтверждает зависимость этих текстов. В [ХРОН1], Приложение 5.1, мы приводим точные численные значения функций объемов этих летописей.
ПРИМЕР 3. Рассмотрим следующие две русские летописи:
X - Холмогорская летопись [672],
Y - Повесть Временны'х Лет.
Следующий интервал времени описан в обеих летописях: якобы, 850-1000 годы н.э. Графики объемов летописей также достигают локальных максимумов ПРАКТИЧЕСКИ ОДНОВРЕМЕННО. И снова это не случайно, а закономерно, иначе реализовался бы единственный шанс из 10^15 шансов. Здесь p(X,Y)=10^-15. На указанном временно'м интервале эти две летописи зависимы. На рис.1n_5.13(рис.13) представлены сразу три графика объемов: для Супрасльской летописи, для Никифоровской летописи и для Повести Временны'х Лет. Последняя летопись "богаче", поэтому ее график имеет больше локальных максимумов и зависимость не столь очевидна. Тем не менее, после сглаживания выясняется, что между этими тремя графиками также имеется ярко выраженная зависимость. Подробнее о сравнении "богатых" и "бедных" летописей рассказано в книге А.Т.Фоменко "Методы". Распределение объемов указанных летописей приведено в ХРОН1, Приложение 5.1.
ПРИМЕР 4.
Приведем пример из средневековой римской истории.
X - фундаментальная монография немецкого историка Фердинанда Грегоровиуса "История города Рима в средние века", тома 1-5 [196]. Эта книга написана в XIX веке на основе огромного числа средневековых светских и церковных документов.
Y - Liber Pontificalis (T.Mommsen, Gestorum Pontificum Romanorum,
1898). Эта "Книга Понтифексов", то есть список и жизнеописания римских пап средних веков, была восстановлена немецким историком XIX века Теодором Моммзеном на основе средневековых римских текстов. Здесь, оказывается, p(X,Y)=10^-10, что указывает на яркую зависимость этих двух текстов. В предположении случайности такой близости, реализовался бы один шанс из 10 миллиардов.
И так далее. Во всех нескольких десятках обработанных нами примеров исторических текстов, - как ЗАВЕДОМО ЗАВИСИМЫХ, так и ЗАВЕДОМО НЕЗАВИСИМЫХ, - наша теоретическая модель подтвердилась. Таким образом, удалось обнаружить закономерности, позволяющие статистически характеризовать ЗАВИСИМЫЕ исторические тексты, то есть описывающие один и тот же период времени, одни и те же "потоки событий" в истории одного и того же региона, государства. В то же время, как показали эксперименты, если два исторических текста X и Y, напротив, НЕЗАВИСИМЫ, то есть описывают заведомо разные исторические эпохи, или разные регионы, или существенно разные "потоки событий", то графики объемов vol X(t) и vol Y(t) делают всплески в существенно разные годы. То есть, никакой корреляции не наблюдается. В этом последнем случае типичное значение для коэффициента p(X,Y), при количестве локальных максимумов от 10 до 15, колеблется от 1 до 1/100. Приведем типичный пример.
ПРИМЕР 5.
Вновь обратимся к "античной" истории Рима. В качестве сравниваемых текстов X и Y мы взяли следующие два фрагмента из книги В.С.Сергеева "Очерки по истории Древнего Рима" [767]. Первый фрагмент описывает период якобы 520-380 годы до н.э., а второй фрагмент - якобы 380-240 годы до н.э. Считается, что эти периоды независимы. Подсчет коэффициента p(X,Y) дает, что здесь он равен 1/5. Это значение разительно, на несколько порядков, отличается от типичных значений 10^-12 - 10^-6 для заведомо зависимых текстов, с аналогичным количеством локальных максимумов. Таким образом, эти два текста, "две половины" книги В.С.Сергеева оказываются действительно НЕЗАВИСИМЫМИ.
Выше мы использовали такую числовую характеристику "главы", как ее объем. Однако, как показали наши исследования, аналогичные статистические закономерности, для достаточно больших исторических текстов, обнаруживаются и при использовании других числовых характеристик. Например, можно рассматривать количество имен в каждой "главе", количество ссылок на другие летописи и т.п.
В нашем вычислительном эксперименте сравнивались:
а) древние тексты с древними,
б) древние с современными,
в) современные с современными.
Как мы уже сказали, наряду с графиками объемов "глав" исследовались и другие количественные характеристики текстов. Например, графики числа упомянутых имен, графики числа упоминаний данного года в тексте, графики частот ссылок на какой-либо другой фиксированный текст, и т.п. [904], [908], [1137], [884].
Оказалось, что для всех этих характеристик выполняется тот же ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ. А именно, графики зависимых текстов делают всплески практически одновременно, а для независимых текстов точки всплесков графиков никак не коррелируют.
Сформулируем еще одно следствие из нашей основной модели, статистической гипотезы.
А именно, если два исторических текста ЗАВЕДОМО ЗАВИСИМЫ, то есть описывают один и тот же "поток событий" на одном и том же интервале времени в истории одного и того же государства, то для любой пары указанных выше числовых характеристик соответствующие им графики делают всплески приблизительно в одни и те же годы. Другими словами, если какой-то год в обеих летописях описан подробнее, чем соседние годы, то увеличится (локально) число упоминаний этого года в обеих летописях, увеличится количество имен персонажей, упомянутых в этом году в обеих летописях и т.п. Напротив, если тексты ЗАВЕДОМО НЕЗАВИСИМЫ, то никакой корреляции между указанными числовыми характеристиками быть не должно.
Проверка этого "вторичного принципа корреляции максимумов" подтвердила его справедливость на конкретных заведомо зависимых исторических текстах [884], с.110-111.
1.5. Методика датирования исторических событий
Поскольку наша теоретическая модель подтвердилась на экспериментальном материале, мы можем теперь предложить новую методику датирования древних событий. Хотя она, конечно, не универсальна. Опишем идею метода.
Пусть Y - исторический текст, описывающий неизвестный нам "поток событий" с утраченными абсолютными датировками. Пусть годы t отсчитываются в тексте от какого-то события местного значения, например, от основания какого-то города или от момента воцарения какого-то царя, абсолютные датировки которых нам неизвестны. Подсчитаем для текста Y его график объема "глав" и сравним его с графиками объема других текстов, для которых абсолютная датировка событий, описанных в них, нам известна. Если среди этих текстов обнаружится текст Х, для которого число р(Х,Y) мало', - то есть имеет такой же порядок, как и для пар зависимых текстов (не превосходит, например, числа 10^-8 для соответствующего количества локальных максимумов), - то можно с достаточно большой вероятностью сделать вывод о совпадении или близости описываемых в этих текстах "потоков событий". Причем, эта вероятность тем больше, чем меньше число р(Х,Y).
При этом оба сравниваемых текста могут быть внешне совершенно несхожи. Например, они могут быть двумя вариантами одной и той же летописи, но написанными в разных странах, разными летописцами, на разных языках.
Эта методика датирования была экспериментально проверена на средневековых текстах с заранее известной датировкой. Полученные даты совпали с этими датировками. Приведем типичные примеры.
ПРИМЕР 6.
В качестве текста Y мы взяли русскую летопись, так называемую краткую редакцию Двинского летописца, описывающую события на 320-летнем интервале [672]. Попробуем датировать описанные в летописи события, используя указанную методику. Перебирая все летописи, опубликованные в "Полном собрании русских летописей", мы вскоре обнаруживаем текст Х, график объема vol X(t) которого делает всплески практически в те же годы, что и график vol Y(t) летописи Y, см. рис.1n_5.14(рис.14).
При сравнении графиков мы, конечно, предварительно совмещаем временны'е интервалы (А,В) и (C,D), накладываем их друг на друга. Подсчет дает, что здесь р(Х,Y) = 2x10^-25. Следовательно, весьма вероятно, что эти две летописи описывают приблизительно одни и те же "потоки событий". Таким образом, нам удалось чисто формально, на основе сравнения лишь статистических характеристик текстов, датировать события, описанные в тексте Y. Оказывается, что летопись Х - это пространная редакция Двинского летописца [672]. Считается, что эта летопись описывает "поток событий" 1390-1707 годов н.э. В результате, полученная нами датировка текста Y совпала с его стандартной датировкой, что подтверждает эффективность нашего метода.
ПРИМЕР 7.
Возьмем в качестве "текста Y с неизвестной датировкой" русскую Академическую летопись [672]. Следуя приему, описанному выше, вскоре обнаруживаем текст X, а именно, часть Супрасльской летописи [672], описывающей, как считается, 1336-1374 годы н.э. Оказывается, график объема vol X(t) делает всплески практически в те же годы, что и график объема vol Y(t), см. рис.1n_5.15(рис.15).
Подсчет дает, что здесь p(X,Y)=10^-14. Такое малое значение коэффициента ясно указывает на зависимость этих двух текстов. Поскольку летопись X датирована, то мы датируем и летопись Y. Полученная нами датировка текста Y совпала с его датировкой, известной ранее.
Мы обработали несколько десятков аналогичных текстов эпохи XVI-XIX веков, и во всех случаях полученная нами датировка "неизвестного текста Y" совпала с его обычной датировкой.
Конечно, в последних перечисленных примерах мы ничего нового не узнали, поскольку датировка, например, краткой редакции Двинского летописца была и без того заранее известна, и особых поводов сомневаться в ее правильности у нас нет. Ведь это уже XIV-XVIII века, то есть эпоха более или менее надежной хронологии. Однако вскоре мы увидим, что наш метод даст интересные результаты для летописей, традиционно относимых к более ранним эпохам, то есть ранее XIV века н.э.
Принцип корреляции максимумов мы изложили выше огрубленно, не вникая в статистические детали, потому что преследовали одну цель - быть быстро понятыми читателями. В то же время строгое математическое изложение метода и его уточнений требует существенно больших подробностей. Мы отсылаем читателя, желающего глубже вникнуть в описанный метод, к научным публикациям [884], [892].
Коэффициент p(X,Y) можно условно назвать ВССЛ - вероятностью случайного совпадения лет, подробно описанных в летописях X и Y.
Дальнейшее развитие и уточнение идеи было дано в работах В.В.Федорова, А.Т.Фоменко [868] и В.В.Калашникова, С.Т.Рачева,
А.Т.Фоменко [357]. Выяснилось далее, что наиболее ярко принцип корреляции максимумов проявляется при сравнении исторических текстов примерно одинакового объема, имеющих примерно одинаковую "плотность описания". Кроме того, обнаружилось, что в некоторых случаях для заведомо зависимых текстов коррелируют не только точки локальных максимумов, но даже и сами функции объема, то есть их амплитуды! Это - достаточно удивительный и важный факт. Особо ярко корреляция амплитуд функций объема наблюдается при сравнении "достаточно бедных" текстов, то есть летописей, содержащих большие лакуны - значительные интервалы времени, не отраженные в хронике. Оказалось, что процесс написания хронистами "достаточно бедных" летописей подчиняется интересному принципу "уважения к информации", или принципу "сохранения раритетов". Эта закономерность была обнаружена С.Т.Рачевым и А.Т.Фоменко [723], [1140]. Предварительные исследования в этом направлении и саму формулировку принципа уважения к информации см. в работах [723], [1140], и в [ХРОН2],гл.5:1, в разделе, написанном С.Т.Рачевым и А.Т.Фоменко.
Принцип корреляции максимумов был также успешно применен к анализу некоторых русских летописей периода "смуты" конца XVI - начала XVII веков н.э. См. на эту тему работы Л.Е.Морозовой и А.Т.Фоменко [902], [548]. В этом исследовании большое участие принимал также Н.С.Келлин. Полученные результаты изложены в [ХРОН2],гл.5:2.