А.Т.Фоменко
НОВАЯ ЭМПИРИКО-СТАТИСТИЧЕСКАЯ МЕТОДИКА УПОРЯДОЧЕНИЯ ТЕКСТОВ И ПРИЛОЖЕНИЯ К ЗАДАЧАМ ДАТИРОВКИ

Докл. АН СССР. - 1983., Т. 268, N 6.
УДК519.281 КИБЕРНЕТИКА И ТЕОРИЯ РЕГУЛИРОВАНИЯ

(Представлено академиком Е.П. Велиховым 15 II 1982}

1. В статье излагается одна из новых методик датирования, разработанных на основе статистических принципов, сформулированных и первоначально проверенных автором в [1-3] и доложенных на 3-й Международной Вильнюсской конференции по теории вероятностей и математической статистике [1]. Цель методики --нахо:кдение хронологически правильного порядка отдельных фрагментов исторических текстов и обнаружение среди них дубликатов (повторов). Назовем фрагмент текста, описывающий события одного поколения, - главой-поколением (главой). Пусть текст Х охватывает достаточно большой интервал времени (А. В), он разбит на главы Х(Т), где Т -- номер поколения, описанного в Х(Т) в той нумерации глав, которая фиксирована в X. Вопрос: правильно ли (с хронологической точки зрения) упорядочены главы или же, если нумерация утрачена, как ее восстановить, как правильно расположить во времени главы X(T)?

2. Если интервал (А, В) велик (десятки, сотни лет), то, как было проверено автором для большого набора конкретных текстов, в подавляющем большинстве случаев персонажи имеют в тексте разные полные имена. Хронист заинтересован в различении разных персонажей, чтобы избежать путаницы. Простейший способ добиться этого -- дать разным лицам разные полные имена (это и подтверждается проверкой).

Сформулируем принцип затухания частот: при хронологически правильной нумерации глав-поколений автор текста X, переходя от описания одного поколения к следующему, сменяет и персонажей, а именно: при описании поколений, предшествующих поколению с номером Т0, он ничего не говорит о персонажах этого поколения (так как они еще не родились); затем при описании поколения Т0 автор именно здесь больше всего говорит о персонажах этого поколения, поскольку с ними связаны описываемые им события: наконец, переходя к описанию последующих поколений, автор все реже упоминает о прежних персонажах, так как описывает новые события, персонажи которых вытесняют умерших.

Так как имя = персонаж (см. выше), то будем изучать резервуар всех полных имен (термин полное будем опускать).

Рассмотрим группу имен, впервые появившихся в Х в главе с номером Т0. Количество всех упоминаний (с кратностями) всех этих имен в этой главе обозначим К(Т0, Т0). Подсчитаем затем, сколько раз эти же имена упомянуты в главе Х(Т); получим число К(Т0, Т). Если имя повторяется несколько раз, все эти упоминания подсчитываются. Для каждого Т0 получаем график К(Т0, Т). Принцип затухания частот (переформулировка) : при хронологически правильной нумерации глав и отсутствии дубликатов каждый график имеет следующий вид: слева от Т0 функция равна нулю, в точке Т0 -- абсолютный максимум, справа от Т0 -- монотонное убывание (рис. 1). Экспериментальная проверка полностью подтвердила (в среднем) этот принцип для нескольких десятков текстов с заранее известным правильным порядком глав [7].

3. Опишем метод нахождения правильного порядка глав в тексте (или наборе текстов) X. Занумеруем все главы текста Х в каком-нибудь порядке и для каждой главы Х(Т0) подсчитаем функцию К(Т0, Т). Эти числа организуются в квадратную матрицу К{Т} размера n*n, где n - число глав. В идеальном случае матрица К{Т} имеет вид, показанный на рис. 1а: на главной диагонали - абсолютный максимум, затем числа монотонно убывают. Как показал эксперимент, при правильном упорядочении глав числа К(Т0, Т) монотонно убывают (в среднем) не только по строке, но и по столбцу (рис. 1б).

Оказалось, что частота употребления в X(Т0) имен (персонажей) более раннего происхождения падает по мере удаления поколения Т, породившего эти имена, от поколения Т0. Увеличение древности персонажа почти всегда уменьшает частоту упоминаний о нем в X(Т0). Для оценки скорости затухания частот можно пользоваться графиком

получающимся усреднением матрицы К{Т} по диагоналям, параллельным главной. Экспериментальные графики К(Т0, Т) могут не совпасть с теоретическим.

При изменении нумерации глав меняется матрица К{Т} и ее элементы, поскольку возникает довольно сложное перераспределение впервые появившихся имен. Меняя порядок глав с помощью перестановок s вычисляя каждый раз новую матрицу К{sТ}, где sТ - новая нумерация, соответствующая s, будем искать такой порядок s, при котором все или почти все графики будут иметь вид, показанный на рис. 1. В частности, график Кср(Т) должен быть максимально близок к идеальному. Тот порядок глав, при котором отклонение экспериментальной матрицы от теоретической будет наименьшим, и следует признать хронологически правильным и искомым.

Эта методика позволяет датировать события. Пусть дан текст Y, о котором известно только, что он описывает события из эпохи (А, В), уже описанной в тексте X, разбитом на главы. Как узнать, какое именно поколение описано в Y? Присоединим Y к совокупности глав текста X, считая Y новой главой и приписав ей какой-то номер То, находим оптимальный, хронологически правильный порядок всех глав. При этом мы найдем правильное место и для новой главы Y. То положение, которое Y займет среди других глав, и следует признать за искомое. Тем самым мы датируем события, описанные в Y.

Методика проверена на текстах с заранее известной датировкой и полностью подтвердилась [7].

4. Изложим методику обнаружения дубликатов и принцип дублирования частот. Пусть эпоха (А, В) описана в тексте X, разбитом на главы, в целом занумерованные хронологически верно. Пусть среди них есть два дубликата, т.е. две главы, говорящие об одном и том же поколении, дублирующие, повторяющие друг друга. Рассмотрим простейшую ситуацию, когда одна и та же глава встречается в Х два раза: в виде Х(Т0) и в виде Х(С0), Т00. Ясно, что К(Т0 ) и К(С0 ) имеют вид, показанный на рис. 2. Первый график явно не удовлетворяет принципу затухания частот, поэтому нужно переставить главы, чтобы добиться лучшего согласия с рис. 1. Ясно, что К(С0, Т) = 0, так как в X(С0) нет ни одного нового имени. Наилучшее совпадение с графиком на рис. 1 получится тогда, когда мы поместим эти два дубликата рядом или просто отождествим их.

Итак, если среди глав, в целом занумерованных правильно, обнаружились две главы, графики которых имеют приблизительно вид, показанный на рис. 2, то они, вероятно, являются дубликатами и их следует отождествить (принцип дублирования частот). Аналогичная схема верна и для нескольких дубликатов.

В проведенном эксперименте обнаружение таких двойных всплесков проходило так. Пусть аij - элемент матрицы К{Т}, стоящий в i-й строке и j-м столбце. Рассмотрим матрицу {аab}, i<=a, b<=j, и построим для нее график Kijср(T), усредняя числа, стоящие на диагоналях, параллельных главной. Если i-й и j-й столбцы соответствуют дубликатам. X(i) и X(j), то Kijср(T) см. на рис. 2. Отмечая в К{Т} все аiji < j, для которых Kijср(T) имеет такой вид, мы и выделяем возможные дубликаты. При этом требовалось, чтобы график Kpqср(T)для р = i -- е, q =j -- е (где е > 0 мало по сравнению с j- i ) в среднем монотонно убывал.

5. Для многих исторических текстов комментаторами проведена работа по выявлению повторяющихся фрагментов. Под повтором можно понимать не только повторение имен, но и повторное описание какого-то события и т.п. Например, в Old + New Testaments все такие повторы собраны в аппарате параллельных мест, насчитывающем около 20 тысяч стихов: рядом с некоторыми стихами указано, какие другие стихи считаются их повторами. Если текст Х снабжен таким (или похожим) аппаратом, то можно применить методику п. 4, принимая повторяющиеся фрагменты за повторяющиеся имена.

Методика применима также для аппарата взаимных ссылок в любой замкнутой совокупности текстов. Автор применил эти методики к Old + New Testaments. В результате, кроме известных ранее дубликатов (1--2 Samuel, 1-2 Kings) и (1-2
Chronicles), обнаружены новые, ранее неизвестные дубликаты (см. на рис. 3 строку Б, в которой эти дубликаты обозначены одинаковыми буквами). В частности оказалось, что традиционный порядок глав-поколений (и книг) в Old + New Testaments отличается от того порядка, который был обнаружен применением нашей методики. Оказывается, график Кср(Т) монотонно убывает в том и только в том случае, если определенным образом перемешать главы Old Testament и главы New Testament, вдвинуть их навстречу друг другу. При этом в 88% случаев взаимное относительное расположение глав сохраняется внутри перемещаемых блоков. Яркий пример - книга Revelation, занимающая традиционно последнее место. Если бы это ее положение было хронологически корректным, то график К(Т, Т0) имел бы вид, показанный на рис. 4 (штриховая кривая). Однако реальный график (см. рис. 4) резко отклоняется от теоретического и для устранения этого диссонанса следует .поместить Revelation рядом с Isaiah, Jeremiah, Ezekiel, Exodus, Leviticus в новом упорядочении.

6. Эта методика также применена автором к материалу древней и средневековой истории Европы, в результате чего обнаружены дубликаты, показанные на рис.3 одинаковыми символами. Эти результаты согласуются с разложением глобальной хронологической карты (г.х.к.) (см. [3]), полученным автором на основе других методик [2-7]. Строка Е на рис. 3 изображает европейскую историю и хронологию, строка Б - историю, описанную в Old +New Testaments (см. [3]). Наложение эпох, описанных в Б, на эпохи, перечисленные в Е, представлено ниже. События, обозначенные одинаковыми символами, являются целиком или частично дубликатами, или расслаиваются в сумму нескольких дубликатов.

Итак, Е (включая Б) = (МТ) - Дарданов потоп; (К) - Троянское царство семи царей, около 1460-1240 гг. до н.э.; (МТ) - Троянская война, падение Трои, около 1236-1226 гг. до н.э.; (Н) - династии царей Древней Греции; (МТ) - 2-й вариант датировки Троянской войны (по Т.Ливию) за 1-2 поколения до основания Рима, около 850-830 гг. до н.э.. Genesis, 1-3, Adam, Eve, затем высадка троянцев в Италии;

(МТ) - Ромул и Рем, основание Рима, похищение сабинянок, около 760-753 гг. до н.э., Genesis, 4: 1-16, Cain, Abel; (К) - царский Рим cеми царей (по Т. Ливию), около 753-523 гг. н.э., Genesis, 4: 17-26,5: 1-31, Enoch, Irad, Methusael, Lamech, Mahalaieel, Jared: (MT) - изгнание царей из Рима, война с Тарквиниями, основание республиканского Рима, 522-509 гг. до н.э., Genesis. 5: 32, 6, 7, 8, Noah, потоп, возникновение первоначальных законов, расселение людей, Shem, Ham, Japhet; (H/C) - античный республиканский Рим и античная Греция, греко-персидские войны, Пелопоннесская война, пунические войны, Филипп II и падение Византии, империя Александра Македонского, Ганнибал, конец классической Греции, 509-82 гг. до н.э..Genesis, 9, 10, сыны Japhet;

(МТ) - падение республики в Риме, Сулла, Помпей, Цезарь, Октавиан, гражданские войны в Италии, 82-23 гг. до н.э.. Genesis, 11: 1-9, строительство вавилонской башни, рассеяние народов; (К/Р) - Римская империя от 82--27 гг. до н.э. до 217 г. н.э.. Genesis, 11: 10-32, Arphaxad, Salah, Serug, Terah, Haran, Abram;

(MT) - войны и кризис в Италии III в. н.э., война с готами, "солдатские императоры" в Риме, анархия, Ю.Меса, 217-251 гг. н.э.. Genesis, 12, Abram, Sarai, "борьба с фараоном"; (МТ) - восстановление Римской империи при Аврелиане, гражданские войны в Италии, 270-306 гг. н.э., Genesis, 13, Abram, Haran, раздел на два царства: (К/П/С/Р) - Римская империя 306-526 гг. н.э.. Genesis, 14-38, Isaac, Esau, Jacob, Judah, Joseph;

(MT) - готская война в Италии середины VI в. н.э., война с персами, падение Западной империи, Юстиниан, Велизарий, Нарзес, 535--552 гг. н.э., Genesis, 39-50, Exodus (Moses), война с фараоном, Leviticus, законы Юстиниана, Numbers, Deuteronomy: (Н/П/Р) - средневековый папский Рим 553-900 гг. н.э. и каролинги, империя Карла Великого от Пипина Геристальского до Карла Толстого, 681-887 гг. н.э., Joshua, завоевательные войны. Judges, 1-18, история судей; (МТ) - Альберик I, Теодора I и война в Италии, 901-924 гг. н.э. Judges, 19-21, сыны Вениамина и война с ними; (МТ) - Альберик II, Теодора II, 931-954 гг. н.э., Ruth, 1-2 Samuel, 1 Kings, 1-11, 1 Chronicies, 2 Chronicles, 1-9, Saul, Samuel, David, Solomon;
(P/C) - Священная Римская империя германской нации в Италии и Германии, 962-1250 гг. н.э., 1 Kings, 12-22, 2 Kings, 1-23, 2 Chronicles, 10-34, израильское и иудейское царства.

Отметим согласование с результатами методики династических наложений (см. [3]): династия царей Иудеи и династия правителей римско-германской империи 911-1307 гг. н.э. (здесь учитываются Даты их германских коронаций) параллельны друг другу с коэффициентом близости l = 10-12 (см. определение l в [3]);

кроме того, династия царей Израиля и династия, состоящая из дат (и длительностей) римских коронаций правителей римско-германской империи 920-1170 гг.. н.э., параллельны друг другу с l = 10-8, что в обоих случаях указывает на зависимость этих пар в смысле [З]. В этом же блоке (Р/С): Григорий VII Гильдебранд (1053-1073-1085) параллелен IhsouV (греч.) , сдвиг на 1053 г.

Далее в строке Е:(МТ) - война середины XIII в. н.э. в Италии, падение династии Гогенштауфенов, установление Анжуйского дома, Конрад, Манфред, Карл Анжуйский, 1250-1268 гг. н.э., 2 Kings, 24-25, 2 Chronicies, 35-36, война с фараоном, Навуходоносором, падение Иудеи, вавилонское (авиньонское) пленение; (С) -римско-германская империя Габсбургов, 1273-1619 гг., 70-летнее авиньонское пленение пап (1305-1376), возвращение престола из Франции в Италию, создание хронологии: И. Скалигер (1540-1609),. Дионисий Петавиус (petit = малый =Exiguus. лат.) (1593-1652); (Сa) - Ezra, Nehemiah, Esther (в сумме 1305-1378 гг.), вавилонское пленение (70 лет), возвращение.

Вся хронологическая карта г.х.к. (см. [3]) практически полностью восстанавливается по своей части от 900 до 1650 гг. н.э. при помощи сдвигов на 333, 720, 1053, 1778 лет, см. [3] и рис. 3. Например, сдвиг на 1053 года (примерно на 1000) мог возникнуть при позднейшем сравнении двух разных способов счета: а) например, XIII в. н.э. =Х. III = CristoV - III, т.е. 3-й век от XI в. н.э. (рожд. Григория VII):

см. также канонические названия - Треченто (XIV в.), Кватроченто (XV в.). Аналогично, например, 1500 г. = I.500 = IhsouV - 500 = (Иис.) -500, т.е. 500-й год от начала XI в. (рожд. Григория VII). Наконец, второй способ: б) счет лет н.э. Возможно, символы Х и I снабжались первоначально не численным, а смысловым значением (см. выше).

Дополнение к списку особых пар династий (см. [3]): 1) две династии римских пап 140-314 гг. н.э. и 324-532 гг. н.э., l = 8,66*10-8 2) Римская империя 936-1273 гг. н.э. и Римская империя от 82 г. до н.э. до 217 г. н.э., l = 1,3*10-12

Московский государственный университет Поступило им. М.В. Ломоносова 15 II 1982

ЛИТЕРАТУРА

1.Фоменко А.Т. Тез. докл. III Международн. Вильнюсский конф. по теории вероятностей и математической статистике. Вильнюс, 1981, т. 2, с. 211-212.
2.Фоменко А.Т. -Семиотика и информатика. 1980, вып. 15, с. 99-124.
3.Фоменко А.Т. - ДАН, 1981, т. 258,  6, с. 1326-1330.
4.Фоменко А.Т. Проблемы механики управляемого движения. Иерархические системы. Межвуз. cб. научн. тр., Пермь, 1980, с. 161-166.
5.Фоменко А.Т. Вопр. вычислит, и прикл. матем. Сб. научк. тр..Ташкент, 1981, вып. 63, с. 136-150.
6. Fomenko A.T. - Celestial Mcch., 1981, vol. 29, p. 33-40.
7. Фоменко А.Т. Новые экспериментально-статистические методики датирования древних событий и приложения к глобальной хронологии древнего и средневекового мира. Препринт, М., 1981,  Б07201. 1981. 100 с.