А.Т.Фоменко, Е.А.Елисеев, Г.В.Носовский

МАТРИЦЫ СВЯЗЕЙ
Анализ хронологии на основе династических списков имен

>

ПРОГРАММА РАСЧЕТА МАТРИЦ СВЯЗЕЙ

 

exe-MIN_MATR.zip

exe-MC012(epsd-06_vesa70).zip

exe-MC012(epsd-08_vesa70).zip

exe-MC012(epsd-10_vesa70).zip

exe-SEPARATE_MC_SPSK

Mathcad 2000 RUS.rar - это старая версия Mathcad. Она бесплатная и ее достаточно для этих целей.

Пояснения

В архивных разделах содержится один исполняемый файл MC012.exe - программа расчета матриц связей для определенного значения параметра epsd, который указан в названии архива. Этот исполняемый файл скомпилирован для данного значения параметра epsd.

Остальные параметры можно менять, редактируя соответствующие входные файлы в этом разделе. . Программа считывает списки имен и параметры из файлов, находящихся в том же разделе, что и сама программа. Эти файлы можно заменить на свои или отредактировать и таким образом посчитать матрицу связей для своего списка при своих параметрах.

В данном примере обсчитывается список №123 Россия.
Краткое описание этого списка и значение временных промежутков связывающих и определяющих окрестностей имен списка для различных значений параметров K и NP, даются в файле 123-Russia.txt. Временные значения окрестностей при определенных параметрах K и NP посчитаны из предположения о равномерном распределении имен и поэтому носят ориентировочный характер.
Файл носит информационный характер и программой не используется.

Для программы входные списки должны иметь названия MC-SPSK-1.txt обрабатываемый, «рабочий» список и MC-SPSK-2.txt «связывающий» список, который должен включать в себя «рабочий». В данном случае это один и тот же список. Он взят из файла 123-NSPSK-1-w.txt путем переименования файла. Список имеет следующую строго определенную структуру.

Далее на вход программы подаются файлы параметров.

Файл mc-param.txt, где можно задать значение параметров K и NP , задающих размеры определяющей и связывающей окрестносей.

Файл mc-vvod.txt содержит неизменяемые для данного исполняемого файла параметры.

Так же для одного из вариантов расчета матрицы связей потребуется файл mc-vesa.txt

Этот файл содержит значения весов операций преобразования слов. А так же в нем описаны правила, которым эти значения должны удовлетворять.

Сформировав входные файлы запускаем исполняемый файл MC012.exe

В открывшемся диалоговом окне показывается, какие списки были прочитаны из файлов

MC-SPSK-1.txt и MC-SPSK-2.txt

Также предлагается выбрать вариант упрощения имен. Правила упрощения описаны в файле упрощение букв.txt В варианте «0» буквы не изменяются, но приводятся к маленькому регистру. В варианте «1» заменяет согласные и гласные на их представителей. В варианте «2» гласные и «й» удаляются, а согласные заменяются на их представителей.

После ввода выбранного варианта, в диалоговом окне будет предложено выбрать вариант расчета обобщенного редакторского расстояния Дамерау-Левенштейна между двумя именами. Вариант «1» это метод Лоуренса-Вагнера – Фишера с перестановкой только соседних символов и веса всех операций равны 1. Или вариант «2» это модифицированный алгоритм Вагнера - Фишера с расширенным набором редакторских операций и назначаемыми ценами за операцию. Цены берутся из файла mc-vesa.txt

Введя выбранный вариант следуем инструкциям в диалоговом окне, а именно.
После завершения работы программы GIST.F и формирования промежуточного файла MCD.TXT необходимо определить пороги, отделяющие существенные связи от не существенных. Для этого.

Запустите скаченный MathCad.

Окройте в нем файл 3Gstview.mcd

В нем отображен двумерный график частот связей и его одномерные сечения при фиксированных значениях числа общих имен в паре окрестностей. По эти графикам необходимо, ориентируясь на теорию изложенную в книге, определить искомые пороги. Их надо записать в файл mc-porog.txt, заменив стоящие там числа. После чего можно ввести в диалоговом окне число «1» «enter» и продолжить выполнение программы.

Результат работы программы представляет собой группу файлов, имена которых автоматически формируются по следующему шаблону.

[метка][№ рабочего списка]_[№ связывающего списка ]_[способ расчета связей]_[K]-[NP]-[тип упращения имен]-[№ варианта весов]-[epsd]_[первые шесть порогов, записанные без пробелов].bmp

Метки означают следующие типы файлов:
# - не временная матрица связей имен рабочего списка. По осям отложен рабочий список
@ - временная матрица. Та же матрица, но равномерная по времени.
$ - описание исходных данных
$gist_m_y – сохраненный промежуточный файл gist_m_y.txt по которому инструкция Srednee_po_diag.mcd строит график среднего по диагоналям матрицы связей
$mcd - сохраненный промежуточный файл mcd.txt по которому инструкция 3Gstview.mcd строит график частот связей для определения порогов. (пороги в имени файла естественно не указываются).

Результат работы иструкций 3Gstview.mcd и Srednee_po_diag.mcd полезно сохранить как графические файлы. Например, как MCD(123-123-L2-03-07-02-70-06).bmp и diagonal(123_123-L2-03-07-02-70-06_70,70,60.60,40,40).bmp соответственно.

Файлы temp-...txt создаются по мере выполнения фортран проекта MC012 и служат для контроля корректности выполнения этапов проекта.

В списке программ присутствуют архивы exe-SEPARATE_MC_SPSK. zip и exe-MIN_MATR.zip

Эти программы используются для проверки на не случайность матриц связи.

В проекте SEPARATE_MC_SPSK находится exe файл для разделения входного рабочего списка имен NSPSK-1-W.TXT на четный список nspsk-1-w-even.TXT, содержащий его четные строки и нечетный список nspsk-1-w-odd.TXT из нечетных строк соответственно.

И в четный и в нечетный списки пишутся и первое и последнее имена
Это необходимо Для того, чтобы в, посчитанных по этим спискам матрицах совпадала временная сетка. Поскольку четный и нечетный списки не пересекаются, то построенные по ним матрицы будут независимы.
Что бы корректно сравнивать матрицы построенные по таким прореженным спискам с матрицей по полному списку надо вдвое уменьшить значение K и NP

Для удобства выделения, устойчивой к входным данным, части матрицы используем exe-MIN_MATR.zip
На вход программы MIN_MATR подаются bmp изображения матриц связности, рассчитанных в проекте MC012 по четным и не четным спискам. Входные матрицы вручную переименовываются в '1.bmp' и '2.bmp' Результатом работы программы является матрица '@min.bmp', которая вручную переименовывается, как '@min[№списка]_[пороги нечетной матрицы(001)]-[пороги четной матрицы(002)].bmp'

Для подбора порогов в середине работы программы потребуется МАТКАД (достаточно старой версии, находящейся в свободном обращении - одна из таких версий прилагается). Все подробности описаны в книге "Матрицы связей".

 

Пользователю нужно:

 

прочитать книгу;

установить Mathcad;

разархивировать файлы.