ПРОГРАММА РАСЧЕТА МАТРИЦ СВЯЗЕЙ
Mathcad 2000 RUS.rar - это старая версия Mathcad. Она бесплатная и ее достаточно для этих целей.
Пояснения
В архивных разделах содержится один исполняемый файл MC012.exe - программа расчета матриц связей для определенного значения параметра epsd, который указан в названии архива. Этот исполняемый файл скомпилирован для данного значения параметра epsd.
Остальные параметры можно менять, редактируя соответствующие входные файлы в этом разделе. . Программа считывает списки имен и параметры из файлов, находящихся в том же разделе, что и сама программа. Эти файлы можно заменить на свои или отредактировать и таким образом посчитать матрицу связей для своего списка при своих параметрах.
В данном примере обсчитывается список №123 Россия.
Краткое описание этого списка и значение временных промежутков связывающих и определяющих окрестностей имен списка для различных значений параметров K и NP, даются в файле 123-Russia.txt. Временные значения окрестностей при определенных параметрах K и NP посчитаны из предположения о равномерном распределении имен и поэтому носят ориентировочный характер.
Файл носит информационный характер и программой не используется.
Для программы входные списки должны иметь названия MC-SPSK-1.txt обрабатываемый, «рабочий» список и MC-SPSK-2.txt «связывающий» список, который должен включать в себя «рабочий». В данном случае это один и тот же список. Он взят из файла 123-NSPSK-1-w.txt путем переименования файла. Список имеет следующую строго определенную структуру.
Далее на вход программы подаются файлы параметров.
Файл mc-param.txt, где можно задать значение параметров K и NP , задающих размеры определяющей и связывающей окрестносей.
Файл mc-vvod.txt содержит неизменяемые для данного исполняемого файла параметры.
Так же для одного из вариантов расчета матрицы связей потребуется файл mc-vesa.txt
Этот файл содержит значения весов операций преобразования слов. А так же в нем описаны правила, которым эти значения должны удовлетворять.
Сформировав входные файлы запускаем исполняемый файл MC012.exe
В открывшемся диалоговом окне показывается, какие списки были прочитаны из файлов
MC-SPSK-1.txt и MC-SPSK-2.txt
Также предлагается выбрать вариант упрощения имен. Правила упрощения описаны в файле упрощение букв.txt В варианте «0» буквы не изменяются, но приводятся к маленькому регистру. В варианте «1» заменяет согласные и гласные на их представителей. В варианте «2» гласные и «й» удаляются, а согласные заменяются на их представителей.
После ввода выбранного варианта, в диалоговом окне будет предложено выбрать вариант расчета обобщенного редакторского расстояния Дамерау-Левенштейна между двумя именами. Вариант «1» это метод Лоуренса-Вагнера – Фишера с перестановкой только соседних символов и веса всех операций равны 1. Или вариант «2» это модифицированный алгоритм Вагнера - Фишера с расширенным набором редакторских операций и назначаемыми ценами за операцию. Цены берутся из файла mc-vesa.txt
Введя выбранный вариант следуем инструкциям в диалоговом окне, а именно.
После завершения работы программы GIST.F и формирования промежуточного файла MCD.TXT необходимо определить пороги, отделяющие существенные связи от не существенных. Для этого.
Запустите скаченный MathCad.
Окройте в нем файл 3Gstview.mcd
В нем отображен двумерный график частот связей и его одномерные сечения при фиксированных значениях числа общих имен в паре окрестностей. По эти графикам необходимо, ориентируясь на теорию изложенную в книге, определить искомые пороги. Их надо записать в файл mc-porog.txt, заменив стоящие там числа. После чего можно ввести в диалоговом окне число «1» «enter» и продолжить выполнение программы.
Результат работы программы представляет собой группу файлов, имена которых автоматически формируются по следующему шаблону.
[метка][№ рабочего списка]_[№ связывающего списка ]_[способ расчета связей]_[K]-[NP]-[тип упращения имен]-[№ варианта весов]-[epsd]_[первые шесть порогов, записанные без пробелов].bmp
Метки означают следующие типы файлов:
# - не временная матрица связей имен рабочего списка. По осям отложен рабочий список
@ - временная матрица. Та же матрица, но равномерная по времени.
$ - описание исходных данных
$gist_m_y – сохраненный промежуточный файл gist_m_y.txt по которому инструкция Srednee_po_diag.mcd строит график среднего по диагоналям матрицы связей
$mcd - сохраненный промежуточный файл mcd.txt по которому инструкция 3Gstview.mcd строит график частот связей для определения порогов. (пороги в имени файла естественно не указываются).
Результат работы иструкций 3Gstview.mcd и Srednee_po_diag.mcd полезно сохранить как графические файлы. Например, как MCD(123-123-L2-03-07-02-70-06).bmp и diagonal(123_123-L2-03-07-02-70-06_70,70,60.60,40,40).bmp соответственно.
Файлы temp-...txt создаются по мере выполнения фортран проекта MC012 и служат для контроля корректности выполнения этапов проекта.
В списке программ присутствуют архивы exe-SEPARATE_MC_SPSK. zip и exe-MIN_MATR.zip
Эти программы используются для проверки на не случайность матриц связи.
В проекте SEPARATE_MC_SPSK находится exe файл для разделения входного рабочего списка имен NSPSK-1-W.TXT на четный список nspsk-1-w-even.TXT, содержащий его четные строки и нечетный список nspsk-1-w-odd.TXT из нечетных строк соответственно.
И в четный и в нечетный списки пишутся и первое и последнее имена
Это необходимо Для того, чтобы в, посчитанных по этим спискам матрицах совпадала временная сетка. Поскольку четный и нечетный списки не пересекаются, то построенные по ним матрицы будут независимы.
Что бы корректно сравнивать матрицы построенные по таким прореженным спискам с матрицей по полному списку надо вдвое уменьшить значение K и NP
Для удобства выделения, устойчивой к входным данным, части матрицы используем exe-MIN_MATR.zip
На вход программы MIN_MATR подаются bmp изображения матриц связности, рассчитанных в проекте MC012 по четным и не четным спискам. Входные матрицы вручную переименовываются в '1.bmp' и '2.bmp' Результатом работы программы является матрица '@min.bmp', которая вручную переименовывается, как '@min[№списка]_[пороги нечетной матрицы(001)]-[пороги четной матрицы(002)].bmp'
Для подбора порогов в середине работы программы потребуется МАТКАД (достаточно старой версии, находящейся в свободном обращении - одна из таких версий прилагается). Все подробности описаны в книге "Матрицы связей".
Пользователю нужно:
прочитать книгу;
установить Mathcad;
разархивировать файлы.