|
Попробуем оценить распределение исторических событий по хронологической шкале в соответствии с традиционной историей на основании статистических данных свободной интернет энциклопедии Wikipedia
Поскольку наибольший массив данных представлен в английской части вики (на сегодняшний день более 3 000 000 уникальных статей, в то время как в русской части количество статей только приближается к 500 000) мы рассмотрим статистику английской википедии. При таком огромном количестве информации можно предположить, что практически все известные историкам даты и связанные с ними события имеются в базе данных этой энциклопедии.
В нашем распоряжении имеются страницы с информацией об исторических событиях распределенные по годам, кроме того события разбиты по категориям: родившиеся, умершие, законодательство, конфликты, архитектура, искусство и т.д. Например: http://en.wikipedia.org/wiki/1585
Здесь я рассмотрю две категории событий: 1.Исторические личности, родившиеся в таком-то году http://en.wikipedia.org/wiki/Category:1585_births 2. Исторические личности, умершие в таком-то году http://en.wikipedia.org/wiki/Category:1585_deaths Эти категории отличаются наибольшим количеством однородных данных.
Выборка данных была произведена в диапазоне от 1000 г до н.э. - до 2009 г. н.э. со страниц десятилетий (пример http://en.wikipedia.org/wiki/Category:1710s_deaths) 1-3 января 2010 г. Годовые данные заносились в таблицу Exel и суммировались по десятилетиям и столетиям.
Полностью таблицу с данными можно скачать здесь: http://narod.ru/disk/16687903000/HISstat.zip.html
Также рассчитывались такие параметры как
births/deaths - отношение родившихся исторических личностей к умершим, характеризует в основном демографическую ситуацию (назовем предварительно ДК - демографический коэффициент)
births+deaths – сумма родившихся и умерших исторических личностей характеризует имеющийся объем исторической информации (если бы удалось эти данные разложить по регионам, то стала бы возможна независимая проверка расчетов сделанных Анатолием Тимофеевичем, но это потребует длительной кропотливой работы).
На основании таблицы с данными суммированными по десятилетиям построим графики в натуральном масштабе.
Видно, что в один год рождается больше исторических личностей, чем умирает это связано с двумя факторами: 1. Демографическим – пропорционально росту населения растет количество выдающихся личностей. 2. Информационным – развитие СМИ, печатные издания, радио, кинематограф, телевидение, интернет. Благодаря этому появляются новые типы героев: артисты театра и кино, артисты эстрады, ведущие и журналисты.
В результате растет и ДК, особенно это видно в 20 веке, где особенно сильно влияние информационного фактора.
На черном графике (умерших исторических личностей) в 20 веке видны два максимума связанные с первой и второй мировой войной. Тогда герои, погибавшие на полях сражений, попали на страницы истории.
Особенно ярко пики проявляются, если построить диаграмму по годам.
Пупырышек перед второй мировой на черном графике – 37 год.
На зеленом графике на 20-й год приходится резкий рост – это родились призывники, которые героически погибли во время второй мировой войны.
Рост в 30-40-е годы, видимо, связан с развитием телевидения, именно тогда рождались выдающиеся артисты театра и кино. Этот рост имеет отклик на черном графике в 2000-е годы, года артисты начали умирать.
Следующий взлет в 70-80-е годы, видимо, связан с развитием интернета. Люди, родившиеся в эти годы, сидят теперь перед мониторами и пишут на страницах википедии о своих подвигах.
Падение в конце тоже понятно, ведь героями не рождаются, а становятся, у тех, кому сегодня до 18 все еще впереди.
В общем, можно считать, что выбранный для исследования массив данных хорошо описывает глобальные исторические события. Получается, что-то вроде кардиограммы мировой истории.
А теперь, СЮРПРИЗ. Посмотрим, что же происходило в более ранний исторический период.
График в соответствии с описанной выше закономерностью благополучно продолжается до начала 18 века, но дальше начинается что-то непонятное. Линия смерти во второй половине 17 века подскакивает и начинает превышать линию рождений, т.е. демографическая ситуация меняет знак. Далее в начале 17 века на линии рождения появляется небольшой максимум, и количество рождений опять начинает слегка превышать количество смертей. ДК чуть больше единицы. Так продолжается в течение всего 16 века. В конце 15 века линия рождений окончательно уходит под линию смерти и на протяжении всей истории уже почти никогда не доминирует.
Последнее явление можно было бы, наверное, объяснить тем, что дата рождений исторических персонажей не всегда известна историкам, и не указана в энциклопедии, но чтобы это проверить, надо провести некоторую статистическую выборку, и посчитать какой процент героев не имеет даты рождения. Можно заранее высказать предположение, что если всем поставить дату, то количество родившихся и умерших сравняется и демографический коэффициент станет приблизительно равен единице. Поведение графиков в течение 17 века является загадкой. Хотя, расстояние между двумя максимумами равно в среднем продолжительности человеческой жизни, т.е. люди, родившиеся в районе 1610 года не зеленом пике, умерли в районе 1670 года на пике черного графика. Между двумя горбами происходила 30-летняя война, вероятно, так отразились ее персонажи.
Хочу заметить, что графики построены на большом фактическом материале и являются очень устойчивыми. Если построить диаграмму на годовой статистике, то данная конфигурация тоже видна.
Также обратите внимание на пики при юбилейных датах на линии рождения. Особенно ярко видны на протяжении 16 века. Это историки в случае сомнений в дате рождения исторических персонажей привязывают их к круглым датам.
Вообще говоря, ранее начала 18 века на графиках дат рождений и смерти исторических личностей не просматривается влияния демографического фактора. Похоже, что персонажи рождались и действовали не среди народных масс, а сами по себе на пустой безлюдной планете.
График births/deaths Больше единицы – население растет. Меньше единицы – население уменьшается.
Посмотрим на логарифмические графики
Кажется, 20, 19 и 18 века неплохо описываются экспонентой. А дальше начинаются большие проблемы. Таким образом, можно считать, относительно достоверной историю только после начала 18 века.
В общем, база данных интересна для изучения и требует академической обработки. Все желающие могут подключаться. Скачать таблицу можно по ссылке выше.
_________________________ Сервис раздачи картинок для блогов и форумов
|