Главное меню
Главная О сайте Добавить материалы на сайт Поиск по сайту Карта книг Карта сайта
Новые книги
Зельин К.К. "Формы зависимости в восточном средиземноморье эллинистического периода" (Всемирная история)

Значко-Яворский И.Л. "Очерки истории вяжущих веществ " (Всемирная история)

Юрченко А.Г. "Книга Марко Поло: записки путешественника или имперская космография" (Всемирная история)

Смоули Р. "Гностики, катары, масоны, или Запретная вера" (Всемирная история)

Окуджава Б. "Арбат. Исторический путеводитель" (Всемирная история)
Реклама
 
Библиотека истории
 
history-library.com -> Добавить материалы на сайт -> Другое -> Миронов Б.Н. -> "История в цифрах" -> 71

История в цифрах - Миронов Б.Н.

Миронов Б.Н. История в цифрах — Л.: Наука , 1991. — 165 c.
Скачать (прямая ссылка): istoriyavcifrah1991.djvu
Предыдущая << 1 .. 65 66 67 68 69 70 < 71 > 72 73 74 75 76 77 .. 97 >> Следующая


Остановимся на некоторых особенностях, свойственных всем методам кластерного анализа. При классификации с помощью кластерного анализа признаки, на основе которых производится группировка объектов, вынужденно принимаются историками равнозначными, в то время как в действительности они имеют разное значение для объектов. Например, мы допускаем, что численность рабочих играет ту же роль в определении его экономического облика, что и численность земледельцев, количество десятин земли, принадлежащих городу, или городские доходы и т. д.

Из-за допущения равнозначности всех признаков, участвующих в классификации, их отбор должен быть строгим. Нужно минимизировать их число исходя из трех посылок: признаки должны быть по возможности равнозначными, характеризировать самые существенные свойства объекта, а сами эти свойства должны находиться в «родственных» отношениях друг с другом, отражать какую-либо одну сторону или аспект объекта. Так, представляется

117
невозможным провести удовлетворительную классификацию городов по признакам, которые отражают и экономическое, и культурное, и административное их значение, так как «вес» каждой группы признаков не поддается точной количественной оценке. Сколько-нибудь удовлетворительный результат можно получить, классифицируя объекты либо по их экономическому, либо по их культурному, либо по их административному значению. Особенность кластерного анализа заключается также в том, что он не может ранжировать ни объекты, ни группы объектов по выраженности, развитости всех признаков. Другими словами, указывая на группы сходных объектов, метод не позволяет сказать, насколько эти группы различаются количественно.

Важно иметь в виду, что кластерный анализ успешно работает лишь в том случае, если объекты естественно, в самой действительности «расслаиваются» на четко выраженные группы — кластеры, что бывает тогда, когда в каждой группе объекты близки, похожи друг на друга, а сами эти группы находятся на «приличном» друг от друга расстоянии. Подобная ситуация встречается сравнительно редко, соответственно не всегда и задача разделения объектов на кластеры поддается решению. При отсутствии существенной дифференциации между объектами все они образуют единый кластер.

Рассмотрим результаты кластерного анализа городов Европейской России середины XIX в. (рис. 7). Для удобства анализа приведенный фрагмент будем рассматривать как самостоятельную дендрограмму, отражающую кластеризацию 30 городов.

При расшифровке дендрограммы нужно смотреть на дерево (график расстояний) и на расстояния, которые обозначены десятичными числами. Например, первое число на дендрограмме, равное 0.014, показывает, что между Костромой и Волховом расстояние (с учетом всех 13 признаков) составляет

0.014. Чтобы исследователю сразу стало ясно — большое это расстояние или маленькое, оно выражено по отношению к максимальному расстоянию между двумя городами, которое принимается за единицу. Следовательно, расстояния на дендрограмме — величины относительные; поэтому 0.014 — это четырнадцать тысячных максимального расстояния в данной совокупности объектов.

Дендрограмма имеет вид пирамиды, сужающейся ступенями к вершине. Каждая ступень по «периметру» (АЛ, БМ, ВН и т. д.), как правило, соответствует кластеру; узлы дерева (А, Б, В, ... К) указывают на окончание кластера; число, стоящее у каждого узла дерева (см. сверху вниз: 0.027, 0.036, . . . 0.907), показывает среднее расстояние между городами, принадлежащими одному кластеру, и городами, входящими во все, прежде образованные, кластеры (в дальнейшем будем называть это расстояние межкластерным). Например, число 0.027 у узла И показывает среднее расстояние между городами II кластера и городами I кластера; число 0.036 у узла 3 — среднее расстояние между городами III кластера и городами I и II кластеров; число 0.907 у узла А — среднее расстояние между Петербургом и всеми остальными городами.

На нашей дендрограмме, если смотреть сверху вниз, видны кластеры Кострома—Тверь, Звенигород—Тамбов, Астрахань—Калуга, Воронеж—Самара. Далее каждый город образует отдельный кластер. Это видно из того, что города-кластеры находятся напротив узлов дендрограммы. Правильность формирования кластеров проверяется следующим образом. Нужно сравнить межкластерное и внутрикласгерное расстояния. При правильном объединении городов в кластеры межкластерное расстояние должно превышать самое большое расстояние между объектами внутри кластеров. В приводимом нами примере это правило нарушается (рис. 8).

Расстояние между кластером В и всеми предыдущими кластерами составило

0.052, а внутри кластера В расстояние между Нижним Новгородом и Тулой равнялось 0.061, т. е. оказалось больше межкластерного расстояния; межкластерное расстояние между кластером С и всеми прежде образованными кластерами

118
(0.063) уступало расстоянию между городами внутри кластера С (0.098

0.125).

Внутри кластеров нередко имеются мини-кластеры. Каждый мини-класте| образует города, находящиеся в порядке строгого возрастания или убывания расстояний между ними. Точка, где плавное увеличение или уменьшение\ расстояний прерывается, является границей между мини-кластерами; находя-
Предыдущая << 1 .. 65 66 67 68 69 70 < 71 > 72 73 74 75 76 77 .. 97 >> Следующая
 

Авторские права © 2013 HistoryLibrary. Все права защищены.
 
Книги
Археология Биографии Военная история Всемирная история Древний мир Другое Историческая география История Абхазии История Азии История Англии История Белоруссии История Великобритании История Великой Отечественной История Венгрии История Германии История Голландии История Греции История Грузии История Дании История Египта История Индии История Ирана История Ислама История Испании История Италии История Кавказа История Казахстана История Канады История Киргизии История Китая История Кореи История Малайзии История Монголии История Норвегии История России История США История Северной Америки История Таджикистана История Таиланда История Туркистана История Туркмении История Украины История Франции История Югославии История Японии История кавказа История промышленности Кинематограф Новейшее время Новое время Социальная история Средние века Театр Этнография Этнология