Меню сайта

Сутність методів багатомірної класифікації

Метод середнього зв'язку ґрунтується на використанні середньої відстані між кандидатом на включення у кластер і представниками наявного кластера.

Згідно методу Уорда приєднання об'єктів до кластерів здійснюється у випадку мінімального приросту внутрішньогрупової суми квадратів відхилень. Завдяки цьому утворюються кластери приблизно одного розміру, які мають форму гіперсфер.

Оптимальною прийнято вважати кількість кластерів, яка визначається як різниця кількості спостережень і кількості кроків, після якої відстань об'єднання збільшується стрибкоподібно.

Кластерний аналіз, як і інші методи вивчення стохастичного зв'язку, вимагає численних складних розрахунків, які краще здійснювати за допомогою сучасних інформаційних систем, зокрема з використанням програмного продукту Statistica 6.0.

Загальну схему проведення кластерного аналізу можна подати у вигляді наступного алгоритму, який складається з наступних кроків [28]:

Етап 1. Перш ніж використовувати будь-який з методів кластерного аналізу, необхідно виконати наступні попередні процедури:

Процедура 1. Стандартизація і нормування даних призначені для того, щоб привести всі показники до однієї величини (зробити їх порівнянними). Дана процедура здійснюється по наступній формулі:

,(2.11)

де xij - i-а реалізація j-ї ознаки,

- середнє арифметичне j-ї ознаки,

- стандартне відхилення j-ї ознаки.

Процедура 2. Знаходження матриці відстаней. Матриця відстаней D являє собою матрицю розмірністю nxn, кожен елемент якої характеризує віддаленість того або іншого об'єкта від іншого. Ця матриця виглядає наступним чином:

(2.12)

де dsu - відстань між об'єктами s і u, .

Існує досить велика кількість варіантів розрахунку даної відстані основні з яких представлені в табл. 2.1.

Таблиця 2.1 - Характеристика близькості об'єктів

Найменування показника

Формула

Характеристика

Кількісні шкали (відстані)

Лінійна відстань

Найкраще виділяються «плоскі» кластери, розташовані на гіперплощинах

Евклідова відстань

Геометрично найкраще поєднує об'єкти в кулястих скупченнях

Відстань Махаланобіса

Використовується, коли після нормування зберігається велика різниця в дисперсіях, яку необхідно нівелювати

Номінальні шкали (міри подібності)

Коефіцієнт Хеммінга

Для порівняння об'єктів у змішаних шкалах найменувань і порядку

Коефіцієнт Роджерса-Танімото

Якщо важлива тільки наявність властивості, а не її відсутність

Довільні шкали

Мера близькості Журавльова

Фактично здійснюється перехід від кількісних шкал до якісних

Мера близькості Вороніна

Підвищує змістовну обґрунтованість розрахунків

Перейти на сторінку: 1 2 3 4

Читайте більше

Облік фінансових результатів підприємства та оцінка інвестиційної привабливості підприємств агропромислового комплексу (на матеріалах Агрофірми Маяк)
облік фінансовий оздоровлення Функціонування України як незалежної самостійної держави стало початком бурхливих змін у соціально-економічному житті країни. У цих умовах перебудову господарської діяльності підприємств спрямовано на оволодіння механізмом ринкових відносин і поставлено н ...

Сутність поняття «фінансова стійкість підприємства», її види та завдання аналізу
Фінансова стійкість підприємства є однією з головних умов життєдіяльності, розвитку й забезпечення високого рівня конкурентоспроможності підприємства. Саме фінансова стійкість підприємства характеризує ефективність операційного, фінансового та інвестиційного розвитку, містить необхідну інформаці ...