Меню сайта

Сутність методів багатомірної класифікації

1 - значення l-ї ознаки у i-го об’єкта, l=; i,j=;

- вектор-стовпець значень всіх ознак на i-му об’єкті;

W-1 - матриця, обернена до коваріаційної;

- загальна кількість значень властивостей, що співпадають, (нулевих та одиничних, де 1 - наявність властивостей, 0 - відсутність);

- кількість співпадаючих одиничних властивостей;

- кількість одиничних значень властивостей;

; де - значення порога для l-го признака;

= - мера близькості об’єктів по l-му признаку;

- інформаційна вага признака, розрахована певних чином.

Етап 2. Використання того або іншого методу кластерного аналізу в залежності від цілей дослідження. Одним із найбільш поширених способів проведення ітераційних процедур ось уже понад сорок років виступає метод k-середніх. Застосування його потребує здійснення таких кроків:

розділення вихідних даних досліджуваної сукупності на задану кількість кластерів;

обчислення багатовимірних середніх (центрів тяжіння) виділених кластерів;

розрахунок Евклідової відстані кожної одиниці сукупності до визначених центрів тяжіння кластерів та побудова матриці відстаней, яка ґрунтується на метриці відстаней. Використовують різні метрики відстаней, наприклад: Евклідова відстань (проста і зважена), Манхеттенська, Чебишева, Мінковського, Махалонобіса тощо;

– визначення нових центів тяжіння та нових кластерів.

Вибір даного методу кластеризації обґрунтований наступними перевагами:

даний метод не будує геометричні кластери, що дозволяє уникнути їхнього перетинання і, як наслідок, влучення одного й того самого елемента в кілька кластерів;

дозволяє формувати задану кількість кластерів, що полегшує економічну інтерпретацію отриманих результатів.

Використання методу k-середніх ґрунтується на двох критеріях:

Мінімізація відстані всередині кластера між його елементами. Цей критерій забезпечує формування кластерів з тісно лежачих один до одного об'єктів.

Максимізація відстані між центрами кластерів. Використання даного критерію дозволяє виділити кластери, що знаходяться на максимально можливій відстані друг від друга

Дискримінантний аналіз. Існують такі основні методи багатомірної класифікації з навчанням як дискримінантний аналіз. Дискримінантний аналіз є розділом багатовимірного статистичного аналізу, який дозволяє вивчати відмінності між двома і більш групами об'єктів по декількох змінних одночасно. Дискримінантний аналіз - це загальний термін, що відноситься до декількох тісно зв'язаних статистичних процедур. Ці процедури можна розділити на методи інтерпретації міжгрупових відмінностей - дискримінації і методи класифікації спостережень по групах. При інтерпретації потрібно відповісти на питання: чи можливо, використовуючи даний набір змінних, відрізнити одну групу від іншої, наскільки добре ці змінні допомагають провести дискримінацію і які з них найбільш інформативні?

Методи класифікації пов'язані з отриманням однієї або декількох функцій, що забезпечують можливість віднесення даного об'єкту до однієї з груп. Ці функції називаються класифікуючими і залежать від значень змінних таким чином, що з'являється можливість віднести кожний об'єкт до однієї з груп.

Задачі дискримінантного аналізу можна розділити на три типи. Задачі першого типу часто зустрічаються в медичній практиці. Припустимо, що ми маємо свій в розпорядженні інформацію про деяке число індивідуумів, хвороба кожного з яких відноситься до одного з двох або більш діагнозів. На основі цієї інформації потрібно знайти функцію, що дозволяє поставити у відповідність новим індивідуумам характерні для них діагнози. Побудова такої функції і складає задачу дискримінації.

Перейти на сторінку: 1 2 3 4

Читайте більше

Оцінка фінансового стану підприємства і заходи для оздоровлення фінансового положення
Протягом останніх років тривало становлення ринкової системи господарювання активніше здійснювалися економічні реформи, виявлено нові аспекти реформування форм власності і структурної перебудови економіки України. У сучасних умовах кожне підприємство повинно чітко орієнтуватися у склад ...

Державний бюджет і бюджетна політика
Із визначенням України самостійною ринковою орієнтованою державою з усією важливістю постають проблеми створення і функціонування власної бюджетної системи, що передбачають: · виділення ланок бюджетної системи; · наповнення бюджетів, розподіл податків і зборів між ...