Меню сайта

Сутність методів багатомірної класифікації

фінансовий планування економетричний кластер

Кластерний аналіз - це метод багатомірного статистичного дослідження, до якого належать збір даних, що містять інформацію про вибіркові об'єкти, та упорядкування їх в порівняно однорідні, схожі між собою групи. Отже, сутність кластерного аналізу полягає у здійсненні класифікації об'єктів дослідження за допомогою численних обчислювальних процедур. В результаті цього утворюються "кластери" або групи дуже схожих об'єктів. На відміну від інших методів, цей вид аналізу дає можливість класифікувати об'єкти не за однією ознакою, а за декількома одночасно. Для цього вводяться відповідні показники, що характеризують певну міру близькості за всіма класифікаційними параметрами.

Мета кластерного аналізу полягає в пошуку наявних структур, що виражається в утворенні груп схожих між собою об'єктів - кластерів. Водночас його дія полягає й у привнесенні структури в досліджувані об'єкти. Це означає, що методи кластеризації необхідні для виявлення структури в даних, яку нелегко знайти при візуальному обстеженні або за допомогою експертів.

Основними завданнями кластерного аналізу є [23]:

розробка типології або класифікації досліджуваних об'єктів;

дослідження та визначення прийнятних концептуальних схем групування об'єктів;

висунення гіпотез на підставі результатів дослідження даних;

перевірка гіпотез чи справді типи (групи), які були виділені певним чином, мають місце в наявних даних.

Кластерний аналіз потребує здійснення таких послідовних кроків:

) проведення вибірки об'єктів для кластеризації;

) визначення множини ознак, за якими будуть оцінюватися відібрані об'єкти;

) оцінка міри подібності об'єктів;

) застосування кластерного аналізу для створення груп подібних об'єктів;

) перевірка достовірності результатів кластерного рішення.

Кожен з цих кроків відіграє значну роль у практичному здійснення Визначення множини ознак, які покладаються в основу оцінки об'єктів, у кластерному аналізі є одним із найважливіших завдань дослідження. Мета цього кроку повинна полягати у визначенні сукупності змінних ознак, яка найкраще відображає поняття подібності. Ці ознаки мають вибиратися з урахуванням теоретичних положень, покладених в основу класифікації, а також мети дослідження.

При визначенні міри подібності об'єктів кластерного аналізу використовуються чотири види коефіцієнтів: коефіцієнти кореляції, показники віддалей, коефіцієнти асоціативності та ймовірносні, коефіцієнти подібності. Кожен з цих показників має свої переваги та недоліки, які попередньо потрібно врахувати. На практиці найбільшого розповсюдження у сфері соціальних та економічних наук здобули коефіцієнти кореляції та віддалей.

В результаті аналізу сукупності вхідних даних створюються однорідні групи у такий спосіб, що об'єкти всередині цих груп подібні між собою за деяким критерієм, а об'єкти з різних груп відрізняються один від одного.

Кластеризація може здійснюватися двома основними способами, зокрема за допомогою ієрархічних чи ітераційних процедур.

Ієрархічні процедури - послідовні дії щодо формування кластерів різного рангу, підпорядкованих між собою за чітко встановленою ієрархією. Найчастіше ієрархічні процедури здійснюються шляхом агломеративних (об'єднувальних) дій. Вони передбачають такі операції [25]:

послідовне об'єднання подібних об'єктів з утворенням матриці подібності об'єктів;

побудова дендрограми (деревоподібної діаграми), яка відображає послідовне об'єднання об'єктів у кластери;

формування із досліджуваної сукупності окремих кластерів на першому початковому етапі аналізу та об'єднання всіх об'єктів в одну велику групу на завершальному етапі аналізу.

Ітераційні процедури полягають в утворенні з первинних даних однорівневих (одного рангу) ієрархічно не підпорядкованих між собою кластерів.

Найбільш відомими та широко застосовуваними методами формування кластерів є:

одиничного зв'язку;

повного зв'язку;

середнього зв'язку;

метод Уорда.

Метод одиничного зв'язку (метод близького сусіда) передбачає приєднання одиниці сукупності до кластера, якщо вона близька (знаходиться на одному рівні схожості) хоча б до одного представника цього кластера.

Метод повного зв'язку (далекого сусіда) вимагає певного рівня подібності об'єкта (не менше граничного рівня), що передбачається включити у кластер, з будь-яким іншим.

Перейти на сторінку: 1 2 3 4

Читайте більше

Місцеві податки та їх характеристика
В Україні доходи місцевого бюджету формуються, в основному, з таких джерел: податок з доходів фізичних осіб, податок на прибуток підприємств, збори за використання природних ресурсів, місцеві податки і збори, надходження дивідендів від використання місцевого майна, власні надходження бюдж ...

Нацiональний Банк Украiни статус i завдання
Національний банк України – найважливіша ланка всієї банківської системи держави. На відміну від багатьох інших відомств, які постали на грунті колишніх республіканських чи союзних, НБУ являє собою принципово нову структуру. З`явивишися відразу ж після проголошення незалежності, він став ...