Един от инструментите за решаване на икономически проблеми е клъстерният анализ. Използвайки го, клъстерите и другите обекти в множество данни се класифицират в групи. Този метод може да се използва в Excel. Нека видим как това се прави на практика.

Използване на клъстерен анализ

С помощта на клъстерен анализ е възможно да се вземе проба въз основа на това, което се проучва. Неговата основна задача е да раздели многоизмерния масив в хомогенни групи. Като критерий за групиране се прилага двоен корелационен коефициент или евклидово разстояние между обекти в зависимост от даден параметър. Най-близките до всяка друга стойности са групирани заедно.

Въпреки че най-често този вид анализ се използва в икономиката, той може да се използва и в биологията (за класификация на животните), в психологията, медицината и в много други области на човешката дейност. Анализът на клъстерите може да се приложи с помощта на стандартния инструментариум на Excel за тази цел.

Пример за използване

Разполагаме с пет обекта, които се характеризират с двата изучени параметъра - х и у .

  1. Прилагайте към тези стойности формулата на Euclidean разстояние, която се изчислява от шаблона:

    =КОРЕНЬ((x2-x1)^2+(y2-y1)^2)

  2. Научени обекти в Microsoft Excel

  3. Тази стойност се изчислява между всеки от петте обекта. Резултатите от изчислението се поставят в матрицата на разстоянията.
  4. Матрица за разстояние в Microsoft Excel

  5. Ние гледаме, между които стойности разстоянието е най-малкото. В нашия пример това са обектите 1 и 2 . Разстоянието между тях е 4.123106, което е по-малко, отколкото между другите елементи на дадено население.
  6. Разстоянието между обектите е минимално в Microsoft Excel

  7. Ние комбинираме тези данни в група и формираме нова матрица, в която стойностите от 1,2 са отделен елемент. При съставянето на матрицата оставяме най-малките стойности от предишната таблица за комбинирания елемент. Отново гледаме, между кои елементи разстоянието е минимално. Този път е 4 и 5 , както и обект 5 и група обекти 1,2 . Разстоянието е 6,708204.
  8. Разстоянието между обектите е минимално във втората матрица в Microsoft Excel

  9. Добавяме посочените елементи към общия клъстер. Създаваме нова матрица на същия принцип, както в предишното време. Тоест, ние търсим най-ниските стойности. По този начин виждаме, че нашият набор от данни може да бъде разделен на два клъстера. В първия клъстер най-близките елементи са 1 , 2 , 4 , 5 . Във втория клъстер в нашия случай е представен само един елемент - 3 . Тя е относително далеч от други обекти. Разстоянието между клъстерите е 9.84.

Обща стойност в Microsoft Excel

Това приключва процедурата за разделяне на събирането в групи.

Както можете да видите, макар че като цяло анализът на клъстера може да изглежда сложна процедура, не е толкова трудно да се разбере нюансите на този метод. Основното нещо е да се разбере основният модел на групиране.