Excel-Add-In zur Validierung einer Clusteraufteilung

In einer Clusteranalyse werden die Objekte einer Population zu Gruppen (den Clustern) zusammengefasst. Validierung bedeutet in diesem Zusammenhang, dass man prüft, ob die Gruppenbildung gelungen ist und, falls nicht, die Lösung überarbeitet.

 

Zur Einschätzung der Güte einer Gruppenbildung sind diverse Kennzahlen entwickelt worden. Das hier beschriebene und kostenlose Add-In zur Clustervalidierung erlaubt, einige der bedeutendsten unter diesen Kennzahlen im Rahmen von Excel (Versionen ab 2007) zu ermitteln.

 

Man muss hierfür nur die Ergebnisse der Clusteranalyse in ein Excel-Tabellenblatt laden, was normalerweise mit Hilfe der Datenimportmöglichkeiten von Excel problemlos möglich ist. Noch einfacher ist es natürlich, wenn man die Clusteranalyse schon mit einer Excel-basierten Software durchgeführt hat.

 

Die Kennzahlenermittlung wird in diesem Add-In in Form von benutzerdefinierten Funktionen bereit gestellt. Verfügbar sind Funktionen für folgende Kennzahlen:

 

  • Dunn-Index
  • Davies-Bouldin-Index
  • Silhouettenkoeffizient
  • Fehlerquadratsumme

 

Als Input für diese Funktionen ist eine Tabelle mit den Objekten der Population und ihrer Clusterzuordnung erforderlich. Beispiel:

 

 

 

Die Ergebnisse der Kennzahlenermittlung lassen sich an beliebiger Stelle in der Arbeitsmappe platzieren. Das folgende Bild zeigt beispielhaft die Kennzahlenwerte für die obige Clusteranalyse:

 

 

Sie können das Add-In für den nicht-kommerziellen Gebrauch kostenlos herunterladen. Eine kurze Anwendungsbeschreibung steht ebenfalls bereit.

 

Excel-Add-In zur Clustervalidierung
enthält benutzerdefinierte Funktionen Dunn-Index, Davies-Bouldin-Index, Silhouettenkoeffizient und Fehlerquadratsumme
ClustValNum.zip
Komprimiertes Archiv im ZIP Format 55.2 KB
Benutzeranleitung zum Add-In Clustervalidierung
CA_Val_Benx.pdf
Adobe Acrobat Dokument 105.0 KB