Kontakt

Wir freuen uns auf Ihre Nachricht!

  • LinkedIn Social Icon
  • Xing Social Icon
  • Facebook
  • Instagram
  • YouTube
  • EarlyNode

Was ist Data-Mining?

Nicht nur eine Möglichkeit, empirische Daten über Ihr Unternehmen zu erheben, sondern diese sogar als Basis für Optimierung nutzen zu können



Data-Mining ist einer dieser Begriffe, derer eine deutsche Übersetzung einfach nicht gerecht wird. Das Abbauen oder Fördern von Daten bezeichnet nämlich ein Anwenden statistischer Methoden auf Datenbestände enormer Größe, wie zum Beispiel Big Data, um in ihnen Verbindungen, Querverweise und Trends zu erkennen.


Es geht also prinzipiell darum, neues Wissen aus bereits vorhandenen Daten zu gewinnen, indem Zusammenhänge festgestellt und Regeln für zukünftige Prognosen entworfen werden.


Fasst man den Begriff des Data-Mining eng, so steht er eigentlich nur für Analyseschritt des sogenannten “Knowledge Discovery in Databases”-Prozesses. Die meisten sehen ihn allerdings als Synonym für ebendiesen Prozess an.


In fünf Schritte fasst er den gesamten Ablauf der Wissensgewinnung aus Datenbanken. Im ersten Schritt des Fokussierens wird das zu bearbeitende Wissen bestimmt und die Daten werden erhoben. Anschließend werden die Daten in der Vorverarbeitung bereinigt und dann in der Transformation in das Format gebracht, das für die Analyse benötigt wird. Diese Analyse, also das tatsächliche Data-Mining, folgt nämlich schon im nächsten Schritt und die Ergebnisse werden in der Evaluation schlussendlich in die erhofften Muster zusammengefasst.


Wenn also in der Evaluation schon Ergebnisse geliefert werden, muss im Analyseschritt einiges passieren. Zunächst müssen durch die Ausreißer-Erkennung alle unschönen Datensätze der Datenbank identifiziert und ausgeblendet werden.


Eine anschließende Clusteranalyse fasst Daten in Gruppen zusammen, die genug Ähnlichkeiten aufweisen, und selbst nach der Analyse nicht Zugeordnetes wird in der Klassifikation nach vordefinierten Regeln eingegliedert.


Die Assoziationsanalyse sorgt schließlich dafür, dass Zusammenhänge und Abhängigkeiten erkannt werden und fasst sie in Regeln zusammen, die in der Zukunft Vorlage für Prognosen sein können. Eine darauffolgende Regressionsanalyse identifiziert dann die Beziehungen zwischen abhängigen und unabhängigen Variablen, um selbst Zusammenhänge zwischen eigentlich unterschiedlichen Besonderheiten feststellen zu können.


Im letzten Schritt muss dann alles zusammengefasst werden - und das möglichst ohne viele der gesammelten Informationen zu verlieren. Der gesamte Datensatz muss auf eine Menge reduziert werden, mit der von jedermann gearbeitet werden kann und in der alles Wichtige enthalten ist.


Genutzt wird Data-Mining zum Beispiel im Zusammenhang mit Business Intelligence oder dem sogenannten Textmining, bei dem große Textbestände analysiert werden, um zum Beispiel Plagiate festzustellen. Generell machen Softwares wie Clustan, Konstanz Information Miner (KNIME) oder Neural Designer Data-Mining für jeden möglich.


Gerade in Unternehmen ist es äußerst sinnvoll, Gebrauch von Data-Mining zu machen. Nicht nur bringen sie sich damit selbst auf den neuesten Stand der Technik und willigen ein, ihr Unternehmen mit starken Schritten in die Zukunft zu führen, sondern sie können auch einiges über sich selbst lernen. Die gewonnen Erkenntnisse sind nämlich nicht weniger als empirisch gesammeltes Wissen über den eigenen Betrieb und darauf können am Ende des Tages durchdachte und fundierte Entscheidungen auf jeder Ebene getroffen werden. Man kann dadurch zum Beispiel mehr über die eigenen Kunden herausfinden und anhand dieses Wissens gezieltere Marketingstrategien entwerfen und dadurch mehr Verkäufe mit geringeren Kosten erzielen.


Data-Mining ist also eine Art Werkzeug zur Anwendung bei großen Datensätzen, durch welches neues Wissen extrahiert und zu Mustern zusammengefasst werden kann.