Start
Unternehmen
ERP / PPS / Prozesse
Business Intelligence
Server-Technologien
Software-Technologien
Technologie-Beratung
Individual-Software
Business Intelligence

Berichtssysteme

Reporting mit Microsoft

Data Mining

Point of Sale-Auswertungen

Umfrage-Auswertungen

Business Software
Produkte

Comelio GmbH
Rellinghauser Straße 10
D-45128 Essen
Deutschland
Fon: 0201-437517-0
Fax: 0201-437517-10
info@comelio.com

Comelio GmbH
Goethestraße 34
D-13086 Berlin
Deutschland
Fon: 030-921019-85
Fax: 030-921019-89
info@comelio.com

Comelio GmbH (Ecos)
Glockengießerwall 17
D-20095 Hamburg
Deutschland
Fon: 040-4689908-91
Fax: 040-4689908-95
info@comelio.com

Comelio GmbH (Ecos)
Mainzer Landstraße 27-31
D-60329 Frankfurt
Deutschland
Fon: 069-2475030-35
Fax: 069-2475030-39
info@comelio.com

Comelio GmbH (Ecos)
Stiglmaierplatz/Dachauer Str. 37
D-80335 München
Deutschland
Fon: 089-2000154-90
Fax: 089-2000154-94
info@comelio.com

Comelio GmbH (Ecos)
Liebknechtstr. 33
D-70565 Stuttgart
Deutschland
Fon: 0711-252534-20
Fax: 0711-252534-24
info@comelio.com

Individual-Software > Business Intelligence > Data Mining

Einführung von Data Mining

Die Comelio GmbH unterstützt ihre Kunden dabei, Data Mining-Technologien für erweiterte Untersuchungen und das Erkennen von Mustern und Zusammenhängen in den vorhanden Daten in die Business Intelligence-Strategie aufzunehmen.

Kontakt

Anrede* Herr Frau
Vorname*
Nachname*
Firma
E-Mail*
Tel-Nr.
Bereich*
Freitext

Data Mining für erweiterte Datenanalysen

Die Comelio GmbH unterstützt ihre Kunden dabei, Berichts- und Expertensysteme sowie Regelmaschinen einzurichten. Dieses Gebiet runden die Comelio-Mitarbeiter um das immer wichtiger werdende Thema Data Mining ab, das verstärkt auch von mittelständischen Kunden nachgefragt wird. Unter Data Mining versteht man dabei die Anwendung von (statistisch-mathematischen) Methoden auf einen Datenbestand mit dem Ziel der Mustererkennung. Solche Muster sind im Normalfall nicht unmittelbar in den Daten zu erkennen, sondern können nur mit Kenntnis der Branche und des untersuchten Fachgebiets vermutet werden. Tatsächliche Zusammenhänge und ihre Strukturen kann man jedoch im konkreten Fall nur mit entsprechenden Untersuchungsmethoden ans Tageslicht bringen.

Im Normalfall ergänzen sich Berichtssysteme und Data Mining-Anwendungen auf hervorragende Weise. Während ein Berichtssysteme es erlaubt, Aggregate von vorhandenen Daten zu erzeugen, gefiltert abzufragen und teilweise auch entlang von Hierarchien in bspw. örtlicher und zeitlicher Dimension zu untersuchen, dient Data Mining vorrangig der Extraktion von Wissen. Dabei fokussiert Data Mining den Prozess der Muster-Erkennung in Daten vom Zusammentragen von Daten, der Anwendung von passenden Algorithmen, der Interpretation von Ergebnissen und schließlich auch der Ableitung von Handlungsempfehlungen.

Einsatzbereiche Dienstleistungen Technik
  • Klickpfad-Analyse
  • Warenkorb-Analyse
  • Empfehlungsmaschinen (Recommendation Engines) für Benutzerunterstützung
  • Klassifizierungen und Muster-Identifizierung
  • Korrelationsanalyse
  • Vorhersagen und Prognosen
  • Data Warehouse-Konzeption und Aufbau
  • Entwicklung und Konzeption von Sicherheits- und Sicherungsstrategien
  • Auswahl und Einrichtung von Data Mining-Algorithmen
  • Entwicklung von individuellen Data Mining-Techniken
  • Software-Entwicklung für Benutzeroberflächen zur Verwendung der Analysen
  • MS SQL Server 2005
  • Data Mining der Analysis Services
  • Erweitertes Data Mining durch individuelle Modelle
  • Regelmaschinen
  • Ontologien

Themenbezogene Lösungsansätze

Die Comelio GmbH hat in ihrem Portfolio eine Reihe von Lösungsansätzen, die für den Bereich Data Mining für eine Reihe von typischen Anwendungsfällen zum Einsatz kommen. Diese vereinen moderne und wissenschaftlich fundierte Konzepte mit technisch einfach und sicher zu realisierenden Umsetzungsstrategien. Einige typische Bereiche, in denen Data Mining erfolgreich mit den Beratern und Entwickler der Comelio GmbH eingesetzt werden kann, sind in diesem Abschnitt zusammengestellt.

Kundensegmentierung im Marketing

  • Erkennen von ähnlichem Kaufverhalten
  • Segmentbildung anhand von Interessen und sonstigen Merkmalen
  • Ableitung von geeigneten und gezielten Werbemaßnahmen

Warenkorbanalyse

  • Preisdifferenzierung und Preisoptimierung
  • Produktplatzierung am Verkaufspunkt (online oder offline)
  • Analyse des Kaufverhaltens

Management von Kundenbeziehungen

  • Analyse des Kauf- und Bestellverhaltens
  • Bindung der Bestandskunden mit maßgeschneiderten Aktionen
  • Kundenpotenzial durch Up- und Cross-Selling besser ausschöpfen
  • Abstrahierung und Ableitung von Kundengruppen
  • Auswertung von Bewegungsdaten
  • Analyse und Verhinderung von verlorenen Aufträgen
  • Marktsegmentierung

Selektion von Zielgruppen für Marketingaktionen

  • Strategische Planung: Ableitung von Zielen und Vorgehensweisen
  • Taktische Planung: Unterstützung der zeitlichen und organisatorischen Planung
  • Operative Planung: Unterstützung von Controlling, Eventualfallplanung, Durchführungskontrolle
  • Kampagnenanalyse und -controlling in Form einer Daten- und Prozessanalyse
  • Responseoptimierungsmodelle
  • Vergleich von Kampagnenergebnisse gegenüber definierten Kampagnenabbruchkriterien, Ermittlung und Bewertung von Ergebnissen und Abbruchkriterien

Web Usage Mining

  • Web-Content-Mining: Textmining und Untersuchung von Inhalten einer Webressource
  • Web Structure Mining: Untersuchung der Topologie von Verweisen (Hyperlinks), Musterableitung
  • Web-Usage-Mining: Erkennung von Regularitäten in der Benutzung von Webseiten bzw. Webressourcen

Text-Mining

  • Automatisierte Entdeckung neuer, richtiger und relevanter Informationen aus Textdaten
  • Generierung, Überprüfung und Verfeinerung von Hypothesen
  • Frage-Antwort-Systeme
  • Textanalyse für Konkurrenzbeobachtungssysteme, Textüberwachung, Suchmaschinen

Architektur von Data Mining-Anwendungen

Anwendungen im Bereich Data Mining stellen die Spitze der Datenauswertung dar und bringen daher insbesondere Verantwortlichen für Projekte im Bereich Marketing, Controlling und Unternehmensentwicklung wertvolle Entscheidungsgrundlagen für ihre Strategien und Umsetzungspläne. Eine Reihe von Techniken und Methoden werden von der Comelio GmbH in fast allen Data Mining-Projekten eingesetzt. Sie erlauben es, flexible Anwendungsarchitekturen zu entwickeln, moderne Algorithmen für die Datenauswertung einzusetzen und diese zu kombinieren sowie benutzerfreundliche Anwendungen bereitzustellen, mit denen die Daten sicher und verständlich abgerufen oder selbstständig untersucht werden können.

Planung und Konzeption

Mit der Einführung von Business Intelligence-Software, die ein Berichtssystem und zusätzlich auch Data Mining unterstützt, sind große und auch berechtigte Erwartungen verbunden. Aus den ermittelten Mustern leitet man Handlungsempfehlungen ab und bewertet damit wertvolle Ressourcen des Unternehmens und seine Zukunftsfähigkeit sowie seine Fähigkeiten, dauerhaft am Markt zu bestehen oder die Wirksamkeit von Prozessen. Daher ist eine methodisch abgesicherte Vorgehensweise und ein durchgehendes IT- und Prozesskonzept wesentlich für den Erfolg von BI-Projekten. Die Comelio GmbH verfügt durch wissenschaftlich ausgebildete Mitarbeiter und mehrjährige Erfahrung im Business Intelligence-Bereich über das notwendige Fachwissen, hier Unternehmen zu unterstützen.

  • Planung des Datenmodells und Anforderungsanalyse an Daten, Software und Algorithmen
  • Methodisch fundierte Erarbeitung und Auswahl von geeigneten Data Mining-Algorithmen
  • Konzeption von Sicherungs- und Sicherheitsstrategien
  • Architektur- und Funktionsplanung von Benutzersoftware

Datenbank

Als Datenbank kommt im Wesentlichen der MS SQL Server zum Einsatz. Als Alternative können für besondere Anforderungen auch Oracle-Technologien verwendet werden. Insbesondere im Mittelstand ist allerdings die Verwendung des MS SQL Servers und seine gute Integrationsfähigkeit in die bereits bestehende IT-Landschaft des Unternehmens besonders empfehlenswert.

  • Daten-Integration mit Integration Services: Übernahme aus heterogenen Datenquellen, Anreicherung, Filterung, Validierung
  • Datenspeicherung und zusätzliche Anpassung um Sichten, Prozeduren, Funktionen
  • Sicherungs- und Sicherheitsstrategien auf Basis der Datenbank und der Netzwerkinfrastruktur

Data Mining-Techniken

Im Wesentlichen kommen die Data Mining-Modelle und -Algorithmen des MS SQL Servers zum Einsatz. Einige individuelle Anforderungen machen es allerdings notwendig, eigene Techniken für Clusterbildung, Sequenzen, neuronale Netze usw. zu entwickeln. Insbesondere im Bereich der Expertensysteme und Regelmaschinen ist dies notwendig, um besondere Anforderungen abzubilden.

  • Vorbereitung der Verwendung von Data Mining-Modellen des MS SQL Servers
  • Entwicklung von individuellen Data Mining-Modellen
  • Entwicklung von Regelmaschinen

Software-Entwicklung

Der Datenbank und den Data Mining-Algorithmen kommt ein besonderes Gewicht bei der Einführung von Data Mining-Anwendungen zu. Nichtsdestoweniger ist es immer auch notwendig, eine entsprechende Benutzerschnittstelle zu schaffen, sofern auf Würfel und Auswertungsergebnisse mit Standardsoftware zugegriffen werden soll oder man eine Integration der Ergebnisse in ein umfangreiches Berichts- und Analysesystem erwartet. Dazu kommen im Wesentlichen die .NET-Programmierung zum Einsatz.

  • .NET-Entwicklung von Benutzerschnittstellen für Desktop- und Web-Anwendungen
  • VBA-/.NET-Entwicklung von MS Office-Komponenten und Ausgaben in MS Excel, MS Powerpoint und MS Word
  • Klientenentwicklung speziell in MS Excel
  • Entwicklung von Berichtssystemen und Ausgabetechniken

Data Mining mit MS SQL Server 2005

Die Untersuchungen erfolgen im Wesentlichen mit dem MS SQL Server 2005 und seinen Data Mining-Algorithmen.

Microsoft Decision Trees

Der Microsoft Decision Trees-Algorithmus ist ein Klassifizierungs- und Regressionsalgorithmus, der von Microsoft SQL Server 2005 Analysis Services (SSAS) für die Vorhersagemodellierung sowohl diskreter als auch kontinuierlicher Attribute bereitgestellt wird.
Bei diskreten Attributen gründet der Algorithmus seine Vorhersagen auf die Beziehungen zwischen den Eingabespalten in einem Dataset Er verwendet die Werte oder Zustände aus diesen Spalten zur Vorhersage der Zustände einer von Ihnen als vorhersagbar bestimmten Spalte. Dabei identifiziert der Algorithmus die Eingabespalten, die von der vorhersagbaren Spalte abhängig sind. Wenn z. B. in einem Szenario zur Vorhersage der wahrscheinlichen Käufer eines Fahrrads neun von zehn jüngeren Kunden ein Fahrrad kaufen, dies jedoch nur bei zwei von zehn älteren Kunden zutrifft, folgert der Algorithmus daraus, dass das Alter ein gutes Vorhersagekriterium für den Fahrradkauf ist. Die von der Entscheidungsstruktur getroffenen Vorhersagen gründen auf dieser Tendenz hinsichtlich eines bestimmten Ergebnisses.
Bei kontinuierlichen Attributen bestimmt der Algorithmus anhand einer linearen Regression, wo sich die Entscheidungsstruktur teilt.
Wenn mehr als eine Spalte als vorhersagbar festgelegt ist, oder wenn die Eingabedaten eine als vorhersagbar festgelegte Tabelle enthalten, bildet der Algorithmus für jede vorhersagbare Spalte eine eigene Entscheidungsstruktur.

Microsoft Clustering-Algorithmus

Der Microsoft Clustering-Algorithmus ist ein Segmentierungsalgorithmus, der von Microsoft SQL Server 2005 Analysis Services (SSAS) bereitgestellt wird. Der Algorithmus arbeitet mit iterativen Techniken, um die in einem Dataset enthaltenen Fälle in Clustern zu gruppieren, die ähnliche Merkmale enthalten. Diese Gruppierungen eignen sich zum Durchsuchen von Daten, Identifizieren von Datenanomalien und Erstellen von Vorhersagen. Clustermodelle identifizieren Beziehungen in einem Dataset, die bei einer einfachen Betrachtung der Daten nicht unbedingt zu erkennen sind. Der Clustering-Algorithmus unterscheidet sich von anderen Data Mining-Algorithmen, z. B. dem Microsoft Decision Trees-Algorithmus, dadurch, dass Sie keine vorhersagbare Spalte bestimmen müssen, um in der Lage zu sein, ein Clustermodell aufzubauen. Der Clustering-Algorithmus trainiert das Modell systematisch anhand der Beziehungen, die in den Daten bestehen, und anhand der Cluster, die der Algorithmus identifiziert.

Microsoft Naive Bayes

Der Microsoft Naive Bayes-Algorithmus ist ein Klassifikationsalgorithmus, der in Microsoft SQL Server 2005 Analysis Services (SSAS) zum Verwenden bei der Vorhersagemodellierung bereitgestellt wird. Der Algorithmus berechnet die bedingte Wahrscheinlichkeit zwischen Eingabespalten und vorhersagbaren Spalten und setzt die Unabhängigkeit der Spalten voraus. Diese Annahme der Unabhängigkeit führt zum Namen Naive Bayes. Die Annahme ist in manchen Fällen deshalb "naiv", weil der Algorithmus bei dieser Annahme eventuell vorhandene Abhängigkeiten nicht berücksichtigt.
Der Rechenaufwand für diesen Algorithmus ist geringer als der der anderen Microsoft-Algorithmen und ist daher hilfreich für das schnelle Generieren von Miningmodellen, um Beziehungen zwischen Eingabespalten und vorhersagbaren Spalten zu ermitteln. Sie können diesen Algorithmus zunächst dazu verwenden, um Daten zu durchsuchen. Später können Sie dann die Ergebnisse anwenden, um zusätzliche Miningmodelle mit anderen Algorithmen zu erstellen, deren Rechenaufwand größer ist und die präziser sind.

Microsoft Association

Der Microsoft Association-Algorithmus ist ein von Microsoft SQL Server 2005 Analysis Services (SSAS) zur Verfügung gestellter Association-Algorithmus, der für Recommendation Engines von Nutzen ist. Eine Recommendation Engine empfiehlt Kunden Produkte auf der Basis von Produkten, die diese Kunden bereits gekauft oder an denen sie Interesse gezeigt haben. Der Microsoft Association-Algorithmus ist auch ein nützliches Market Basket Analysis-Instrument. Association-Modelle basieren auf Datasets, die Bezeichner enthalten, die sich sowohl auf einzelne Fälle als auch auf die Elemente beziehen, die in dem Fall enthalten sind. Eine Gruppe von Elementen in einem Fall wird als Itemset bezeichnet. Ein Association-Modell besteht aus einer Reihe von Itemsets und Regeln, die beschreiben, wie diese Elemente in den Fällen gruppiert sind.

Microsoft Sequence Clustering

Der Microsoft Sequence Clustering-Algorithmus ist ein Sequenzanalysenalgorithmus, der von Microsoft SQL Server 2005 Analysis Services (SSAS) bereitgestellt wird. Mithilfe dieses Algorithmus können Sie Daten zu Ereignissen untersuchen, die durch Folgepfade, auch Sequenzen genannt, verknüpft werden können. Der Algorithmus ermittelt die am häufigsten vorkommenden Sequenzen durch Gruppierung oder Clustering identischer Sequenzen. Diese Sequenzen können in mehrfacher Form auftreten, u. a. als:

  • Daten, die die Klickpfade beschreiben, denen Benutzer auf einer Website folgen.
  • Daten, die die Reihenfolge beschreiben, in der der Kunde eines Onlinehändlers Waren seinem Einkaufswagen hinzufügt.
Der Algorithmus ist vergleichbar mit Microsoft Clustering-Algorithmus. Anstatt jedoch nach Clustern mit Fällen zu suchen, die ähnliche Attribute enthalten, sucht der Microsoft Sequence Clustering-Algorithmus nach Clustern mit Fällen, die ähnliche Pfade in einer Sequenz enthalten.
Das von diesem Algorithmus erstellte Miningmodell enthält Beschreibungen der in den Daten am häufigsten vorkommenden Sequenzen. Anhand der Beschreibungen können Sie den wahrscheinlich nächsten Schritt in einer neuen Sequenz vorhersagen. Beim Gruppieren von Datensätzen in Clustern kann der Algorithmus auch solche der in den Daten enthaltenen Spalten mit einbeziehen, die nicht direkt mit den Sequenzen verbunden sind. Da der Algorithmus die nicht verbundenen Spalten einschließt, eignet sich das entstandene Modell auch zum Identifizieren von Beziehungen zwischen Sequenzdaten und Daten, die nicht in einer Sequenz auftreten.

Microsoft Time Series

Der Microsoft Time Series-Algorithmus ist ein von Microsoft SQL Server 2005 Analysis Services (SSAS) zur Verfügung gestellter Regressionsalgorithmus, der zum Erstellen von Data Mining-Modellen verwendet wird. Miningmodelle unterstützen Vorhersagen zu kontinuierlichen Spalten, beispielsweise Spalten zum Produktverkauf in einem Vorhersageszenario. Während andere Algorithmen von Microsoft Modelle (z. B. Entscheidungsstrukturen) erstellen, die auf Eingabespalten angewiesen sind, um die vorhersagbare Spalte vorhersagen zu können, basiert die Vorhersage in einem Time Series-Modell ausschließlich auf den Trends, die der Algorithmus beim Erstellen des Modells aus dem ursprünglichen Dataset ableitet.

Microsoft Neural Network

In Microsoft SQL Server 2005 Analysis Services (SSAS) erstellt der Microsoft Neural Network-Algorithmus Klassifikations- und Regressionsminingmodelle, indem ein mehrschichtiges Perzeptronnetzwerk von Neuronen erstellt wird. Ähnlich wie der Microsoft Decision Trees-Algorithmus berechnet der Microsoft Neural Network-Algorithmus Wahrscheinlichkeiten für jeden möglichen Status des Eingabeattributs zu jedem angegebenen Status des vorhersagbaren Attributs.

Microsoft Linear Regression

Der Microsoft Linear Regression-Algorithmus ist eine Variation des Microsoft Decision Trees-Algorithmus, bei dem der MINIMUM_LEAF_CASES-Parameter größer als oder gleich der Gesamtzahl der Fälle im Dataset ist, mit dem der Algorithmus das Miningmodell trainiert. Bei dieser Parametereinstellung erstellt der Algorithmus nie eine Teilung, was der Grund dafür ist, dass der Algorithmus eine lineare Regression ausführt.

    Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses Comelio GmbH Data Mining und Business Intelligence, MS SQL Server, Data Warehousing, Data Warehouses