text.skipToContent text.skipToNavigation
background-image

Maßzahlen für die Assoziationsanalyse im Data Mining Fundierung, Analyse und Test von Hagemann, Stephan (eBook)

  • Erscheinungsdatum: 11.12.2007
  • Verlag: Diplomica
eBook (PDF)
43,00 €
inkl. gesetzl. MwSt.
Sofort per Download lieferbar

Online verfügbar

Maßzahlen für die Assoziationsanalyse im Data Mining

Inhaltsangabe:Einleitung: Measurement does not necessarily mean progress. Failing the possibility of measuring that which you desire, the lust for measurement may, for example, merely result in your measuring something else - and perhaps forgetting the difference - or in your ignoring some things because they cannot be measured. (George Udny Yule in einem Brief an Maurice Kendall). Problemstellung: Die Assoziationsanalyse ist innerhalb des Knowledge Discovery in Databases (KDD) eine sehr populäre Methode zur Gewinnung von Wissen aus großen Datenmengen. Ein wesentlicher Grundstein für dieses Werkzeug wurde mit der Einführung der Warenkorbanalyse im Jahre 1993 durch Agrawal et al. gelegt. Seit dem haben sich eine Fülle von Veröffentlichungen mit ihrer Erweiterung, Verbesserung und änderung befasst. Die Intention der Assoziationsanalyse ist die Gewinnung von Regeln zwischen den Attributen von Objekten, wobei die Akzeptanz einer Regel bedeutet, dass das Auftreten der Konsequenz einer Regel stark vom Auftreten der Vorbedingung abhängig ist, diese beiden also stark assoziiert sind. Die Menge potentieller Regeln, die für ein Objekt gebildet werden können, wächst exponentiell mit der Anzahl der Attribute dieses Objekts. Um diese Zahl zu reduzieren, werden den Regeln verschiedene Arten von Restriktionen auferlegt. Im Zentrum der Frage der Akzeptanz einer Regel steht die Bewertung ihrer Stärke oder auch confidence, welche als die bedingte Wahrscheinlichkeit der Konsequenz unter der Vorbedingung definiert ist. Dieses Maß als Aussage über die überzeugung in die Stärke einer Regel stand und steht in der Literatur unter viel Kritik, da es auch einige Fälle von approximativer stochastischer Unabhängigkeit als stark abhängig bewertet und als Regeln akzeptiert, was als irreführend empfunden wird. Viele Beiträge in der Literatur befassen sich mit diesem Problem und schlagen verschiedene Lösungen vor. In einigen Arbeiten werden nachgelagerte Verarbeitungsschritte untersucht, die z. B. mit Hilfe statistischer Verfahren versuchen, aus der Menge der akzeptierten Regeln diejenigen zu eliminieren, die keine Abhängigkeit darstellen. Außerdem werden Zusammenfassungen, Gruppierungen und Visualisierungen untersucht, die bei der Untersuchung der Regeln durch den Nutzer helfen sollen. In anderen Literaturbeiträgen sind alternative Maße zur Bestimmung der Stärke einer Regel entwickelt worden. Die Hoffnung ist, durch die Anwendung sinnvoller Maße die Akzeptanz von irreführenden Regeln zu vermeiden. Gang der Untersuchung: In den Arbeiten, die eine neue Maßzahl als Ersatz für confidence vorschlagen, werden häufig Tests verwendet um die Bewertungen der Maße zu vergleichen. Es fehlt jedoch für das KDD an einer allgemeinen Definition wünschenswerter Eigenschaften für Assoziationsmaße, die einen Vergleich der Maße unabhängig von konkreten Daten ermöglichen würde. Für den Fall stetiger Zufallsvariablen gibt es jedoch in der Literatur verschiedene Axiomatisierungen für Assoziationsmaße. Diese bilden für diese Arbeit die Grundlage bei der Entwicklung einer Axiomatisierung für Maße in der Assoziationsanalyse. Im Umfeld des KDD verwendete Maße werden desweiteren vorgestellt und auf die Erfüllung der neu definierten Eigenschaften hin untersucht. So werden die Maße im Hinblick auf ihre Anwendung in der Assoziationsnalyse fundiert. Als weiterer Schritt wird anhand zweier sehr unterschiedlicher Testdatenbanken untersucht, in wie fern sich die Erfüllung oder Nicht-Erfüllung der Eigenschaften in den Ergebnissen einer Assoziationsanalyse widerspiegelt. Dazu wird eine Reihe von sowohl qualitativen als auch quantitativen Beobachtungen verglichen. Den Kern dieser Arbeit stellen somit die Fundierung und Untersuchung der Maße aus der Assoziationsanalyse und deren empirische Testung dar. Um diese beiden Teile in die bisherigen Forschungen einordnen zu können, folgt in Abschnitt 2 eine Einordnung der Ar

Produktinformationen

    Format: PDF
    Kopierschutz: none
    Seitenzahl: 124
    Erscheinungsdatum: 11.12.2007
    Sprache: Deutsch
    ISBN: 9783836607186
    Verlag: Diplomica
    Größe: 17417 kBytes
Weiterlesen weniger lesen

Kundenbewertungen