|
Data-Mining-Technik und Anwendungen: Abbaumethode fürLanges Musteraus Datenbank
|
(Buch) |
Dieser Artikel gilt, aufgrund seiner Grösse, beim Versand als 2 Artikel!
Inhalt: |
Der Abbau von Item-Sets mit hohem Nutzen aus einer Transaktionsdatenbank bezieht sich auf die Entdeckung von Item-Sets mit hohem Nutzen wie Gewinne. Obwohl in den letzten Jahren eine Reihe relevanter Algorithmen vorgeschlagen wurden, stehen diese vor dem Problem, eine grosse Anzahl von Kandidaten für Item-Sets mit hohem Nutzen zu produzieren. Eine so grosse Anzahl von Kandidaten für die Erstellung von Item-Sets verschlechtert die Abbauleistung in Bezug auf Ausführungszeit und Platzbedarf. Die Situation kann sich noch verschlimmern, wenn die Datenbank viele lange Transaktionen oder lange Item-Sets mit hohem Nutzwert enthält.In diesem Buch schlagen wir einen Algorithmus vor, nämlich den Improved Mining Algorithmus (Utility Pattern Growth plus) zur Gewinnung von Item-Sets mit hohem Nutzwert mit einer Reihe von effektiven Strategien zum Beschneiden von Kandidaten-Item-Sets. Die Informationen von Item-Sets mit hohem Nutzwert werden in einer baumbasierten Datenstruktur namens UP-Tree (Utility Pattern Tree) verwaltet, so dass Item-Kandidaten-Sets effizient mit nur zwei Scans der Datenbank generiert werden können. Die Leistung von UP-Growth und UP-Growth+ wird mit den hochmodernen Algorithmen für viele Arten von sowohl realen als auch synthetischen Datensätzen verglichen. |
|