www-ai.cs.tu-dortmund.de/LEHRE/VORLESUNGEN/KDD/SS09/8DMVHHH.pdf
Vorlesung Wissensentdeckung - Häufige Mengen in Datenströmen
∗)
(b, ∗)(a, ∗) (∗, 1) (∗, 2)
(a, 1)
6
(b, 1)
2
(a, 2)
3
(b, 2)
2
count(∗, 2) = 5→ HHH
count(∗, 1) = 2 count(b, ∗) = 4 count(a, ∗) = 3 count(∗, ∗) = 2, da (a, 1) als HHH nicht gezählt wird und (a, 2), [...] Φ = 0.35 und split-case
(∗, ∗)
(b, ∗)(a, ∗) (∗, 1) (∗, 2)
(a, 1)
6
(b, 1)
2
(a, 2)
3
(b, 2)
2
count(∗, 2) = 5/2 = 2.5 count(∗, 1) = 2/2 = 1 count(b, ∗) = 4/2 = 2 count(a, ∗) = 3/2 = 1.5 count(∗, ∗) = 7→ [...] Leaf Heavy Hitter mit Φ = 0.35
(∗, ∗)
(b, ∗)(a, ∗) (∗, 1) (∗, 2)
(a, 1)
6
(b, 1)
2
(a, 2)
3
(b, 2)
2
Mit Φ = 0.35 brauchen wir die Häufigkeit 5 Hier also nur (a, 1)
Katharina Morik, Claus Weihs DMV
LS …