Úvod
Důležité pojmy
Vztahy, s nimiž procedury pracují
GUHA procedury
GUHA procedury - společné prvky
Observační kalkuly - relevantní výsledky
Důležité tématické okruhy
Úvod
Důležité pojmy
Vztahy, s nimiž procedury pracují
GUHA procedury
GUHA procedury - společné prvky
Observační kalkuly - relevantní výsledky
Důležité tématické okruhy
Příkladem SD4ft-pravidla je výraz
HStat(Slovensko) × HStat(Rakousko): HVek(od 28 do 60) ⇒*1.7,31,69
DHodnoceni(nespokojen),
kterému odpovídá výstup procedury SD4ft-Miner uvedený v následujícím obrázku.
Uvedené SD4ft-pravidlo se týká matice dat Hotel. Platí:
Tento fakt je vyjádřen výše uvedeným SD-pravidlem
HStat(Slovensko) × HStat(Rakousko): HVek(od 28 do 60) ⇒*1.7,31,69
DHodnoceni(nespokojen).
SD4ft-pravidlo je výraz α×β:φ∼ψ kde
Booleovský atribut φ se nazývá antecedent, ψ je sukcedent (konsequent), α je definice první množiny a β je definice druhé množiny.
SD4ft-pravidlo α×β:φ∼ψ říká, že vztah booleovských atributů φ a ψ se liší pokud tento vztah posuzujeme jednou na množině řádků dané booleovským atributem α a podruhé na množině řádků daných booleovským atributem β. Odlišnost je dána SD4ft-kvantifikátorem ∼.
Lze také říci, že SD4ft-pravidlo α×β:φ∼ψ vyjadřuje, že podmíněná asociační pravidla φ≈ψ/α a φ≈ψ/β se liší způsobem daným SD4ft-kvantifikátorem ∼.
Určení, zda SD4ft-pravidlo α×β:φ∼ψ je pravdivé v matici dat M se provádí na základě SD4ft-tabulky.
Je možno pracovat i s podmíněnými SD4ft-pravidly.
SD4ft-tabulkou SD4ft(α×β:φ∼ψ, M) pro SD4ft-pravidlo α×β:φ∼ψ a matici dat M se rozumí dvojice
‹Tα, Tβ›
4ft-tabulek
Tα = 4ft(φ,ψ,M/α) = ‹aα,bα,cα,dα› a
Tβ = 4ft(φ,ψ,M/β) = ‹aβ,bβ,cβ,dβ›, viz též následující obrázek.
Symbol „∼“ v SD4ft-pravidle α×β:φ∼ψ se nazývá SD4ft-kvantifikátor. Definuje podmínku týkající se čtveřic celých nezáporných čísel Tα = ‹aα,bα,cα,dα› a Tβ = ‹aβ,bβ,cβ,dβ›. Podobně jako pro 4ft-kvantifikátor, chápeme SD4ft-kvantifikátor ∼ jako {0,1}-hodnotovou funkci ∼(Tα, Tβ) týkající se čtveřic celých nezáporných čísel Tα a Tβ. Platí
Příkladem SD4ft-kvantifikátoru je výraz ⇒*1.7,31,69 použitý ve výše uvedeném příkladu. Tomuto SD4ft-kvantifikátoru odpovídá podmínka [aα/(aα+bα)]/[aβ/(aβ+bβ)] ≥ 1.7 ∧ aα ≥ 31 ∧ aβ ≥ 69. Tedy:
SD4ft-kvantifikátory implementované v GUHA proceduře SD4ft-Miner jsou popsány zde.
Pravdivost SD4ft-pravidla α×β:φ∼ψ v matici dat M je definována pomocí SD4ft-tabulky
SD4ft(α×β:φ∼ψ, M) = ‹Tα, Tβ› takto:
Podmíněné SD4ft-pravidlo je výraz α×β:φ∼ψ/χ. Jedná se o SD4ft-pravidlo vyhodnocované v podmatici dat definované booleovským atributem χ. Platí tedy, že podmíněné SD4ft-pravidlo α×β:φ∼ψ/χ je pravdivé v matici dat M pokud je SD4ft-pravidlo α×β:φ∼ψ pravdivé v matici dat M/χ.
To platí, pokud ∼(Tα, Tβ) = 1 kde Tα = 4ft(φ,ψ,M/α∧χ) a Tβ = 4ft(φ,ψ,M/β∧χ).