Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod

Důležité pojmy

Vztahy, s nimiž procedury pracují

GUHA procedury

GUHA procedury - společné prvky

Observační kalkuly - relevantní výsledky

Důležité tématické okruhy

lm_guha_te_sd_pravidlo

SD4ft-pravidlo



Příklad


Příkladem SD4ft-pravidla je výraz
HStat(Slovensko) × HStat(Rakousko): HVek(od 28 do 60)*1.7,31,69 DHodnoceni(nespokojen),
kterému odpovídá výstup procedury SD4ft-Miner uvedený v následujícím obrázku.

Uvedené SD4ft-pravidlo se týká matice dat Hotel. Platí:

  • 4ft(HVek(od 28 do 60), DHodnoceni(nespokojen), Hotel/HStat(Slovensko)) = ‹31,44,22,48›,
    tedy konfidence podmíněného pravidla
    4ft(HVek(od 28 do 60)DHodnoceni(nespokojen) / HStat(Slovensko) = 31/(31+44) = 0.41.
    Jinými slovy, podíl nespokojených hostů ve věku od 28 do 60 je pro Slovensko roven 41 %.
  • 4ft(HVek(od 28 do 60), DHodnoceni(nespokojen), Hotel/HStat(Rakousko)) = ‹69,216,59,171›,
    tedy konfidence podmíněného pravidla
    4ft(HVek(od 28 do 60)DHodnoceni(nespokojen) / HStat(Rakousko) = 69/(69+216) = 0.24.
    Jinými slovy, podíl nespokojených hostů ve věku od 28 do 60 je pro Rakousko roven 24 %.
  • Podíl nespokojených hostů ve věku od 28 do 60 je pro Slovensko 41/24 = 1.7 krát větší než pro Rakousko a zároveň je 31 nespokojených hostů ze Slovenska a 69 nespokojených hostů z Rakouska ve věku od 28 do 60.

Tento fakt je vyjádřen výše uvedeným SD-pravidlem
HStat(Slovensko) × HStat(Rakousko): HVek(od 28 do 60)*1.7,31,69 DHodnoceni(nespokojen).

SD4ft-pravidlo

SD4ft-pravidlo je výraz α×β:φ∼ψ kde

Booleovský atribut φ se nazývá antecedent, ψ je sukcedent (konsequent), α je definice první množiny a β je definice druhé množiny.

SD4ft-pravidlo α×β:φ∼ψ říká, že vztah booleovských atributů φ a ψ se liší pokud tento vztah posuzujeme jednou na množině řádků dané booleovským atributem α a podruhé na množině řádků daných booleovským atributem β. Odlišnost je dána SD4ft-kvantifikátorem ∼.

Lze také říci, že SD4ft-pravidlo α×β:φ∼ψ vyjadřuje, že podmíněná asociační pravidla φ≈ψ/α a φ≈ψ/β se liší způsobem daným SD4ft-kvantifikátorem ∼.

Určení, zda SD4ft-pravidlo α×β:φ∼ψ je pravdivé v matici dat M se provádí na základě SD4ft-tabulky.

Je možno pracovat i s podmíněnými SD4ft-pravidly.

SD4ft-tabulka

SD4ft-tabulkou SD4ft(α×β:φ∼ψ, M) pro SD4ft-pravidlo α×β:φ∼ψ a matici dat M se rozumí dvojice ‹Tα, Tβ
4ft-tabulek Tα = 4ft(φ,ψ,M/α) = ‹aα,bα,cα,dα› a Tβ = 4ft(φ,ψ,M/β) = ‹aβ,bβ,cβ,dβ›, viz též následující obrázek.

SD4ft-kvantifikátor

Symbol „∼“ v SD4ft-pravidle α×β:φ∼ψ se nazývá SD4ft-kvantifikátor. Definuje podmínku týkající se čtveřic celých nezáporných čísel Tα = ‹aα,bα,cα,dα› a Tβ = ‹aβ,bβ,cβ,dβ›. Podobně jako pro 4ft-kvantifikátor, chápeme SD4ft-kvantifikátor ∼ jako {0,1}-hodnotovou funkci ∼(Tα, Tβ) týkající se čtveřic celých nezáporných čísel Tα a Tβ. Platí

  • ∼(Tα, Tβ) = 1 pokud je podmínka daná SD4ft-kvantifikátorem splněna pro čtveřice Tα a Tβ
  • ∼(Tα, Tβ) = 0 pokud podmínka daná SD4ft-kvantifikátorem pro čtveřice Tα a Tβ splněna není.

Příkladem SD4ft-kvantifikátoru je výraz ⇒*1.7,31,69 použitý ve výše uvedeném příkladu. Tomuto SD4ft-kvantifikátoru odpovídá podmínka [aα/(aα+bα)]/[aβ/(aβ+bβ)] ≥ 1.7 ∧ aα ≥ 31 ∧ aβ ≥ 69. Tedy:

  • *1.7,31,69 (Tα, Tβ) = 1 pokud platí [aα/(aα+bα)]/[aβ/(aβ+bβ)] ≥ 1.7 ∧ aα ≥ 31 ∧ aβ ≥ 69
  • *1.7,31,69 (Tα, Tβ) = 0 pokud neplatí [aα/(aα+bα)]/[aβ/(aβ+bβ)] ≥ 1.7 ∧ aα ≥ 31 ∧ aβ ≥ 69 .

SD4ft-kvantifikátory implementované v GUHA proceduře SD4ft-Miner jsou popsány zde.

SD4ft-pravidlo je pravdivé v matici dat

Pravdivost SD4ft-pravidla α×β:φ∼ψ v matici dat M je definována pomocí SD4ft-tabulky
SD4ft(α×β:φ∼ψ, M) = ‹Tα, Tβ› takto:

  • α×β:φ∼ψ je pravdivé v matici dat M pokud ∼(Tα, Tβ) = 1, formálně zapisujeme Val(α×β:φ∼ψ, M = 1
  • α×β:φ∼ψ je nepravdivé v matici dat M pokud ∼(Tα, Tβ) = 1, formálně zapisujeme Val(α×β:φ∼ψ, M) = 0.

Podmíněné SD4ft-pravidlo

Podmíněné SD4ft-pravidlo je výraz α×β:φ∼ψ/χ. Jedná se o SD4ft-pravidlo vyhodnocované v podmatici dat definované booleovským atributem χ. Platí tedy, že podmíněné SD4ft-pravidlo α×β:φ∼ψ/χ je pravdivé v matici dat M pokud je SD4ft-pravidlo α×β:φ∼ψ pravdivé v matici dat M/χ.

To platí, pokud ∼(Tα, Tβ) = 1 kde Tα = 4ft(φ,ψ,M/α∧χ) a Tβ = 4ft(φ,ψ,M/β∧χ).

lm_guha_te_sd_pravidlo.txt · Poslední úprava: 2020/03/14 19:39 (upraveno mimo DokuWiki)