====== SDKL-vztah kategoriálních atributů ======
\\
===== Příklad =====
SDKL-vztah se týká dvou kategoriálních atributů R a C a dvou podmatic matice dat.
Příkladem SDKL-vztahu je vztah kategoriálních atributů DHodnoceni a DPersonal vyjádřený SDKL-výrazem \\
**HMesto(//Bratislava//)** x **HMesto(//Plzeň//)**: **DHodnoceni** ≈ **PCenaCelkem** / **PTypPobytu(//rekreační//)**, \\
kde symbol ≈ značí SDKL-kvantifikátor [TauB1 ≥ 0.59,TauB2 ≤ -0.59, SUM1 ≥ 58, SUM2 ≥ 51]. Tomuto SDKL-výrazu odpovídá následující obrázek vytvořený z výstupu procedury SDKL-Miner.
{{:sdkl_priklad.png|}}
Uvedený SDKL-vztah se týká matice dat [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hotel_prehled_skupin|Hotel]]. Platí:
* SDKL-vztah se týká atributu [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hotel_dotaznik#atribut_dhodnoceni|DHodnoceni]] s kategoriemi s kategoriemi //nespokojen//, //průměr//, //spokojen// a atributu [[https://lispminer.vse.cz/guhadi/doku.php?id=lm_guha_di_hotel_pobyt_cena#atribut_pcenacelkem_ef3|PCenaCelkem_ef3]] dále označovaného pouze jako **PCenaCelkem** s kategoriemi //nižší//, //průměr//, //vyšší//.
* SDKL vztah se týká podmatic **Hotel / PTypPobytu(//rekreační//) ∧ HMesto(//Bratislava//)** a **Hotel / PTypPobytu(//rekreační//) ∧ HMesto(//Plzeň//)** říká, že vztah atributů **PCenaCelkem** a **DHodnocení** se na těchto podmaticích.
* To lze chápat také tak, že SDKL vztah se týká podmatice **Hotel / PTypPobytu(//rekreační//)** a říká, že vztah atributů **PCenaCelkem** a **DHodnocení** se na této podmatici liší pokud uvažujeme zvlášť hosty z Bratislavi a zvlášť hosty z Plzně.
* Pokud uvažujeme hosty z Bratislavy, tak je vztah atributů **PCenaCelkem** a **DHodnocení** charakterizován Kendallovým koeficientem TauB = 0.59, pro Plzeň to je - 0.59. Z Bratislavy přijelo 58 hostů, z Plzně 51. Podrobnosti viz tabulky a sloupcové grafy v obrázku.
* Lze říci, že pro Bratislavu je mezi atributy pozitivní pořadová korelace, pro Plzeň je to negativní pořadová korelace.
* Výše uvedené je vyjádřeno SDKL-vztahem \\ **HMesto(//Bratislava//)** x **HMesto(//Plzeň//)**: **DHodnoceni** ≈ **PCenaCelkem /PTypPobytu(rekreační)**, \\ který platí pro matici dat **Hotel** a symbol ≈ značí SDKL-kvantifikátor \\ [TauB1 ≥ 0.59,TauB2 ≤ -0.59, SUM1 ≥ 58, SUM2 ≥ 51].
===== SDKL-vztah a SDKL-výraz =====
SDKL-vztah se týká dvou kategoriálních atributů R a C a dvou podmatic matice dat. Vyjadřuje se SDKL-výrazem
α×β: **R**≈**C**/χ kde
* α,β,χ jsou [[lm_guha_te_bool|booleovské atributy]]
* R,C jsou [[lm_guha_te_matice|kategoriální atributy]]
* ≈ je [[lm_guha_te_tabulka_2#SDKL-kvantifikátor|SDKL-kvantifikátor]]
SDKL-vztah α×β: **R**≈**C**/χ je určen pro vyjádření rozdílu mezi vztahy kategoriálních atributů **R** a **C** na podmaticích daných booleovskými atributy α∧χ a β∧χ. Pro popis tohoto rozdílu se používá [[lm_guha_te_tabulka_2#SDKL-tabulka|SDKL-tabulka]] a [[lm_guha_te_tabulka_2#SDKL-kvantifikátor|SDKL-kvantifikátor]].
Podmatice **M/α∧χ** matice **M** je totéž jako podmatice **(M/α)/χ** matice **M/α**, analogicky pro **M/β∧χ**.
Rozdíl mezi vztahy kategoriálních atributů R a C na podmaticích **M/α∧χ** a **M/β∧χ** matice **M** je tedy totéž jako
rozdíl mezi vztahy atributů **R** a **C** za podmínky χ na podmaticích **M/α** a **M/β**.
Výrazy //SDKL-vztah// a //SDKL-výraz// se obvykle používají jako synonyma.
===== SDKL-tabulka =====
SDKL-tabulkou SDKL(**R**,**C**,α,β,**M/χ**) pro SDKL-vztah α×β: **R**≈**C**/χ a matici dat **M** rozumíme dvojici [[lm_guha_te_tabulka#KL-tabulka a podmíněná KL-tabulka|KL-tabulek]] \\ ‹ TKLα, TKLβ › kde
TKLα = KL(**R**,**C**,**M/χ∧α**) a TKLβ = KL(**R**,**C**,**M/χ∧β**), viz též následující obrázek.
{{ :sdkl_tabulka.png?600 |}}
===== SDKL-kvantifikátor =====
Symbol "≈" v SDKL-vztahu α×β: **R**≈**C**/χ se nazývá SDKL-kvantifikátor. Definuje podmínku týkající se
dvojice \\ ‹ {uα,i,j}, {uβ,i,j} › matic celých nezáporných čísel
o K řádcích a L sloupcích.
Podobně jako pro [[lm_guha_te_pravidlo#4ft-kvantifikátor|4ft-kvantifikátor]], chápeme i
SDKL-kvantifikátor ≈ jako {0,1}-hodnotovou funkci ≈({uα,i,j}, {uβ,i,j}).
Platí
* ≈({uα,i,j}, {uβ,i,j}) = 1 pokud je podmínka daná SDKL-kvantifikátorem ≈ splněna pro matice {uα,i,j} a {uβ,i,j}
* ≈({uα,i,j}, {uβ,i,j}) = 0 pokud podmínka daná SDKL-kvantifikátorem ≈ pro matice {uα,i,j} a {uβ,i,j} splněna není.
SDKL-kvantifikátory implementované v GUHA proceduře SDKL-Miner jsou popsány [[lm_guha_te_sdkl_kvantifikator|zde]].
===== SDKL-vztah platí v matici dat =====
Platnost SDKL-vztahu α×β: **R**≈**C**/χ v matici dat **M** je definována pomocí SDKL-tabulky
‹ TKLα, TKLβ › takto:
* α×β: **R**≈**C**/χ platí v matici dat **M** pokud ≈(TKLα, TKLβ) = 1, formálně zapisujeme Val(α×β: **R**≈**C**/χ, **M**) = 1
* α×β: **R**≈**C**/χ neplatí v matici dat **M** pokud ≈(TKLα, TKLβ) = 0, formálně zapisujeme \\ Val(α×β: **R**≈**C**/χ, **M**) = 0.