====== Asociační pravidla - příklady aplikací procedury 4ft-Miner  ======


Dále jsou uvedeny příklady aplikací procedury [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_4ft_proc|4ft-Miner]]. Procedura pracuje s [[https://lispminer.vse.cz/guhate/doku.php?id=lm_guha_te_pravidlo|GUHA asociačními pravidly]], která jsou obecnější než asociační pravidla poskytovaná algoritmem apriori. 
Jsou k dispozici jak [[lm_guha_di_typul_4ft#Příklady popsané ve wiki LISp-Miner a v této wiki |příklady popsané na stránkách wiki LISp-Miner a této wiki]], tak i [[lm_guha_di_typul_4ft#Příklady popsané v souborech pdf|příklady popsané v souborech pdf]] na které je z této wiki odkazováno.

Piktogramy u jednotlivých příkladů naznačují, které z [[lm_guha_di_typy_uloh_procedury#4ft-Miner, asociační pravidla|typových úloh]] jednotlivé příklady řeší.

===== Příklady popsané ve wiki LISp-Miner a v této wiki =====

**Příklad 1** - {{:4ft_miner_vysoka_konfidence_podminene.png?70}} 
[[https://lispminer.vse.cz/wiki/doku.php?id=lmdemo:hotel2015:task:ft|Vyplývají z místa bydliště hosta nějaké typické parametry pobytu, případně i počasí? A to obecně i zvlášť pro rekreační a služební pobyty.]] 
uvedený  ve wiki [[https://lispminer.vse.cz/wiki/doku.php|Systém LISp-Miner]].  

**Příklad 2** - {{:4ft_miner_vysoka_konfidence.png?50}}  [[lm_guha_di_ar_konf_priklad|Pravidla s vysokou konfidencí]], k tomuto  příkladu je k dispozici i [[lm_guha_di_ar_konf_obecne|obecný postup pro řešení úloh stejného typu]].

**Příklad 3** - {{:4ft_miner_vysoky_lift.png?50}} [[lm_guha_di_ar_aa_priklad|Nárůst relativní četnosti]], k tomuto  příkladu je k dispozici i [[lm_guha_di_ar_aa_obecne|obecný postup pro řešení úloh stejného typu]].


**Příklad 4** - [[lm_guha_di_ar_hist_base_supp|4ft-kvantifikátory BASE a support]]. 

===== Příklady popsané v souborech pdf =====

Příklady popsané v souborech pdf jsou rozděleny do skupin podle toho, jaké typy úloh řeší. Piktogramy naznačují dílčí typy úloh.   Příklady jsou rozděleny do několika skupin: 

  * [[lm_guha_di_typul_4ft#Asociační pravidla s vysokou konfidencí nebo liftem|Asociační pravidla s vysokou konfidencí nebo liftem]] 
  * [[lm_guha_di_typul_4ft#Asociační pravidla - výjimky z histogramu|Asociační pravidla - výjimky z histogramu]] 
  * [[lm_guha_di_typul_4ft#Podmíněná asociační pravidla|Podmíněná asociační pravidla]]  
  * [[lm_guha_di_typul_4ft#Výrazná změna liftu prodloužením antecedentu|Výrazná změna liftu prodloužením antecedentu]]  
  * [[lm_guha_di_typul_4ft#Porovnání procedury 4ft-Miner a arules package v R|Porovnání procedury 4ft-Miner a arules package v R]]  
  * [[lm_guha_di_typul_4ft#Práce s doménovou znalostí a automatizace|Práce s doménovou znalostí a automatizace]].   

===== Asociační pravidla s vysokou konfidencí nebo liftem  =====

====  Data Hotel - vysoká konfidence ====
{{:4ft_miner_vysoka_konfidence.png?50 |}}  Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém:
//Vyplývají z místa bydliště hosta nějaké typické parametry pobytu, případně i počasí?// Příklad je podobný příkladu 2. Podrobnosti k příkladu jsou {{ :4ft_01_hotel_konfidence.pdf |zde}}.    


====  Data Stulong - vysoký lift ====
{{:4ft_miner_vysoky_lift.png?50}} Příklad se týká dat [[lm_guha_di_stulong|Stulong]] a řeší problém:
//Existuje skupina pacientů definovaná pomocí osobních údajů, spotřeby alkoholu, cukru, kávy a čaje taková, že relativní četnost pacientů s rizikem obezity je v této skupině o 50 % větší než v celém souboru a zároveň počet pacientů ze skupiny s rizikem obezity je minimálně 30? // Podrobnosti k příkladu jsou {{ :4ft_03_stulong_above_average.pdf |zde}}.    


====  Data Traffic Maryland - využití disjunkcí 1 ====
{{:4ft_miner_vyuziti_disjunkci.png?120 |}} Příklad se týká dat [[lm_guha_di_traffic_maryland|Traffic Maryland]]  a řeší problém: //Jací řidiči vykazují velkou pravděpodobnost nějaké chyby spojené s vážnou nehodou? // Podrobnosti k příkladu jsou {{ :4ft_04_traffic_vyuziti_disjunkci_1.pdf |zde}}. 

====  Data Traffic Maryland - využití disjunkcí 2 ====
{{:4ft_miner_vyuziti_disjunkci.png?120 |}} Příklad se týká dat [[lm_guha_di_traffic_maryland|Traffic Maryland]]  a řeší problém: //Jací řidiči mají za špatného počasí velkou pravděpodobnost  vážné nehody? // Podrobnosti k příkladu jsou {{ :4ft_05_traffic_vyuziti_disjunkci_2.pdf |zde}}. 

===== Asociační pravidla - výjimky z histogramu =====

====  Data Insolvency - konfidence nižší,  než odpovídá sloupci histogramu na celé matici dat ====
{{:4ft_miner_konfidence_nizsi_nez_sloupec.png?100 |}}
Příklad se týká dat [[lm_guha_di_insolvency|Insolvency]] a řeší problém:
//Hledáme pravidla φ → Days_to_start(a<sub>i</sub>) taková, že jejich konfidence je alespoň  čtyřikrát nižší, než odpovídá výšce sloupce a<sub>i</sub> v histogramu na celé matici dat. // Podrobnosti k příkladu jsou 
{{ :4ft_06_insolvency_vyjimky_z_obecneho_histogramu.pdf |zde. }}


====  Data Hotel - konfidence vyšší,  než odpovídá sloupci histogramu na  podmatici dat ====
{{:4ft_miner_konfidence_vyssi_nez_sloupec.png?100 |}}
Příklad se týká dat [[lm_guha_di_insolvency|Insolvency]] a řeší problém:
//Hledáme pravidla φ → Days_to_start(a<sub>i</sub>) taková, že jejich konfidence je alespoň dvakrát vyšší, než odpovídá výšce sloupce a<sub>i</sub> v histogramu na dané podmatici dat. // Podrobnosti k příkladu jsou {{ :4ft_07_insolvency_vyjimky_z_podmineneho_histogramu.pdf |zde}}.  


===== Podmíněná asociační pravidla =====

====  Data Hotel - fundovaná vysoká konfidence, podmíněná pravidla ====
{{:4ft_miner_vysoka_konfidence_podminene.png?70}}Příklad se týká dat [[lm_guha_di_hotel_prehled_skupin|Hotel]] a řeší problém:
//Vyplývají z místa bydliště hosta nějaké typické parametry pobytu, případně i počasí? A to obecně i zvlášť pro rekreační a služební pobyty. // Příklad je inspirován příkladem 1. Podrobnosti k příkladu jsou {{ :4ft_02_hotel_konfidence_podminena_pravidla.pdf |zde}}. 

====  Data Hotel - vysoká konfidence se supportem, podmíněná pravidla ====
BUDE DOPLŇENO 


====  Data Hotel - vysoký lift, podmíněná pravidla ====
BUDE DOPLŇENO 

===== Výrazná změna liftu prodloužením antecedentu ===== 

==== Data Accidents - snížení hodnoty liftu pod hodnotu 1 prodloužením antecedentu ==== 
{{:sd4ft_miner_snizeni_liftu.png ?80|}}Příklad se týká dat [[lm_guha_di_accidents|Accidents]] a problému: Existuje podmínka P, dodatečná podmínka D a závažnost Z nehody takové, že zároveň platí: 
  * relativní četnost nehod se závažností Z za podmínky P je vyšší než relativní četnost poruch se závažnosti Z mezi všemi nehodami 
  * relativní četnost nehod se závažností Z je za současné platnosti podmínky P i dodatečné podmínky D nižší, než je relativní četnost nehod se závažnosti Z mezi všemi nehodami? 
Podrobnosti k příkladu jsou {{ :4ft_13_accidents_below_average_jako_vyjimka.pdf |zde}}. 
===== Porovnání procedury 4ft-Miner a arules package v R =====

V rámci porovnání procedury 4ft-Miner a [[https://cran.r-project.org/web/packages/arules/index.html|arules package v R]] je nejprve řešena [[lm_guha_di_typul_4ft#Data Adult - stejná úloha ve 4ft-Miner a v arules|stejná úloha]] jak pomocí procedury 4ft-Miner, tak pomocí arules package v systému R. [[lm_guha_di_typul_4ft#Data Adult - využití koeficientů|Další příklad]] ukazuje, že pomocí koeficientů základních booleovských atributů lze procedurou 4ft-Miner řešit úlohy, které prakticky nelze řešit v arules. V [[lm_guha_di_typul_4ft#Data Adult - chybějící informace|posledním příkladu]] je porovnán přístup k neúplné informaci v GUHA proceduře 4ft-Miner a v arules.  

Podrobnější informace jsou v článku [[https://content.iospress.com/articles/intelligent-data-analysis/ida160069|Apriori and GUHA – Comparing two approaches to data mining with association rules]].

====  Data Adult - stejná úloha ve 4ft-Miner a v arules ====
{{:4ft_miner_porovnani_s_arules.png?100 |}} Příklad se týká dat [[lm_guha_di_adult|Adult]] a řeší problém: //Nalézt  všechna asociační pravidla  X → Y  tak, že 
conf (X  → Y) ≥ 0.95  a  sup(X → Y) ≥ 0.45. 
 // Podrobnosti k příkladu jsou {{ :4ft_08_adult_stejna_uloha.pdf |zde}}.  


====  Data Adult - využití koeficientů  ====
{{:4ft_miner_porovnani_s_arules.png?100 |}} Příklad se týká dat [[lm_guha_di_adult|Adult]] a řeší problémy: //Hledání segmentů osob s extrémními hodnotami zisku// a // Hledání segmentů osob s extrémními hodnotami zisku a zároveň s vysokým příjmem. // Podrobnosti k příkladu jsou {{ :4ft_09_adult_vyuziti_koeficientu.pdf |zde}}.  


====  Data Adult - chybějící informace ====
{{:4ft_miner_porovnani_s_arules.png?100 |}} Příklad se týká dat [[lm_guha_di_adult|Adult]] a řeší problém: //Porovnání práce s neúplnou informací v GUHA proceduře 4ft-Miner a v arules package který je součástí systému R. // Podrobnosti k příkladu jsou {{ :4ft_10_adult_missings_porovnani_s_r.pdf |zde}}.  


===== Práce s doménovou znalostí a automatizace =====
====  Data Stulong - automatické odfiltrování důsledků doménové znalosti ====
{{:4ft_miner_domenova_znalost.png?100 |}}
 Příklad se týká dat [[lm_guha_di_stulong|Stulong]] a řeší problém: //Automatické odfiltrování asociačních pravidel -důsledků doménové znalosti. // Podrobnosti k příkladu jsou {{ :4ft_11_stulong_domenove_znalosti_odfiltrovani_dusledku.pdf |zde}}. Další informace jsou v článku  [[https://link.springer.com/chapter/10.1007/978-3-319-09870-8_20|Learning Association Rules from Data through Domain Knowledge and Automation]]. 
====  Data Adult - využití expertních dedukčních pravidel ====
{{:4ft_miner_domenova_znalost.png?100 |}} Příklad se týká dat [[lm_guha_di_adult|Adult]] a řeší problém: //Definice a využití expertních pravidel pro odfiltrování nezajímavých asociačních pravidel. // Podrobnosti k příkladu jsou zde BUDE DOPLŇENO.  Další informace jsou v článku [[https://link.springer.com/article/10.1007/s10115-018-1206-x|Expert deduction rules in data mining with association rules: a case study]].