Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_ar_konf_priklad

Pravidla s vysokou konfidencí - příklad

Motivace

Data Hotel zahrnují mimo jiné údaje o hostech, jejich bydlišti, pobytech v hotelu, o ceně pobytu i o spokojenosti hostů s pobytem. Lze tedy formulovat analytickou otázku: Jaké charakteristiky hostů, jejich bydliště a začátků jejich pobytů vedou s vysokou pravděpodobností ke spokojenosti nebo naopak k nespokojenosti hostů a jaká je cena těchto pobytů? Tuto otázku lze formulovat i tak, že nás zajímají asociační pravidla kde

  • Host(?) je booleovský atribut vhodně charakterizující hosty. Je vytvořen z atributů HPohlavi a HVek_exp ze skupiny Host. V zadání procedury odpovídá dílčímu cedentu Host.
  • Host/Bydliště(?) je booleovský atribut vhodně charakterizující bydliště hosta. Je vytvořen z atributů H_Cizinec_b, HMesto, HStat ze skupiny Host/Bydliště. V zadání procedury odpovídá dílčímu cedentu Host/Bydliště.
  • Pobyt/Začátek(?) je booleovský atribut vhodně charakterizující začátek pobytu hosta. Je vytvořen z atributů PDenTydne, PMesic, PRok, PSezona_b, PVikend_b ze skupiny atributů Pobyt/Začátek. V zadání procedury odpovídá dílčímu cedentu Pobyt/Začátek.
  • je 4ft-kvantifikátor fundované implikace říkající, že nás zajímají pravidla s konfidencí minimálně 0.8 a taková, že nejméně 50 pobytů splňuje jak Pobyt(?) tak podmínku na pravé straně pravidla
  • DHodnoceni(?) je booleovský atribut DHodnoceni(nespokojen,průměr) nebo DHodnoceni(průměr, spokojen) vytvořený z atributu DHodnoceni jako literál s koeficientem Řezy délky 1 až 2
  • PCenaCelkem_ef5(?) je booleovský atribut vytvořený jako literál s koeficientem Posloupnosti délky 1 až 2 z atributu PCenaCelkem_ef5.

Zadání procedury

Zadání procedury 4ft-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. Ve sloupci ANTECEDENT je uvedeno zadání relevantních booleovských atributů Host(?) ∧ Host/Bydliště(?) ∧ Pobyt/Začátek(?), zadává se jako množina relevantních cedentů.

Ve sloupci QUANTIFIERS je zadáno, že nás zajímají pravidla s konfidencí minimálně 0.8 a zároveň taková, že nejméně 50 pobytů splňuje jak antecedent tak sukcedent.

Ve sloupci SUCCEDENT je uvedeno zadání pravé strany pravidla. Používá se zadání množiny relevantních cedentů, stejně jako pro sloupec ANTECEDENT.

Výsledky

Výsledkem běhu procedury 4ft-Miner je osm pravidel vyhovujících zadaným podmínkám:

Nejsilnější a zároveň nejkratší je druhé pravidlo:

Detailní výstup čtyřpolní tabulky je zde:

Konfidence tohoto asociačního pravidla je 0.96

lm_guha_di_ar_konf_priklad.txt · Poslední úprava: 2019/09/23 15:47 (upraveno mimo DokuWiki)