Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_hist_klesa_priklad

Histogram klesá - příklad

Motivace

V následujícím obrázku je procentuální rozdělení klientů z ČR podle kategorií atributu DHodnoceni. Jedná se o histogram atributu DHodnoceni na matici dat matici dat HotelPlusExterni/HStat(ČR). Vidíme, že 28% hostů je nespokojeno, 44% hostů je průměrně spokojeno a 28% hostů je spokojeno. To je inspirací pro analytickou otázku: Existuje skupina klientů, pro kterou je histogram atributu DHodnocení klesající? Pokud ano, můžeme to chápat tak, že v této skupině je klesající trend spokojenosti a je třeba to využít k nápravným opatřením.

Použijeme složitější zadání skupiny klientů - kombinace atributů PNoci_enum_m, POsob, POsobonoci_ef5, PDenTydne, ze skupiny Pobyt, HPohlavi a HVek_exp ze skupiny Host, H_Cizinec_b, HMesto, HStat ze skupiny Host/Bydliště a atributů MObloha a MTeplota_exp ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 100.

To, že je histogram klesající vyjádříme podmínkou na schody v histogramu, viz následující obrázek. Vyjdeme z toho, že atribut DHodnocení má 3 kategorie, které definují dva schody. Chceme, aby histogram byl klesající, tedy požadujeme dva schody dolů. Jako minimální výšku schodu stanovíme 10.

Zadání procedury

Zadání procedury CF-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. Ve sloupci ATRIBUTES FOR HISTOGRAM je uvedeno, že nás zajímá atribut DHodnoceni. Ve sloupci QUANTIFIERS je zadáno, že nás zajímají skupiny nejméně 100 klientů a histogramy s dvěma schody dolů a s minimální výškou 10.

Ve sloupci CONDITION je zadání relevantních skupin klientů. Je použito zadání množiny relevantních cedentů, obvyklým způsobem jsou použity dílčí cedenty. Zde se jedná o dílčí cedenty Pobyt, Host, Host/Bydliště a Meteo. Jsou použity pouze některé z atributů odpovídajících skupin atributů, Jsou použity pouze některé z atributů odpovídajících skupin atributů, viz skupina Pobyt, skupina Host, skupina Host/Bydliště a skupina Meteo. Poznamenejme, že je vícekrát použito zadání koeficientů - sekvencí.

Výsledky

Výsledkem běhu procedury CF-Miner je 36 skupin hostů vyhovujících zadaným podmínkám: Příkladem je skupina 139 klientů přijíždějících na nejvyšší počet osobonocí pokud jsou srážky: Výška prvního schodu je 15 = 66-51, výška druhého schodu je 29 = 51-22.

lm_guha_di_hist_klesa_priklad.txt · Poslední úprava: 2018/09/22 16:21 (upraveno mimo DokuWiki)