Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod


Data Hotel

Další data


Typové úlohy




Všechny řešené příklady


Řešené příklady s detaily na wiki

Histogramy na wiki

Asociační pravidla na wiki

Kontingenční tabulky na wiki

Dvojice asociačních pravidel


lm_guha_di_hist_roste_priklad

Histogram roste - příklad

Motivace

V následujícím obrázku je procentuální rozdělení klientů z ČR podle kategorií atributu DHodnoceni. Jedná se o histogram atributu DHodnoceni na matici dat matici dat HotelPlusExterni/HStat(ČR). Vidíme, že 28% hostů je nespokojeno, 44% hostů je průměrně spokojeno a 28% hostů je spokojeno. To je inspirací pro analytickou otázku: Existuje skupina klientů, pro kterou je histogram atributu DHodnocení rostoucí? Pokud ano, můžeme to chápat tak, že v této skupině je rostoucí trend spokojenosti a můžeme to využít v reklamě cílené na takové klienty.

Použijeme složitější zadání skupiny klientů - kombinace atributů PNoci_enum_m, POsob, POsobonoci_ef5, PDenTydne, ze skupiny Pobyt, HPohlavi a HVek_exp ze skupiny Host, H_Cizinec_b, HMesto, HStat ze skupiny Host/Bydliště a atributů MObloha a MTeplota_exp ze skupiny atributů Meteo. Budeme ale chtít, aby tato skupina klientů byla dostatečně veliká. Jako dolní mez pro počet klientů zvolíme 100.

To, že je histogram rostoucí vyjádříme podmínkou na schody v histogramu, viz následující obrázek. Vyjdeme z toho, že atribut DHodnocení má 3 kategorie, které definují dva schody. Chceme, aby histogram byl rostoucí, tedy požadujeme dva schody nahoru. Jako minimální výšku schodu stanovíme 10.

Zadání procedury

Zadání procedury CF-Miner pro řešení výše naznačené úlohy je v následujícím obrázku. Ve sloupci ATRIBUTES FOR HISTOGRAM je uvedeno, že nás zajímá atribut DHodnoceni. Ve sloupci QUANTIFIERS je zadáno, že nás zajímají skupiny nejméně 100 klientů a histogramy se dvěma schody nahoru a s minimální výškou 10.

Ve sloupci CONDITION je zadání relevantních skupin klientů. Je použito zadání množiny relevantních cedentů, obvyklým způsobem jsou použity dílčí cedenty. Zde se jedná o dílčí cedenty Pobyt, Host, Host/Bydliště a Meteo. Jsou použity pouze některé z atributů odpovídajících skupin atributů, viz skupina Pobyt, skupina Host, skupina Host/Bydliště a skupina Meteo. Poznamenejme, že je vícekrát použito zadání koeficientů - sekvencí.

Výsledky

Výsledkem běhu procedury CF-Miner je 17 skupin hostů vyhovujících zadaným podmínkám:

Příkladem je skupina 132 klientů přijíždějících na tři až sedm nocí pokud je teplota neutrální:

Výška prvního schodu je 16 = 33-17, výška druhého schodu je 17 = 50-33.

lm_guha_di_hist_roste_priklad.txt · Poslední úprava: 2018/09/22 16:32 (upraveno mimo DokuWiki)