Uživatelské nástroje

Nástroje pro tento web


Postranní lišta

Úvod

Důležité pojmy

Vztahy, s nimiž procedury pracují

GUHA procedury

GUHA procedury - společné prvky

Observační kalkuly - relevantní výsledky

Důležité tématické okruhy

lm_guha_te_matice

Matice dat a atributy

Vstupem do GUHA procedury je matice dat. Řádky matice dat odpovídají pozorovaným objektům, sloupce vlastnostem pozorovaných objektů. Místo termínu vlastnost se často používá termín atribut. Sloupce matice tedy odpovídají atributům. Abychom odlišili atributy - sloupce matice dat od booleovských atributů, nazýváme je základními atributy. pokud není nebezpečí nedorozumění, používáme pouze pojem atribut místo základní atribut. Předpokládáme, že každý základní atribut má konečně mnoho přípustných hodnot které se nazývají kategorie.

Příklad matice dat

Příkladem matice dat je matice Hotel vycházející ze cvičných dat Hotel naznačená v následujícím obrázku. Matice dat Hotel má 2000 řádků. Přípustné kategorie pro jednotlivé atributy jsou uvedeny v rámci informací o skupinách atributů, do kterých jednotlivé atributy patří. Atributy HVek_ed10 a HPohlavi patří do skupiny atributů Host, atributy HMesto a HStat do skupiny Host/Bydliště, atributy POsob a PTypPobytu do skupiny Pobyt.

Stručnější příklad matice dat je v následujícím obrázku. Jsou zde atributy A1, A2, …, AK s kategoriemi - přirozenými čísly.

Obecný tvar matice dat

Obecný tvar matice dat M obvykle zapisujeme takto: Matice dat Mn řádků o1, …, on a K sloupců - atributů A1, A2, …, AK. Ai(oj) značí hodnotu atributu Ai pro řádek oj, kde i = 1,…,K a j = 1,…,n.

Podmatice matice dat

Podmaticí M/χ matice dat M rozumíme matici dat, která vznikne z M vynecháním všech řádků, které nesplňují booleovský atribut χ. Pokud existuje alespoň jeden řádek matice M splňující χ, pak M/χ je matice dat vytvořená právě ze všech řádků matice M splňujících χ.

Příkladem podmatice dat je matice Hotel/HStat(ČR), která je podmaticí matice dat Hotel. Matice Hotel/HStat(ČR) je tvořena 913 řádky matice dat Hotel splňujícími booleovský atribut HStat(ČR), viz následující obrázek.

lm_guha_te_matice.txt · Poslední úprava: 2020/03/03 15:33 (upraveno mimo DokuWiki)