Podcast
Questions and Answers
Jaká je absolutní četnost kategorie 3 ve frekvenční tabulce?
Jaká je absolutní četnost kategorie 3 ve frekvenční tabulce?
- 20
- 130 (correct)
- 40
- 10
Jaký je procentní podíl kategorie 2?
Jaký je procentní podíl kategorie 2?
- 65.0%
- 5.0%
- 10.0%
- 20.0% (correct)
Co je důsledkem srovnání absolutních čísel mezi skupinami s různým počtem pacientů?
Co je důsledkem srovnání absolutních čísel mezi skupinami s různým počtem pacientů?
- Je to zavádějící vizualizace dat. (correct)
- Vždy vede k reálným závěrům.
- Může být zavádějící pouze v určitých případech.
- Je to korektní přístup.
Jaký je celkový počet respondentů uvedený ve frekvenční tabulce?
Jaký je celkový počet respondentů uvedený ve frekvenční tabulce?
Jaké jsou relativní četnosti pro kategorii 1?
Jaké jsou relativní četnosti pro kategorii 1?
Kolik pacientů bylo zařazeno do kategorie 4?
Kolik pacientů bylo zařazeno do kategorie 4?
Jaký má kategorie 3 podíl na celkovém počtu respondentů?
Jaký má kategorie 3 podíl na celkovém počtu respondentů?
Jaká frekvenční tabulka se používá pro kvantitativní data?
Jaká frekvenční tabulka se používá pro kvantitativní data?
Jaký typ dat nelze vzájemně seřadit?
Jaký typ dat nelze vzájemně seřadit?
Která z následujících datových kategorií se ptá na relaci větší/menší?
Která z následujících datových kategorií se ptá na relaci větší/menší?
Jaký typ kvalitativních dat zahrnuje pouze dvě kategorie?
Jaký typ kvalitativních dat zahrnuje pouze dvě kategorie?
Která datová kategorie poskytuje větší informaci než ostatní?
Která datová kategorie poskytuje větší informaci než ostatní?
Co je považováno za příklad ordinálních dat?
Co je považováno za příklad ordinálních dat?
Co se stane při agregaci kvantitativních dat do kategorií?
Co se stane při agregaci kvantitativních dat do kategorií?
Jaká je charakteristika diskrétních dat?
Jaká je charakteristika diskrétních dat?
Jaká měření představuje procento v biostatistice?
Jaká měření představuje procento v biostatistice?
Jaký je průměr známek studenta A?
Jaký je průměr známek studenta A?
Jaký je medián známek studenta B?
Jaký je medián známek studenta B?
Co reprezentuje dolní kvartil ve statistice?
Co reprezentuje dolní kvartil ve statistice?
Jaký je vzorec pro určení 80% kvantilu, když n = 20?
Jaký je vzorec pro určení 80% kvantilu, když n = 20?
Jaká je charakteristika mediánu v kontextu vypovídající schopnosti údajů?
Jaká je charakteristika mediánu v kontextu vypovídající schopnosti údajů?
Jaký je vzorec pro výpočet rozsahu hodnot?
Jaký je vzorec pro výpočet rozsahu hodnot?
Jaká je významná vlastnost kvantilů v neparametrických metodách?
Jaká je významná vlastnost kvantilů v neparametrických metodách?
Jaký je průměr platů v ČR v roce 2003?
Jaký je průměr platů v ČR v roce 2003?
Jaká je značka pro maximum pozorovaných hodnot?
Jaká je značka pro maximum pozorovaných hodnot?
Co je to medián?
Co je to medián?
Jak se vypočítá medián pro sudý počet hodnot?
Jak se vypočítá medián pro sudý počet hodnot?
Kdy je výpočet průměru nevhodný?
Kdy je výpočet průměru nevhodný?
Jaká je hlavní odlišnost mezi průměrem a mediánem?
Jaká je hlavní odlišnost mezi průměrem a mediánem?
Jakou hodnotu má medián z následujícího souboru dat: 2, 3, 3, 5, 7?
Jakou hodnotu má medián z následujícího souboru dat: 2, 3, 3, 5, 7?
Co vypovídá o průměru a mediánu, pokud jsou hodnoty symetrické?
Co vypovídá o průměru a mediánu, pokud jsou hodnoty symetrické?
Jak se postaví pozice mediánu v případě lichého počtu hodnot?
Jak se postaví pozice mediánu v případě lichého počtu hodnot?
Jaké jsou vlastnosti kvartilového rozpětí?
Jaké jsou vlastnosti kvartilového rozpětí?
Jaká je definice výběrového rozptylu?
Jaká je definice výběrového rozptylu?
Jaký je vztah mezi výběrovou směrodatnou odchylkou a výběrovým rozptylem?
Jaký je vztah mezi výběrovou směrodatnou odchylkou a výběrovým rozptylem?
Jakým způsobem může být rozptyl ovlivněn odlehlými pozorováními?
Jakým způsobem může být rozptyl ovlivněn odlehlými pozorováními?
Co z následujícího představuje modus?
Co z následujícího představuje modus?
Jaký typ grafu je nejlepší pro vizualizaci nominálních dat?
Jaký typ grafu je nejlepší pro vizualizaci nominálních dat?
Jaké informace může poskytnout frekvenční tabulka?
Jaké informace může poskytnout frekvenční tabulka?
Jaká je výhoda směrodatné odchylky oproti rozptylu?
Jaká je výhoda směrodatné odchylky oproti rozptylu?
Co charakterizuje míru pravděpodobnosti?
Co charakterizuje míru pravděpodobnosti?
Jaké informace poskytuje skóre?
Jaké informace poskytuje skóre?
Proč může být relativní vyjádření účinnosti zavádějící?
Proč může být relativní vyjádření účinnosti zavádějící?
Co charakterizuje cenzorovaná data?
Co charakterizuje cenzorovaná data?
Jaké jsou rozdíly mezi relativní a absolutní změnou účinnosti?
Jaké jsou rozdíly mezi relativní a absolutní změnou účinnosti?
Jak lze vizuální škálu nejlépe charakterizovat?
Jak lze vizuální škálu nejlépe charakterizovat?
Jaký je význam absolutní a relativní četnosti?
Jaký je význam absolutní a relativní četnosti?
Co může být problémem při interpretaci relativní účinnosti léčiva?
Co může být problémem při interpretaci relativní účinnosti léčiva?
Flashcards
Míra pravděpodobnosti (rate)
Míra pravděpodobnosti (rate)
Míra výskytu určitého onemocnění, kde počet nových pacientů v daném čase (studie) je vztažen k celkovému počtu zaznamenaných osobo-roků.
Ordinální data
Ordinální data
Data, která lze rozdělit do více kategorií, které se dají uspořádat podle pořadí. Má smysl se ptát na relaci větší/menší. Příklady: stupeň bolesti, spotřeba cigaret.
Nominální data
Nominální data
Data, která lze rozdělit do více kategorií, ale nelze je uspořádat podle pořadí. Nemá smysl ptát se na relaci větší/menší. Příklady: krevní skupiny, stát EU.
Skóre (score)
Skóre (score)
Signup and view all the flashcards
Vizuální škála (visual scale)
Vizuální škála (visual scale)
Signup and view all the flashcards
Binární data
Binární data
Signup and view all the flashcards
Relativní frekvence
Relativní frekvence
Signup and view all the flashcards
Kvantitativní data vs. Kvalitativní data
Kvantitativní data vs. Kvalitativní data
Signup and view all the flashcards
Absolutní frekvence
Absolutní frekvence
Signup and view all the flashcards
Spojitá data
Spojitá data
Signup and view all the flashcards
Diskrétní data
Diskrétní data
Signup and view all the flashcards
Cenzorovaná data
Cenzorovaná data
Signup and view all the flashcards
Cenzorovaný čas
Cenzorovaný čas
Signup and view all the flashcards
Pořadí
Pořadí
Signup and view all the flashcards
Procento
Procento
Signup and view all the flashcards
Cenzorovaný subjekt
Cenzorovaný subjekt
Signup and view all the flashcards
Medián
Medián
Signup and view all the flashcards
Kvantil
Kvantil
Signup and view all the flashcards
Dolní kvartil
Dolní kvartil
Signup and view all the flashcards
Horní kvartil
Horní kvartil
Signup and view all the flashcards
Rozsah hodnot
Rozsah hodnot
Signup and view all the flashcards
Význam kvantilů
Význam kvantilů
Signup and view all the flashcards
Výběrový rozptyl
Výběrový rozptyl
Signup and view all the flashcards
Výběrová směrodatná odchylka
Výběrová směrodatná odchylka
Signup and view all the flashcards
Kvantilové rozpětí
Kvantilové rozpětí
Signup and view all the flashcards
Kvartilové rozpětí
Kvartilové rozpětí
Signup and view all the flashcards
Modus
Modus
Signup and view all the flashcards
Sloucový / Koláčový graf
Sloucový / Koláčový graf
Signup and view all the flashcards
Frekvenční tabulka
Frekvenční tabulka
Signup and view all the flashcards
Agregace kategorií
Agregace kategorií
Signup and view all the flashcards
Minimum
Minimum
Signup and view all the flashcards
Maximum
Maximum
Signup and view all the flashcards
Průměr
Průměr
Signup and view all the flashcards
Průměr
Průměr
Signup and view all the flashcards
Průměr v asymetrické sadě
Průměr v asymetrické sadě
Signup and view all the flashcards
Medián jako odolnější míra
Medián jako odolnější míra
Signup and view all the flashcards
Sloupcový graf
Sloupcový graf
Signup and view all the flashcards
Koláčový graf
Koláčový graf
Signup and view all the flashcards
Zavádějící vizualizace
Zavádějící vizualizace
Signup and view all the flashcards
Frekvenční tabulka pro kvantitativní data
Frekvenční tabulka pro kvantitativní data
Signup and view all the flashcards
Vizualizace dat
Vizualizace dat
Signup and view all the flashcards
Frekvenční tabulka pro kvantitativní data
Frekvenční tabulka pro kvantitativní data
Signup and view all the flashcards
Vizuální zobrazení kvantitativních dat
Vizuální zobrazení kvantitativních dat
Signup and view all the flashcards
Study Notes
Přednáška III - Data, jejich popis a vizualizace
- Přednáška se zaměřuje na náhodné výběry, cílové a výběrové populace, typy dat, vizualizaci dat a popisné statistiky.
- Existují náhodné výběry, cílové a výběrové populace.
- Typy dat zahrnují kvalitativní a kvantitativní data, která jsou dále rozdělena.
Typy dat
- Kvalitativní proměnné (kategoriální) – data, která lze zařadit do kategorií, ale nelze je kvantifikovat (např. pohlaví, barva vlasů).
- Kvantitativní proměnné (numerické) – data, která lze přiřadit číselnou hodnotu (např. výška, váha).
- Spojité proměnné – mohou nabývat jakýchkoli hodnot v daném rozmezí (např. výška, váha, vzdálenost, teplota).
- Diskrétní proměnné – mohou nabývat pouze spočteného množství hodnot (např. počet krevních buněk, počet hospitalizací).
Jak vznikají data?
- Data vznikají zaznamenáním skutečností, které chceme studovat.
- Kvalita dat je ovlivněna smysluplností a mírou dokonalosti (variabilita = informace + chyba).
Klíčové principy – reprezentativnost
- Cílová populace – skupina subjektů, o které se chceme dozvědět nějakou informaci.
- Experimentální vzorek – podskupina cílové populace, kterou máme k dispozici.
- Vzorek musí odpovídat svými charakteristikami cílové populaci, abychom mohli zobecnit výsledky na celou cílovou populaci.
Další typy dat – odvozená data
- Pořadí – místo absolutní hodnoty je pouze pořadí (např. hodnocení bolesti).
- Procento – procentuální zlepšení v určitém parametru (např. ejekční frakce levé srdeční komory).
- Podíl – podíl dvou měřených veličin (např. BMI).
- Míra pravděpodobnosti – výskyt události v daném čase (např. výskyt nádorového onemocnění).
- Skóre – hodnoty charakterizující určitý stav (např. indexy kvality života).
- Vizuální škála – pacient hodnotí své obtíže na škále (např. hodnocení kvality života).
Další typy dat – cenzorovaná data
- Cenzorovaná data – sledujeme čas do výskytu události, ale událost nenastane u všech subjektů v průběhu sledování.
- Událost je cenzorována, pokud nenastane v průběhu sledování.
Vizualizace a popis různých typů dat
- Data je vhodné vizualizovat a popsat pro lepší porozumění a extrahování zajímavých faktů.
Reálná data
- Reálná data obvykle zahrnují informace o osobách, jejich charakteristikách a měřených hodnotách.
- Reálné datové sady mají obvykle různé varianty položek a mohou být nestrukturované, s chybami nebo neúplné.
Proč je popis a vizualizace dat třeba?
- Data se zpřehledňují ve vhodných grafech.
- Identifikují se odlehlé, nelogické hodnoty.
- Popíší se naměřené hodnoty.
- Vypočítají se sumární statistiky.
Jaké jsou výstupy popisné analýzy?
- Shrnují pozorované data.
- Vztahují se na pozorovaná data (nebo experimentální vzorek).
- Mohou sloužit jako podklad pro stanovení hypotéz.
Co chceme u dat popsat?
- Kvalitativní data – četnosti jednotlivých kategorií.
- Kvantitativní data – těžiště a rozsah pozorovaných hodnot.
Popis „těžiště“ – míry polohy
- Minimum a maximum – nejmenší a největší pozorovaná hodnota.
- Průměr – průměrná hodnota pozorovaných hodnot.
- Medián – hodnota uprostřed seřazený hodnot.
Výpočet mediánu
- Výpočet mediánu z dat.
Průměr vs. medián
- Symetrická data, průměr se shoduje s mediánem
- Nesymetrická data, odchylka průměru od mediánu může být výrazná, je nevhodné používat průměr
Pojem kvantil
- Kvantil – číslo na reálné ose, které rozděluje pozorovaná data na části.
- Existuje 0%-99% kvantil
- Používají se např. 25%, 50% a 75% kvantily.
Kvantil - příklad
- Určení 80% kvantilu ze souboru hodnot.
Významné kvantily
- Minimum, dolní kvartil, medián, horní kvartil, maximum.
Popis "rozsahu" – míry variability
- Rozsah / rozpětí hodnot – rozdíl mezi maximální a minimální hodnotou.
- Kvantilové rozpětí – rozdíl mezi horním a dolním kvantilem.
- Rozptyl – průměr čtverců odchylek od průměru.
- Směrodatná odchylka – odmocnina z rozptylu.
Vizualizace a popis kvalitativních dat
- K vizualizaci kvalitativních dat slouží sloupcové a koláčové grafy, frekvenční tabulky.
Vizualizace a popis nominálních dat
- K vizualizaci nominálních dat: sloupcové a koláčové grafy.
Vizualizace a popis ordinálních dat
- K vizualizaci ordinálních dat: sloupcové grafy, koláčové grafy.
Příklady zavádějících vizualizací dat
- Vizualizace, která nezohledňuje rozdíly v počtu respondentů v jednotlivých skupinách.
- Vizualizace jsou nesprávně zvoleny.
Vizualizace a popis kvantitativních dat
- Histogram
- Krabicový graf (box plot)
Frekvenční tabulka pro kvantitativní data
- Frekvenční tabulka pro kvantitativní data.
Histogram
- Histogram je grafické znázornění kvantitativních dat.
- Důležité je stejná šířka intervalů pro srovnatelnost.
Sumarizace kvantitativních dat histogramem
- Vytvoření intervalů na ose x.
- Výpočet absolutních/relativních četností.
- Vykreslení samotného histogramu.
Histogram jako odhad
- Histogram je grafické znázornění dat vhodný pro kvantitativní data.
- Plocha histogramu odpovídá pravděpodobnosti.
Který histogram je korektní a proč?
- Korektní histogram vykazuje správné znázornění dat – zohledňuje věkové kategorie
Histogram
- Histogram je odhad hustoty pravděpodobnosti.
Počet intervalů určuje kvalitu výstupu
- Počet intervalů v histogramu ovlivňuje vykreslení a interpretaci dat.
Krabicový graf – box plot
- Krabicový graf – znázorňuje 25%, 50% a 75% kvantily.
Co je extrémní (odlehlá) hodnota?
- Extrémní hodnota je hodnota, která je netypická pro data v souboru, mimo pravděpodobnostní chování souboru dat.
- Je identifikovaná pomocí 3, 5, 7 směrodatných odchylek.
Vliv odlehlé hodnoty na popisné statistiky
- Odlehlé hodnoty silně ovlivňují průměr, směrodatnou odchylku.
Identifikace odlehlých hodnot
- U menších souborů stačí vizualizace
- U větších souborů je potřeba histogram a boxploty, případně srovnání mediánu a průměru.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Tato přednáška se zaměřuje na klíčové aspekty dat, včetně jejich popisu, typů a vizualizace. Prozkoumáme náhodné výběry, cílové a výběrové populace a rozdíly mezi kvalitativními a kvantitativními daty. Taktéž se dotkneme významu kvality dat a způsobů jejich vzniku.