Podcast
Questions and Answers
Jaká je absolutní četnost kategorie 3 ve frekvenční tabulce?
Jaká je absolutní četnost kategorie 3 ve frekvenční tabulce?
Jaký je procentní podíl kategorie 2?
Jaký je procentní podíl kategorie 2?
Co je důsledkem srovnání absolutních čísel mezi skupinami s různým počtem pacientů?
Co je důsledkem srovnání absolutních čísel mezi skupinami s různým počtem pacientů?
Jaký je celkový počet respondentů uvedený ve frekvenční tabulce?
Jaký je celkový počet respondentů uvedený ve frekvenční tabulce?
Signup and view all the answers
Jaké jsou relativní četnosti pro kategorii 1?
Jaké jsou relativní četnosti pro kategorii 1?
Signup and view all the answers
Kolik pacientů bylo zařazeno do kategorie 4?
Kolik pacientů bylo zařazeno do kategorie 4?
Signup and view all the answers
Jaký má kategorie 3 podíl na celkovém počtu respondentů?
Jaký má kategorie 3 podíl na celkovém počtu respondentů?
Signup and view all the answers
Jaká frekvenční tabulka se používá pro kvantitativní data?
Jaká frekvenční tabulka se používá pro kvantitativní data?
Signup and view all the answers
Jaký typ dat nelze vzájemně seřadit?
Jaký typ dat nelze vzájemně seřadit?
Signup and view all the answers
Která z následujících datových kategorií se ptá na relaci větší/menší?
Která z následujících datových kategorií se ptá na relaci větší/menší?
Signup and view all the answers
Jaký typ kvalitativních dat zahrnuje pouze dvě kategorie?
Jaký typ kvalitativních dat zahrnuje pouze dvě kategorie?
Signup and view all the answers
Která datová kategorie poskytuje větší informaci než ostatní?
Která datová kategorie poskytuje větší informaci než ostatní?
Signup and view all the answers
Co je považováno za příklad ordinálních dat?
Co je považováno za příklad ordinálních dat?
Signup and view all the answers
Co se stane při agregaci kvantitativních dat do kategorií?
Co se stane při agregaci kvantitativních dat do kategorií?
Signup and view all the answers
Jaká je charakteristika diskrétních dat?
Jaká je charakteristika diskrétních dat?
Signup and view all the answers
Jaká měření představuje procento v biostatistice?
Jaká měření představuje procento v biostatistice?
Signup and view all the answers
Jaký je průměr známek studenta A?
Jaký je průměr známek studenta A?
Signup and view all the answers
Jaký je medián známek studenta B?
Jaký je medián známek studenta B?
Signup and view all the answers
Co reprezentuje dolní kvartil ve statistice?
Co reprezentuje dolní kvartil ve statistice?
Signup and view all the answers
Jaký je vzorec pro určení 80% kvantilu, když n = 20?
Jaký je vzorec pro určení 80% kvantilu, když n = 20?
Signup and view all the answers
Jaká je charakteristika mediánu v kontextu vypovídající schopnosti údajů?
Jaká je charakteristika mediánu v kontextu vypovídající schopnosti údajů?
Signup and view all the answers
Jaký je vzorec pro výpočet rozsahu hodnot?
Jaký je vzorec pro výpočet rozsahu hodnot?
Signup and view all the answers
Jaká je významná vlastnost kvantilů v neparametrických metodách?
Jaká je významná vlastnost kvantilů v neparametrických metodách?
Signup and view all the answers
Jaký je průměr platů v ČR v roce 2003?
Jaký je průměr platů v ČR v roce 2003?
Signup and view all the answers
Jaká je značka pro maximum pozorovaných hodnot?
Jaká je značka pro maximum pozorovaných hodnot?
Signup and view all the answers
Co je to medián?
Co je to medián?
Signup and view all the answers
Jak se vypočítá medián pro sudý počet hodnot?
Jak se vypočítá medián pro sudý počet hodnot?
Signup and view all the answers
Kdy je výpočet průměru nevhodný?
Kdy je výpočet průměru nevhodný?
Signup and view all the answers
Jaká je hlavní odlišnost mezi průměrem a mediánem?
Jaká je hlavní odlišnost mezi průměrem a mediánem?
Signup and view all the answers
Jakou hodnotu má medián z následujícího souboru dat: 2, 3, 3, 5, 7?
Jakou hodnotu má medián z následujícího souboru dat: 2, 3, 3, 5, 7?
Signup and view all the answers
Co vypovídá o průměru a mediánu, pokud jsou hodnoty symetrické?
Co vypovídá o průměru a mediánu, pokud jsou hodnoty symetrické?
Signup and view all the answers
Jak se postaví pozice mediánu v případě lichého počtu hodnot?
Jak se postaví pozice mediánu v případě lichého počtu hodnot?
Signup and view all the answers
Jaké jsou vlastnosti kvartilového rozpětí?
Jaké jsou vlastnosti kvartilového rozpětí?
Signup and view all the answers
Jaká je definice výběrového rozptylu?
Jaká je definice výběrového rozptylu?
Signup and view all the answers
Jaký je vztah mezi výběrovou směrodatnou odchylkou a výběrovým rozptylem?
Jaký je vztah mezi výběrovou směrodatnou odchylkou a výběrovým rozptylem?
Signup and view all the answers
Jakým způsobem může být rozptyl ovlivněn odlehlými pozorováními?
Jakým způsobem může být rozptyl ovlivněn odlehlými pozorováními?
Signup and view all the answers
Co z následujícího představuje modus?
Co z následujícího představuje modus?
Signup and view all the answers
Jaký typ grafu je nejlepší pro vizualizaci nominálních dat?
Jaký typ grafu je nejlepší pro vizualizaci nominálních dat?
Signup and view all the answers
Jaké informace může poskytnout frekvenční tabulka?
Jaké informace může poskytnout frekvenční tabulka?
Signup and view all the answers
Jaká je výhoda směrodatné odchylky oproti rozptylu?
Jaká je výhoda směrodatné odchylky oproti rozptylu?
Signup and view all the answers
Co charakterizuje míru pravděpodobnosti?
Co charakterizuje míru pravděpodobnosti?
Signup and view all the answers
Jaké informace poskytuje skóre?
Jaké informace poskytuje skóre?
Signup and view all the answers
Proč může být relativní vyjádření účinnosti zavádějící?
Proč může být relativní vyjádření účinnosti zavádějící?
Signup and view all the answers
Co charakterizuje cenzorovaná data?
Co charakterizuje cenzorovaná data?
Signup and view all the answers
Jaké jsou rozdíly mezi relativní a absolutní změnou účinnosti?
Jaké jsou rozdíly mezi relativní a absolutní změnou účinnosti?
Signup and view all the answers
Jak lze vizuální škálu nejlépe charakterizovat?
Jak lze vizuální škálu nejlépe charakterizovat?
Signup and view all the answers
Jaký je význam absolutní a relativní četnosti?
Jaký je význam absolutní a relativní četnosti?
Signup and view all the answers
Co může být problémem při interpretaci relativní účinnosti léčiva?
Co může být problémem při interpretaci relativní účinnosti léčiva?
Signup and view all the answers
Study Notes
Přednáška III - Data, jejich popis a vizualizace
- Přednáška se zaměřuje na náhodné výběry, cílové a výběrové populace, typy dat, vizualizaci dat a popisné statistiky.
- Existují náhodné výběry, cílové a výběrové populace.
- Typy dat zahrnují kvalitativní a kvantitativní data, která jsou dále rozdělena.
Typy dat
- Kvalitativní proměnné (kategoriální) – data, která lze zařadit do kategorií, ale nelze je kvantifikovat (např. pohlaví, barva vlasů).
- Kvantitativní proměnné (numerické) – data, která lze přiřadit číselnou hodnotu (např. výška, váha).
- Spojité proměnné – mohou nabývat jakýchkoli hodnot v daném rozmezí (např. výška, váha, vzdálenost, teplota).
- Diskrétní proměnné – mohou nabývat pouze spočteného množství hodnot (např. počet krevních buněk, počet hospitalizací).
Jak vznikají data?
- Data vznikají zaznamenáním skutečností, které chceme studovat.
- Kvalita dat je ovlivněna smysluplností a mírou dokonalosti (variabilita = informace + chyba).
Klíčové principy – reprezentativnost
- Cílová populace – skupina subjektů, o které se chceme dozvědět nějakou informaci.
- Experimentální vzorek – podskupina cílové populace, kterou máme k dispozici.
- Vzorek musí odpovídat svými charakteristikami cílové populaci, abychom mohli zobecnit výsledky na celou cílovou populaci.
Další typy dat – odvozená data
- Pořadí – místo absolutní hodnoty je pouze pořadí (např. hodnocení bolesti).
- Procento – procentuální zlepšení v určitém parametru (např. ejekční frakce levé srdeční komory).
- Podíl – podíl dvou měřených veličin (např. BMI).
- Míra pravděpodobnosti – výskyt události v daném čase (např. výskyt nádorového onemocnění).
- Skóre – hodnoty charakterizující určitý stav (např. indexy kvality života).
- Vizuální škála – pacient hodnotí své obtíže na škále (např. hodnocení kvality života).
Další typy dat – cenzorovaná data
- Cenzorovaná data – sledujeme čas do výskytu události, ale událost nenastane u všech subjektů v průběhu sledování.
- Událost je cenzorována, pokud nenastane v průběhu sledování.
Vizualizace a popis různých typů dat
- Data je vhodné vizualizovat a popsat pro lepší porozumění a extrahování zajímavých faktů.
Reálná data
- Reálná data obvykle zahrnují informace o osobách, jejich charakteristikách a měřených hodnotách.
- Reálné datové sady mají obvykle různé varianty položek a mohou být nestrukturované, s chybami nebo neúplné.
Proč je popis a vizualizace dat třeba?
- Data se zpřehledňují ve vhodných grafech.
- Identifikují se odlehlé, nelogické hodnoty.
- Popíší se naměřené hodnoty.
- Vypočítají se sumární statistiky.
Jaké jsou výstupy popisné analýzy?
- Shrnují pozorované data.
- Vztahují se na pozorovaná data (nebo experimentální vzorek).
- Mohou sloužit jako podklad pro stanovení hypotéz.
Co chceme u dat popsat?
- Kvalitativní data – četnosti jednotlivých kategorií.
- Kvantitativní data – těžiště a rozsah pozorovaných hodnot.
Popis „těžiště“ – míry polohy
- Minimum a maximum – nejmenší a největší pozorovaná hodnota.
- Průměr – průměrná hodnota pozorovaných hodnot.
- Medián – hodnota uprostřed seřazený hodnot.
Výpočet mediánu
- Výpočet mediánu z dat.
Průměr vs. medián
- Symetrická data, průměr se shoduje s mediánem
- Nesymetrická data, odchylka průměru od mediánu může být výrazná, je nevhodné používat průměr
Pojem kvantil
- Kvantil – číslo na reálné ose, které rozděluje pozorovaná data na části.
- Existuje 0%-99% kvantil
- Používají se např. 25%, 50% a 75% kvantily.
Kvantil - příklad
- Určení 80% kvantilu ze souboru hodnot.
Významné kvantily
- Minimum, dolní kvartil, medián, horní kvartil, maximum.
Popis "rozsahu" – míry variability
- Rozsah / rozpětí hodnot – rozdíl mezi maximální a minimální hodnotou.
- Kvantilové rozpětí – rozdíl mezi horním a dolním kvantilem.
- Rozptyl – průměr čtverců odchylek od průměru.
- Směrodatná odchylka – odmocnina z rozptylu.
Vizualizace a popis kvalitativních dat
- K vizualizaci kvalitativních dat slouží sloupcové a koláčové grafy, frekvenční tabulky.
Vizualizace a popis nominálních dat
- K vizualizaci nominálních dat: sloupcové a koláčové grafy.
Vizualizace a popis ordinálních dat
- K vizualizaci ordinálních dat: sloupcové grafy, koláčové grafy.
Příklady zavádějících vizualizací dat
- Vizualizace, která nezohledňuje rozdíly v počtu respondentů v jednotlivých skupinách.
- Vizualizace jsou nesprávně zvoleny.
Vizualizace a popis kvantitativních dat
- Histogram
- Krabicový graf (box plot)
Frekvenční tabulka pro kvantitativní data
- Frekvenční tabulka pro kvantitativní data.
Histogram
- Histogram je grafické znázornění kvantitativních dat.
- Důležité je stejná šířka intervalů pro srovnatelnost.
Sumarizace kvantitativních dat histogramem
- Vytvoření intervalů na ose x.
- Výpočet absolutních/relativních četností.
- Vykreslení samotného histogramu.
Histogram jako odhad
- Histogram je grafické znázornění dat vhodný pro kvantitativní data.
- Plocha histogramu odpovídá pravděpodobnosti.
Který histogram je korektní a proč?
- Korektní histogram vykazuje správné znázornění dat – zohledňuje věkové kategorie
Histogram
- Histogram je odhad hustoty pravděpodobnosti.
Počet intervalů určuje kvalitu výstupu
- Počet intervalů v histogramu ovlivňuje vykreslení a interpretaci dat.
Krabicový graf – box plot
- Krabicový graf – znázorňuje 25%, 50% a 75% kvantily.
Co je extrémní (odlehlá) hodnota?
- Extrémní hodnota je hodnota, která je netypická pro data v souboru, mimo pravděpodobnostní chování souboru dat.
- Je identifikovaná pomocí 3, 5, 7 směrodatných odchylek.
Vliv odlehlé hodnoty na popisné statistiky
- Odlehlé hodnoty silně ovlivňují průměr, směrodatnou odchylku.
Identifikace odlehlých hodnot
- U menších souborů stačí vizualizace
- U větších souborů je potřeba histogram a boxploty, případně srovnání mediánu a průměru.
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Tato přednáška se zaměřuje na klíčové aspekty dat, včetně jejich popisu, typů a vizualizace. Prozkoumáme náhodné výběry, cílové a výběrové populace a rozdíly mezi kvalitativními a kvantitativními daty. Taktéž se dotkneme významu kvality dat a způsobů jejich vzniku.