Podcast
Questions and Answers
Vad är den minst informativa formen av data enligt nominalskalan?
Vad är den minst informativa formen av data enligt nominalskalan?
Nominalskalan representerar den minst informativa formen av data.
Kan data mätt på en nominalskala rangordnas?
Kan data mätt på en nominalskala rangordnas?
False (B)
Vilken typ av skala tillåter rangordning av data men där skillnaden mellan mätvärden saknar betydelse?
Vilken typ av skala tillåter rangordning av data men där skillnaden mellan mätvärden saknar betydelse?
Ordinalskala
Ge exempel på data som mäts på en intervallskala.
Ge exempel på data som mäts på en intervallskala.
Vilken egenskap skiljer kvotskalan från intervallskalan?
Vilken egenskap skiljer kvotskalan från intervallskalan?
Vad kännetecknar en diskret variabel?
Vad kännetecknar en diskret variabel?
Vad kännetecknar en kontinuerlig variabel?
Vad kännetecknar en kontinuerlig variabel?
Är en kvalitativ variabel alltid diskret?
Är en kvalitativ variabel alltid diskret?
På vilka skalor mäts kvantitativa variabler?
På vilka skalor mäts kvantitativa variabler?
Vad är tvärsnittsdata?
Vad är tvärsnittsdata?
Vad är tidsseriedata?
Vad är tidsseriedata?
Vad visar en frekvenstabell för kvalitativa data?
Vad visar en frekvenstabell för kvalitativa data?
Vilket är det vanligaste lägesmåttet?
Vilket är det vanligaste lägesmåttet?
Aritmetiskt medelvärde är ett lämpligt lägesmått för data på nominalskala.
Aritmetiskt medelvärde är ett lämpligt lägesmått för data på nominalskala.
Hur definieras medianen för ett dataset med ett jämnt antal observationer?
Hur definieras medianen för ett dataset med ett jämnt antal observationer?
Vad kallas ett dataset som har två typvärden?
Vad kallas ett dataset som har två typvärden?
När är geometriskt medelvärde ett lämpligt mått?
När är geometriskt medelvärde ett lämpligt mått?
Vad mäter variationsvidd (range)?
Vad mäter variationsvidd (range)?
Vad representerar MAD (Mean Absolute Deviation)?
Vad representerar MAD (Mean Absolute Deviation)?
Variansuträkningen ger större vikt åt avvikelser som ligger långt från medelvärdet jämfört med MAD.
Variansuträkningen ger större vikt åt avvikelser som ligger långt från medelvärdet jämfört med MAD.
Vad är variationskoefficienten (CV)?
Vad är variationskoefficienten (CV)?
Vilka två storheter fokuserar Mean-Variance analys på för att mäta (finansiella) tillgångars prestation?
Vilka två storheter fokuserar Mean-Variance analys på för att mäta (finansiella) tillgångars prestation?
Vad mäter Sharpe Ratio?
Vad mäter Sharpe Ratio?
Vad innebär det att ett värde ligger vid den 60:e percentilen?
Vad innebär det att ett värde ligger vid den 60:e percentilen?
Vilket värde motsvarar den 50:e percentilen?
Vilket värde motsvarar den 50:e percentilen?
Vad används IQR (InterQuartile Range) till i samband med boxplots?
Vad används IQR (InterQuartile Range) till i samband med boxplots?
Enligt den empiriska regeln ligger cirka _____ % av observationerna inom $\pm$ 1 standardavvikelse från medelvärdet i en normalfördelning.
Enligt den empiriska regeln ligger cirka _____ % av observationerna inom $\pm$ 1 standardavvikelse från medelvärdet i en normalfördelning.
Vilken är den minsta andelen observationer som ligger inom $k=2$ standardavvikelser från medelvärdet enligt Chebyshevs teorem?
Vilken är den minsta andelen observationer som ligger inom $k=2$ standardavvikelser från medelvärdet enligt Chebyshevs teorem?
Vad innebär ett Z-värde på -2?
Vad innebär ett Z-värde på -2?
En korrelationskoefficient nära 0 indikerar alltid att det inte finns något samband mellan variablerna.
En korrelationskoefficient nära 0 indikerar alltid att det inte finns något samband mellan variablerna.
Korrelation mellan två variabler innebär alltid kausalitet.
Korrelation mellan två variabler innebär alltid kausalitet.
Vad är utfallsrummet (S) vid kast med en vanlig sexsidig tärning?
Vad är utfallsrummet (S) vid kast med en vanlig sexsidig tärning?
Vad innebär det att två händelser är ömsesidigt uteslutande?
Vad innebär det att två händelser är ömsesidigt uteslutande?
Vad är komplementet till händelsen A?
Vad är komplementet till händelsen A?
Hur beräknas den betingade sannolikheten P(A|B)?
Hur beräknas den betingade sannolikheten P(A|B)?
Vad innebär det att två händelser A och B är oberoende?
Vad innebär det att två händelser A och B är oberoende?
Vad kännetecknar en Bernoulli-process som ligger till grund för Binomialfördelningen?
Vad kännetecknar en Bernoulli-process som ligger till grund för Binomialfördelningen?
Vad är skillnaden mellan Binomialfördelningen och Hypergeometrisk fördelning?
Vad är skillnaden mellan Binomialfördelningen och Hypergeometrisk fördelning?
Vad beskriver Poissonfördelningen?
Vad beskriver Poissonfördelningen?
För en kontinuerlig slumpvariabel X är sannolikheten att den antar ett exakt värde x, P(X=x), alltid lika med noll.
För en kontinuerlig slumpvariabel X är sannolikheten att den antar ett exakt värde x, P(X=x), alltid lika med noll.
Vad är väntevärdet för en likformigt fördelad variabel X på intervallet [a, b]?
Vad är väntevärdet för en likformigt fördelad variabel X på intervallet [a, b]?
Vilka två parametrar bestämmer exakt formen på en specifik normalfördelning?
Vilka två parametrar bestämmer exakt formen på en specifik normalfördelning?
Vad är medelvärdet och standardavvikelsen för en standardiserad normalfördelning (Z-fördelning)?
Vad är medelvärdet och standardavvikelsen för en standardiserad normalfördelning (Z-fördelning)?
Vad beskriver Exponentialfördelningen typiskt?
Vad beskriver Exponentialfördelningen typiskt?
Vad kallas den fullständiga datamängden, och vad kallas en delmängd av denna?
Vad kallas den fullständiga datamängden, och vad kallas en delmängd av denna?
Vad säger Centrala Gränsvärdessatsen (CGS) om stickprovsmedelvärdets fördelning?
Vad säger Centrala Gränsvärdessatsen (CGS) om stickprovsmedelvärdets fördelning?
Vad är ett konfidensintervall?
Vad är ett konfidensintervall?
Vad används t-fördelningen till istället för Z-fördelningen vid inferens om medelvärden?
Vad används t-fördelningen till istället för Z-fördelningen vid inferens om medelvärden?
Vad är syftet med ett hypotestest?
Vad är syftet med ett hypotestest?
Vad innebär ett Typ 1-fel i hypotestestning?
Vad innebär ett Typ 1-fel i hypotestestning?
Vad är ett p-värde?
Vad är ett p-värde?
När används ett Z-test för skillnaden mellan två populationsmedelvärden?
När används ett Z-test för skillnaden mellan två populationsmedelvärden?
Vad är speciellt med inferens för beroende stickprov (parade data)?
Vad är speciellt med inferens för beroende stickprov (parade data)?
Flashcards
Nominalskala
Nominalskala
Den minst informativa formen av data, används för att gruppera data i kategorier utan rangordning.
Ordinalskala
Ordinalskala
Grupperar data i kategorier med en logisk ordning. Skillnaden mellan mätvärdena är dock inte definierad.
Intervallskala
Intervallskala
Numerisk skala där skillnaden mellan två värden alltid är lika stor. Saknar absolut nollpunkt.
Kvotskala
Kvotskala
Signup and view all the flashcards
Diskret variabel
Diskret variabel
Signup and view all the flashcards
Kontinuerlig variabel
Kontinuerlig variabel
Signup and view all the flashcards
Kvalitativ variabel
Kvalitativ variabel
Signup and view all the flashcards
Kvantitativ variabel
Kvantitativ variabel
Signup and view all the flashcards
Tvärsnittsdata
Tvärsnittsdata
Signup and view all the flashcards
Tidsseriedata
Tidsseriedata
Signup and view all the flashcards
Frekvenstabell
Frekvenstabell
Signup and view all the flashcards
Lägesmått
Lägesmått
Signup and view all the flashcards
Medelvärde
Medelvärde
Signup and view all the flashcards
Median
Median
Signup and view all the flashcards
Typvärde
Typvärde
Signup and view all the flashcards
Geometriskt medelvärde
Geometriskt medelvärde
Signup and view all the flashcards
Spridningsmått
Spridningsmått
Signup and view all the flashcards
Variationsvidd (Range)
Variationsvidd (Range)
Signup and view all the flashcards
MAD (Mean Absolute Deviation)
MAD (Mean Absolute Deviation)
Signup and view all the flashcards
Varians (Variance)
Varians (Variance)
Signup and view all the flashcards
Standardavvikelse (Standard Deviation)
Standardavvikelse (Standard Deviation)
Signup and view all the flashcards
Variationskoefficienten
Variationskoefficienten
Signup and view all the flashcards
Mean-Variance analysis
Mean-Variance analysis
Signup and view all the flashcards
Sharpe ratio
Sharpe ratio
Signup and view all the flashcards
Percentil
Percentil
Signup and view all the flashcards
Box plot
Box plot
Signup and view all the flashcards
Interkvartilavstånd (IQR)
Interkvartilavstånd (IQR)
Signup and view all the flashcards
Empiriska regeln
Empiriska regeln
Signup and view all the flashcards
Chebyshevs teorem
Chebyshevs teorem
Signup and view all the flashcards
Z-värde
Z-värde
Signup and view all the flashcards
Outlier
Outlier
Signup and view all the flashcards
Grupperade data
Grupperade data
Signup and view all the flashcards
Kovarians och korrelation
Kovarians och korrelation
Signup and view all the flashcards
Kausalitet
Kausalitet
Signup and view all the flashcards
Sannolikhet
Sannolikhet
Signup and view all the flashcards
Slumpförsök (Experiment)
Slumpförsök (Experiment)
Signup and view all the flashcards
Utfall (Outcome)
Utfall (Outcome)
Signup and view all the flashcards
Händelse (Event)
Händelse (Event)
Signup and view all the flashcards
Study Notes
Nominalskala – Kategorisk variabel
- Detta är den minst informativa dataformen
- Data grupperas i kategorier baserat på mätvärden
- Det är inte möjligt att rangordna data
- "Nomen" betyder namn
- Exempel inkluderar kön, nationalitet, och politisk tillhörighet
Ordinalskala – Kategorisk variabel
- Data grupperas i kategorier med en logisk ordning, vilket möjliggör rangordning
- Skillnaden mellan mätvärden har ingen betydelse
- Exempel är betyg och placering i tävlingar
Intervallskala – Numerisk variabel
- Skillnaden mellan två värden är alltid lika stor
- Tolkning av skillnader mellan mätvärden är möjlig
- Exempel innefattar temperatur, klockslag och kalenderår
Kvotskala – Numerisk variabel
- Det finns en absolut nollpunkt
- Kvoten eller skillnaden mellan två värden är meningsfull
- Exempelvis vikt, avstånd och längd
Diskreta Variabler
- Kan anta ett värde från en begränsad mängd möjliga värden
- Vanligtvis heltal, men kan även vara decimaltal (dock begränsat)
- Exempel är antal
Kontinuerliga Variabler
- Kan anta ett värde från en oändlig mängd möjliga värden
- Exempelvis längd och vikt
Kvalitativa Variabler
- Mäts på nominal- eller ordinalskala
- Mätvärdet har ingen specifik innebörd
- Grupperar observationer
- Alltid diskret
Kvantitativa Variabler
- Mäts på intervall- eller kvotskala
- Mätvärdet har en specifik innebörd
- Kan vara diskreta eller kontinuerliga
Tvärsnittsdata
- En mätning vid en tidpunkt
- Exempelvis enkäter
Tidsseriedata
- Flera mätningar vid olika tidpunkter
- Exempelvis börskurser
Frekvenstabell
- Visar hur ofta data förekommer
- Kvalitativa data visar antalet observationer i varje kategori
- Kvantitativa data visar antalet observationer i varje intervall
Lägesmått
- Används för att sammanfatta en stor mängd data med en enda siffra, det vanligaste värdet
- Definieras som ett sammanfattande mått på tyngdpunkten av den observerade datamängden eller en statistisk fördelning
- De vanligaste centralmåtten är aritmetiskt medelvärde, median och typvärde
Medelvärde
- Det vanligaste lägesmåttet
- Beräknas genom att summera alla värden i datasetet och dela med antalet värden som summerats
Sampling för Population
- Stickprov används för att mäta och beräkna medelvärdet
- Populationen mäts nästan aldrig och därför uppskattas ofta medelvärdet för populationen med ett stickprov
- Medelvärdet påverkas lika mycket av alla observationer i datasetet, även extrema och ovanliga värden
- Lämpligt för intervall- och kvotdata, olämpligt för nominal- eller ordinaldata
Median
- Mittersta värdet om antalet observationer är udda, annars genomsnittet av de två mittersta värdena om antalet är jämnt
- Datat måste vara i ordnad storleksordning från lägsta till högsta värdet
Typvärde
- Det mest förekommande värdet i en datamängd
- Ett dataset kan sakna typvärde, ha ett (unimodal), två (bimodal) eller flera (multimodal)
Geometriskt Medelvärde
- Lämpligt för att analysera en förändringsfaktor, dvs. hitta det genomsnittliga värdet på förändringsfaktorn
- Exempelvis ränta och avkastning
Spridningsmått
- Visar hur stor variation det finns i data
- Variation kan påverka beslut eftersom det innebär osäkerhet
Variationsvidd (Range)
- Skillnaden mellan det högsta och lägsta värdet
- Fokuserar på extremvärden i datamängden
Genomsnittlig Absolut Avvikelse (MAD)
- Genomsnittliga absoluta avvikelsen (Mean Absolute Deviation)
- Ger en uppfattning om spridningen genom att se hur varje observation skiljer sig från genomsnittet
- Använder alla mätvärden
- Användbart för intervall- eller kvotdata
Varians och Standardavvikelse
- Varians och Standardavvikelse, där standardavvikelsen är roten ur variansen, är de vanligaste spridningsmåtten
- Varje avvikelse kvadreras från medelvärdet
MAD vs Varians
- MAD väger alla avvikelser lika, även de mest extrema
- Variansuträkningen ger större vikt åt större avvikelser genom kvadrering
Variationskoefficienten
- Kvoten mellan standardavvikelsen och medelvärdet
- Medelvärdet måste först beräknas för att kunna beräkna variationskoefficienten
Mean-Variance Analys och Sharpe Ratio
- Mean-Variance analys fokuserar på avkastning och risk (variansen) för att mäta finansiella tillgångars prestation
- Högre avkastning är generellt förknippad med högre risk och större variation
- Rationella investerare gör en avvägning mellan risk och avkastning
Sharpe Ratio
- Mäter avkastningen utöver den riskfria avkastningen per enhet risk
- Ju högre Sharpe ratio, desto bättre
Percentiler och Kvartiler
- En percentil anger ett värde under vilket en viss procentandel av datamängden ligger
- Den 25:e percentilen motsvarar den första kvartilen (Q1), 25% av värdena är lägre
- Den 50:e percentilen motsvarar den andra kvartilen (Q2), medianen
- Den 75:e percentilen motsvarar den tredje kvartilen (Q3)
- Tolkning och innebörd är densamma för percentiler
Percentilen Identifieras
- Ordna datan i stigande ordning och identifiera rätt observationsvärde
- Location (L) används för att utläsa värdet
Plats
- Om L är ett heltal motsvarar det platsen i datan
- Om L inte är ett heltal utgår vi från heltalet och avrundar det mot nästa heltal
Beräkna Percentil
- Identifiera vilken metod som använts, då skillnaden i utfall är mindre ju större dataset
- Excel använder två metoder
Box Plots
- Ett diagram för att visuellt beskriva spridningen i data, mätt på intervall- eller kvotskala.
- Möjligör jämförelse av fördelningen av olika datamängder och identifiering av extremvärden (outliers)
- Består av kvartilerna (Q1, Q2, Q3) samt högsta och lägsta värde
IQR
- Används för att identifiera extremvärden/outliers
- InterQuartile Range - Interkvartilavståndet
- Bestäms genom Q3-Q1
Empirisk Regel
- Om materialet är symmetriskt fördelat (klockformat) finns en större andel observationer nära medelvärdet
- Ca 68% av observationerna ligger inom ± 1 standardavvikelse från medelvärdet
- Ca 95% ligger inom ± 2 standardavvikelser från medelvärdet
- Ca 99.7% ligger inom ± 3 standardavvikelser från medelvärdet
Chebyshev's Teorem
- Är mindre exakt än empiriska regeln, den täcker alla distributioner där avvikelsen är större än 1 standardavvikelse
- Har en stor andel av observationer som kommer ligga en, två, tre standardavvikelser från medelvärdet
Z-värden
- Används för att mäta avståndet i standardavvikelser mellan ett uppmätt värde i stickprovet och stickprovets medelvärde
- Ett Z-värde på 2 betyder ett värde som ligger 2 standardavvikelser över medelvärdet
- Att omvandla stickprovsdata till z-värden kallas standardisering
- Mäter hur stor avvikelsen är mellan ett stickprovsvärde och medelvärdet i termer av standardavvikelse
Outliers - Enligt Z-värde
- En outlier är ett observerat värde som skiljer sig kraftigt från andra värden (extremvärde)
- Kan indikera mätfel eller att populationen som datan kommer ifrån inte är symmetrisk (sned)
- Z-värdet granskas när det är >3 och <-3
- Outliers tas ibland bort från mätdata
Grupperad Data
- Aggregering av sekundär data finns bl.a. i rapporter
Relativ Frekvens
- Indikerar den proportion av alla observationer som återfinns i tabellen
Kovarians och Korrelation
- Mått som beskriver samspelet mellan två variabler genom samvariation
- KOvarians beskriver sambandets existens
- Korrelationskoefficient beskriver sambandets existens och riktning
Positiv, Negativ och noll Kovarians
- Positiv kovarians indikerar en positiv samvariation, om värdet på den ena variabeln är över medel så är även värdet på den andra variabeln över medel.
- Negativ kovarians om värdet på den ena variabeln är över medel så är värdet på den andra variabeln under medel
- Noll kovarians om det inte är linjärt samband
Begränsningar
- Måtten identifierar begränsningar i samband
- Korrelation indikerar inte kausalitet
Sannolikheter
- Om sannolikheten är 0 finns ingen händelse. Om den är 1 finns alla händelser
Venndiagram
- Visualiserar de olika förutsättningarna för slumpförsök
- Rektangeln är slumpförsöket
- A är en händelse. B är en annan händelse
Additionssatsen
- Används då två händelser ska ske ges. Alltså Unionen av händelse
- Använder P(A U B) = P(A) + P(B) - P(A ∩ B)
Betingade/Oberoende händelser
- Använd P(A|B) = P(A). Den betingade samolikheten är densamma som den obetingade
Diskreta och Kontinuerliga Slumpvariabler
- Kan också beskrivas som ett exempel på kapitel 5 och 6 (diskreta och kontinuerliga)
- Variabelns namn betecknas generellt som X
Poissonfördlening
- Här räknas E(X) och my= µ och variansen Var (X)= µ
- Fördelningen visar antal händelser inom ett intervall
Normalfördelning
- Standardiseringen gör den enklare att använda/tolka med hjälp av tabeller
- Har ett medelvärde på 0 och standardavvikelse 1
- Om X är en normalfördelad variabel med förväntad
- Kontinuitet = kontinuerlig motsvarighet till Poissonfördelningen
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.