Guide: Regressionsdiagnostik – heteroskedasticitet, del 2

Detta är del två av vår genomgång av heteroskedasticitet. Om du vill veta mer om vad detta är och varför det kan innebära ett problem för din regression, gå genast tillbaka till del ett.

Läs mer

Guide: Stapeldiagram med error bars

Guide: Stapeldiagram med ”error bars”

I den här guiden ska vi gå igenom:

  • Varför det kan vara intressant att göra ett stapeldiagram med error bars
  • Hur man gör ett stapeldiagram med error bars
  • Hur det förhåller sig till signifikanstestning med ANOVA

När man redovisar resultat från statistiska analyser bör huvudmålsättningen vara att det ska vara så enkelt som möjligt för läsaren att förstå vad man har kommit fram till. Ett bra medel för att göra det lätt för läsaren är att använda olika typer av grafiska diagram. Ett diagram som många förstår och snabbt ger en överblick är stapeldiagram. De lämpar sig till exempel väl för at redovisa medelvärden i olika grupper. I experimentella studier är det vanligt att man redovisar medelvärdena i de olika experimentgrupperna med ett stapeldiagram, och så gör man sedan den riktiga analysen med en ANOVA.

Man kan också lägga till ”error bars”, streck som visar konfidensintervallet kring medelvärdena för att ge läsaren en indikation på om det är troligt att medelvärdena är signifikant åtskilda.

Läs mer

Guide: Regressionsdiagnostik – heteroskedasticitet, del 1

I detta inlägg ska vi gå igenom problem med heteroskedasticitet (och inte bara hur svårt det är att stava och uttala). Heteroskedasticitet är ett av de vanligare problemen som kan uppstå i, och försvåra tolkningen av, en regressionsanalys. Heteroskedasticitet innebär i korthet att variansen hos feltermerna inte är konstant; det vill säga att, när värdet på oberoende variabel (x) ökar, så minskar eller /ökar den oförklarade variationen i beroende variabel (y). Är spridningen jämn råder motsatsen homoskedasticitet.

Läs mer

Guide: Statistisk ”power” och urvalsstorlek i experimentell design

I den här guiden ska vi gå igenom:

  • Vad statistisk ”power” är
  • Hur man räknar ut urvalsstorlek för att få rätt power
  • Ett empiriskt test av teorin
  • En kortversion för dig som inte orkar läsa hela inlägget

Experimentell metod lade grunden för den vetenskapliga revolutionen som ledde fram till fantastiska framsteg inom framförallt naturvetenskap och medicin från 1600-talet och framåt. På senare tid har experimentell metod även vunnit insteg inom samhällsvetenskapen.

Grundprincipen för experimentell metod är att jämföra en kontrollgrupp med en experimentgrupp, som man utsätter för någon behandling. Om experimentgruppen skiljer sig tillräckligt mycket åt från kontrollgruppen förkastar vi den så kallade nollhypotesen – att behandlingen inte haft någon effekt. Vanliga metoder för att pröva skillnaden mellan två eller flera grupper är t-test eller variansanalys. Med hjälp av dessa metoder kan vi avgöra om det är troligt att en skillnad mellan grupperna beror på slumpmässig variation, eller om den kan tillskrivas behandlingen.

Läs mer

Guide: Signifikans och one sample t-test

I den här guiden ska vi gå igenom:

  • Kort om statistisk signifikanstestning
  • Skillnaden mellan independent samples t-test och one sample t-test
  • Hur man genomför ett one sample t-test

Är en majoritet i USA för legalisering av marijuana?

Jag har tidigare skrivit om att jämföra medelvärden med t-test. T-testet är väldigt användbart, då man kan jämföra om två medelvärden skiljer sig signifikant ifrån varandra. Om vi har gjort slumpmässiga urval ur två grupper (till exempel kvinnor och män), och medelvärdena i de två grupperna är signifikant skilda på 95%-nivån, betyder det att vi med 95% säkerhet kan säga att medelvärdena i populationen ur vilken vi gjort urvalet (alltså alla kvinnor och män i Sverige) inte är samma. Vi kan inte vara 95% säkra att skillnaden i den stora populationen är just den vi har uppmätt – bara att det finns en skillnad.

Läs mer

Guide: Flernivåregressionsanalys, del 2

I den här guiden ska vi gå igenom:

  • Hur man lägger in fixerade effekter på nivå 1 och nivå 2
  • Hur man låter effekten av nivå 1-variabler variera mellan nivå 2-enheterna
  • Visualisering av varierande effekter
  • Hur man kan förklara variation i effekt

I den första delen av den här guiden undersökte vi data om priser på bostadsrätter i Göteborg. Vi fann då att det fanns signifikant variation i pris mellan olika stasdelar (nivå 2-enheterna). Nu ska vi undersöka om nivå 1-variabler, alltså egenskaper för varje enskild lägenhet, kan påverka priset, om stadsdelsegenskaper kan påverka priset, och slutligen om nivå 1-egenskaperna varierar mellan stadsdelarna. Data för den som vill följa med kan laddas ned härifrån.

Läs mer