Regressionsanalys: Interaktionseffekter med kontinuerliga variabler

I det här inlägget ska vi:

Gå igenom när man kan använda interaktionseffekter med kontinuerliga variabler
Hur man gör en sådan analys
Hur man räknar ut effekten vid olika värden av den modererande variabeln
Hur man räknar ut konfidensintervallen

Ett bra verktyg när man vill pröva olika hypoteser är att göra en regressionsanalys med interaktionseffekter, som jag skrivit om i ett tidigare inlägg. Man utgår i modellen från att effekten av en oberoende variabel beror på värdet av en annan oberoende variabel, vilket ofta är rimligt att anta.

I den tidigare guiden skrev jag om hur det här går till när den modererande variabeln (alltså den som avgör vilken effekt den andra variabeln har) är en dummyvariabel, det vill säga har bara två värden. I det här inlägget tänkte jag istället skriva om hur man göra när man har två kontinuerliga variabler, alltså skalor.

Fortsätt läsa ”Regressionsanalys: Interaktionseffekter med kontinuerliga variabler”

Guide: Regressionsdiagnostik – heteroskedasticitet, del 2

Detta är del två av vår genomgång av heteroskedasticitet. Om du vill veta mer om vad detta är och varför det kan innebära ett problem för din regression, gå genast tillbaka till del ett.

Fortsätt läsa ”Guide: Regressionsdiagnostik – heteroskedasticitet, del 2”

Guide: Regressionsdiagnostik – heteroskedasticitet, del 1

I detta inlägg ska vi gå igenom problem med heteroskedasticitet (och inte bara hur svårt det är att stava och uttala). Heteroskedasticitet är ett av de vanligare problemen som kan uppstå i, och försvåra tolkningen av, en regressionsanalys. Heteroskedasticitet innebär i korthet att variansen hos feltermerna inte är konstant; det vill säga att, när värdet på oberoende variabel (x) ökar, så minskar eller /ökar den oförklarade variationen i beroende variabel (y). Är spridningen jämn råder motsatsen homoskedasticitet.

Fortsätt läsa ”Guide: Regressionsdiagnostik – heteroskedasticitet, del 1”

Guide: Statistisk ”power” och urvalsstorlek i experimentell design

I den här guiden ska vi gå igenom:

Vad statistisk ”power” är
Hur man räknar ut urvalsstorlek för att få rätt power
Ett empiriskt test av teorin
En kortversion för dig som inte orkar läsa hela inlägget

Experimentell metod lade grunden för den vetenskapliga revolutionen som ledde fram till fantastiska framsteg inom framförallt naturvetenskap och medicin från 1600-talet och framåt. På senare tid har experimentell metod även vunnit insteg inom samhällsvetenskapen.

Grundprincipen för experimentell metod är att jämföra en kontrollgrupp med en experimentgrupp, som man utsätter för någon behandling. Om experimentgruppen skiljer sig tillräckligt mycket åt från kontrollgruppen förkastar vi den så kallade nollhypotesen – att behandlingen inte haft någon effekt. Vanliga metoder för att pröva skillnaden mellan två eller flera grupper är t-test eller variansanalys. Med hjälp av dessa metoder kan vi avgöra om det är troligt att en skillnad mellan grupperna beror på slumpmässig variation, eller om den kan tillskrivas behandlingen.

Fortsätt läsa ”Guide: Statistisk ”power” och urvalsstorlek i experimentell design”

Guide: Flernivåregressionsanalys, del 2

I den här guiden ska vi gå igenom:

Hur man lägger in fixerade effekter på nivå 1 och nivå 2
Hur man låter effekten av nivå 1-variabler variera mellan nivå 2-enheterna
Visualisering av varierande effekter
Hur man kan förklara variation i effekt

I den första delen av den här guiden undersökte vi data om priser på bostadsrätter i Göteborg. Vi fann då att det fanns signifikant variation i pris mellan olika stasdelar (nivå 2-enheterna). Nu ska vi undersöka om nivå 1-variabler, alltså egenskaper för varje enskild lägenhet, kan påverka priset, om stadsdelsegenskaper kan påverka priset, och slutligen om nivå 1-egenskaperna varierar mellan stadsdelarna. Data för den som vill följa med kan laddas ned härifrån.

Fortsätt läsa ”Guide: Flernivåregressionsanalys, del 2”

Guide: Flernivåregressionsanalys del 1

I den här guiden ska vi gå igenom:

Varför man ibland bör använda flernivåregressionsanalys istället för OLS
Hur man räknar ut intraklasskorrelationskoefficienten

Den absolut vanligaste tekniken för regressionsanalys är den så kallade OLS-tekniken. Med den kan man undersöka samband mellan en beroende variabeln och en eller flera oberoende variabler. I den här guiden tänkte jag försöka gå igenom en annan teknik, flernivåregressionsanalysen (multi-level regression analysis på engelska).

Fortsätt läsa ”Guide: Flernivåregressionsanalys del 1”

Guide: Kontrollvariabler i regressionsanalys

I den här guiden ska vi gå igenom:

Hur samband kan verka vara mer positiva än vad de egentligen är
Hur samband kan verka vara mer negativa än vad de egentligen är
En lathund för vilka effekter man ska förvänta sig av utelämnade variabler

I bivariat regressionsanalys kan man undersöka om det finns ett linjärt samband mellan två variabler. Men ofta talar man om att man behöver föra in kontrollvariabler i regressionsanalysen. Anledningen är att om man missar att ta med de relevanta kontrollvariablerna riskerar att dra felaktiga slutsatser om huvudsambandet. I den här guiden ska vi gå igenom de två sätt på vilket man kan dra felaktiga slutsatser, och vad som man kan förvänta sig händer med huvudsambandet när man introducerar olika kontrollvariabler.

Fortsätt läsa ”Guide: Kontrollvariabler i regressionsanalys”

Guide: Regressionsanalys med kurvlinjära effekter

I den här guiden ska vi gå igenom:

Varför man ibland ska använda kurvlinjära effekter
Hur man genomför en regressionsanalys med kurvlinjära effekter i SPSS
Tolka resultaten och ta fram marginaleffekter

Fortsätt läsa ”Guide: Regressionsanalys med kurvlinjära effekter”

Guide: Logistisk regression

I det här inlägget ska vi:

Gå igenom när man bör använda logistisk regression istället för linjär regression
Gå igenom hur man genomför en logistisk regression i SPSS
Tolka resultaten med hjälp av en graf över förväntad sannolikhet
Förstå vad B-koefficienten betyder
Förstå vad Exp(B), ”odds-ratiot”, betyder
Jämföra resultaten med OLS (linjär regression)

Fortsätt läsa ”Guide: Logistisk regression”

Läsarfråga: Instrumentvariabler

Q: Jag undrar hur det här med instrument variabler fungerar?

A: Instrumentvariabler använder man när det finns risk för omvänd kausalitet. Ett klassiskt exempel är ekonomisk tillväxt och inbördeskrig. Man vill undersöka om ekonomisk tillväxt minskar risken för inbördeskrig, men det är också rimligt att tro att inbördeskrig minskar den ekonomiska tillväxten. Om vi då undersöker korrelationen mellan de två kommer vi inte veta vad som orsakar vad.

Genom att hitta en variabel som kan tänkas orsaka ekonomisk tillväxt men inte inbördeskrig kan vi komma runt problemet. I länder där ekonomin bygger på jordbruk borde rimligtvis mängden regn påverka den ekonomiska tillväxten. Samtidigt så borde inte regn påverka risken för inbördeskrig, och inbördeskrig påverkar definitivt inte hur mycket det regnar.

Om vi då hittar ett samband mellan hur mycket det regnar i ett land och risken för inbördeskrig så kan man då dra slutsatsen att det måste vara så att regnet har gjort att den ekonomiska tillväxten ökat, vilket minskat risken för inbördeskrig. Det kan ju inet ha gått åt andra hållet.

Det här exemplet kan man läsa om i en berömd artikel av Miguel, Satyanath & Sergenti (2004) i tidskriften Journal of Political Economy: Economic Shocks and Civil Conflict: An Instrumental Variables Approach.

Statistiskt gör man det här I två steg. Först undersöker man effekten av regn på ekonomisk tillväxt. Därefter använder man regnnivån för att predicera värden av ekonomisk tillväxt. Därefter använder man de predicerade värdena av ekonomisk tillväxt som oberoende variabel i en ny regression där inbördeskrig är den beroende variabeln. Detta kallas Two Stage Least Squares. I SPSS hittar du det under ”Analyze->Regression->2-Stage Least Squares”. Du skriver där in din beroende variabel, din oberoende variabel och din instrumentvariabel (motsvarande regn).