Guide: Regressionsanalys med interaktionseffekter

I det här (långa, men intressanta) inlägget ska vi:

  • Skapa en interaktionsvariabel
  • Göra en regressionsanalys med en interaktionsvariabel.
  • Tolka resultaten.
  • Diskutera fördelarna med att använda sig av interaktionsvariabler istället för att göra separata analyser.

Läs mer

Omröstning: Vad ska nästa guide handla om?

Jag hade tänkt göra en ny guide till någon typ av analys och lägga upp här på bloggen. Tyvärr har jag inte så mycket tid som jag skulle önska, och undrar därför vad som egentligen efterfrågas. Vad ska nästa guide handla om?

Jag har försökt tänka ut några ämnen till saker som är bra att kunna och gjort en omröstning. Lägg din röst på det du helst vill se i nästa guide. Om det inte finns med i listan, välj ”Other”, och skriv vad du önskar dig!

Lögn, förbannad lögn och statistik

Statistik är ett utmärkt verktyg för att undersöka saker i samhället. Men statistiska undersökningar bygger sällan på totalurval, dvs att man undersökt alla de enheter man är intresserad av. Istället använder man sig av slumpmässiga urval. Om man till exempel vill veta hur många av Sveriges väljare som kan tänka sig att rösta på socialdemokraterna är den säkraste metoden naturligtvis att leta upp varenda väljare och fråga dem. Eftersom det är ganska opraktiskt väljer man istället ut ett par tusen väljare slumpmässigt, och frågar dem. Man antar sedan att de är representativa för resten av befolkningen. Men den här metoden gör att det blir en viss osäkerhet kring resultaten, en felmarginal. Utifrån felmarginalen kan vi sedan ta fram ett konfidensintervall. Vi kan sedan med en viss procents säkerhet, till exempel 95 procent, säga att det sanna värdet befinner sig inom konfidensintervallet.

Läs mer

Läsarfråga: Multikollinearitet i dummyvariabler

Q: En av variablerna som jag testar i multipel linjär regression har svarsalternativen 1= aldrig, 2=sällan, 3=ofta, 4= väldigt ofta. Jag har i analysen nu gjort dummyvariabler av samtliga utom nr 4, vilken jag jämför med. Så långt inga problem. Däremot går jag problem med multikollinearitet i variablerna 1 & 2 när jag lägger in dem i en regressionsmodell med andra variabler. Spontant känns det inte så underligt att de kanske är beroende av varandra och verkar liknande på den beroende variabeln eftersomd de är skapade ur samma grundvariabel. Men hur tar jag hänsyn till detta? (väger jag samman svar 1 & 2 har jag åter en tolerabel nivå för multikollinearitet men jag skulle föredra att inte göra på detta vis).

Läs mer