Guide: Stiganalys

I det här inlägget ska vi:

  • Genomföra en stiganalys
  • Göra ett filter för att bara få med de analysenheter som har giltiga värden på alla variabler

I vanlig regressionsanalys undersöker man de direkta effekterna av en eller flera oberoende variabler på en beroende variabel. Men i många teorier så antar man att en effekt kan medieras genom en annan variabel – effekten går så att säga genom en annan variabel.

Fortsätt läsa ”Guide: Stiganalys”

Läsarfråga: Regressionsekvation

Q: Vi har genomfört två stycken multiple regressioner med 1 beroende, samt 8 respektive 2 oberoende variabler. Då vi i början av vår metod tänkte uttrycka detta i en funktion så undrar vi om det finns någon standardfunktion för en multipel regressionsanalys?

A: Japp, det finns det. I en regression med två oberoende variabler ser den ut såhär:

Yi = B0 + B1X1i + B2X2i + ei

Det betyder alltså att variabeln Y för personen i är lika med ett startvärde (interceptet), B0, plus koefficienten för variabel X1 (B1) gånger X1, plus koefficienten för X2 (B2) gånger X2, plus en felterm för varje person. När ni skriver er funktion så byter ni lämpligen ut Y, X1 och X2 mot namnen på era variabler.

Det regressionsanalysen syftar till är ju att uppskatta värdet på B0, B1 och B2, och särskilt på B1 och B2. Om B1 till exempel är signifikant skild från noll så betyder det ju att det finns ett samband mellan Y och X1.

Läsarfråga: Tolka logaritmerade variabler

Q: Jag gör en linjär regression och har loggat några av mina oberoende variabler eftersom de var alltför skeva. Nu har jag kommit till tolkningen och undrar lite över hur jag ska tolka mina b-värden. Jag har förstått att effekten av loggad x på min y-variabel är den som b-värdet visar. Samt att signifikans och riktning är densamma. Stämmer detta?

Dock undrar jag då om och i så fall hur jag kan tolka b-värdet i förhållande till det gamla x-värdet. Det vill säga, jag har en loggad x och dess effekt på y, men jag vill veta om jag kan använda detta b-värdet till att säga ngt om den ologgade x-värdet.

Fortsätt läsa ”Läsarfråga: Tolka logaritmerade variabler”

Guide: Tolka standardfel i regressionsanalys

I tidigare inlägg om regressionsanalys har jag beskrivit hur man ska tolka signifikansvärden för att se om regressionskoefficienten är signifikant skild från noll, det vill säga huruvida vi kan vara säkra på om det finns en effekt eller inte.

I det här inlägget tänkte jag beskriva hur man kan tolka regressionskoefficienternas standardfel för att avgöra om en koefficient är signifikant eller inte, och hur man också enkelt kan testa om koefficienten är signifikant skild från något annat tal än noll.

Fortsätt läsa ”Guide: Tolka standardfel i regressionsanalys”

Läsarfråga: Dummyvariabler och kontinuerliga variabler i samma regression

Q: I mitt jobb sa ska jag försöka göra en regressionsanalys och testa faktorer som kan inverka på resultaten av mikroföretag. Jag hade tänkt att göra så här: som y ha procentuell skillnad i intäkter och som x variabler ha både dummyvariabler men även kontinuerliga variabler. Min fråga är nu hur gör jag för att kunna blanda dummyvariabler och kontinuerliga variabler i samma regression?

I bloggen skriver du: “När man inte har några andra oberoende variabler än dummyvariabler för en kategori med i modellen kan vi tolka interceptet som medelvärdet för referensgruppen. Men detta gäller alltså bara så länge vi inte har med några andra oberoende variabler.”

Fortsätt läsa ”Läsarfråga: Dummyvariabler och kontinuerliga variabler i samma regression”

Läsarfråga: Insignifikant intercept i regressionsanalys

Q: Ibland när man testar olika variabler som beroende variabler, så får man ett värde på interceptet som inte är signifikant. Hur ska man tolka det egentligen? De oberoende variabler man testar kan ändå ha en signifikant påverkan på den beroende. Är modellen ändå användbar?

A: Man ska bara tolka det som att interceptet (som också kan kallas konstanten, eller alfa-värdet) inte är signifikant skilt från 0. Interceptet visar vad det förväntade värdet är när de oberoende variablerna har värdet 0. Så när alla dina oberoende variabler har värdet 0 så kan man förvänta sig att individerna i din undersökning har 0 på den beroende variabeln.

Så modellen är helt användbar! Det är ju inte så ofta man använder sig av interceptet ändå. Det påverkar inte tolkningen av de andra variablerna.

Läsarfråga: Redovisa insignifikanta variabler i regressionsanalys

Q: Jag har gjort en multivariat regression på min beroende variabel ”Tillit”, och de oberoende variabler jag har är ”Arbetstillfredsställelse”, ”Kunskapsutbyte” och ”Engagemang”. Den oberoende variabeln ”Engagemang” har ingen signifikant påverkan på den beroende variabeln, och behöver därför inte diskuteras egentligen. Ska man ändå presentera den i sin regressionstabell, för att visa att man har testat den men att den inte var signifikant, eller är detta bara onödigt?

A: När det är en multivariat regression så tycker jag definitivt att alla ingående oberoende variabler ska redovisas. Även om den inte har någon egen signifikant effekt så kan den ju påverka de andra oberoende variablernas effekter. De är ju under kontroll för engagemang, och det framgår ju inte om man tar bort den. Så jag tycker att den ska med! Tolkningen av resultaten gör man ju i texten.