Guide: Regressionstabeller

I det här inlägget ska vi:
• Göra en snygg och informativ tabell som visar resultatet av en bi- eller multivariat regression.
• Göra en tabell som visar resultaten av flera regressioner
• Visa var man hittar informationen som ska in i tabellen i SPSS-outputen

Längst ned i inlägget finns guiden som video.

I ett tidigare inlägg gick vi igenom hur man genomför och tolkar en regression. Tyvärr räcker det inte att kunna göra bra analyser för att vara en bra forskare – man måste kunna presentera resultaten på ett pedagogiskt och lättfattligt sätt också. Varje text som presenterar resultat från regressionsanalyser bör ha med en tabell. Man kan också ha grafer och liknande för att illustrera sambanden, men en tabell är nödvändig för att läsaren ska kunna se de exakta resultaten.

Vad bör då finnas med i en bra regressionstabell? Det finns givetvis massor av åsikter, men den kanske vanligaste varianten innehåller:
1. Estimerade b-koefficienter för interceptet och de oberoende variablerna. B-koefficienterna är kanske analysens viktigaste resultat, eftersom de visar vilken effekt de oberoende variablerna har på den beroende variabeln.
2. Standardfel för interceptet och de oberoende variablerna. Standardfelen visar hur tillförlitlig skattningen av koefficienten är.
3. Koefficienternas signifikansnivå, oftast markerat med stjärnor. Signifikansnivån räknas fram utifrån standardfelen, men för att göra det lättare för läsaren är det bra att markera den med stjärnor så att läsaren slipper räkna själv.
4. R2-värdet (eller det justerade R2-värdet). Från R2-värdet kan man utläsa regressionens förklaringskraft – hur mycket av variationen i den beroende variabeln förklaras av de oberoende variablerna?
5. N-talet (hur många analysenheter som ingick i analysen).

Först gör vi en tabell och sedan går vi igenom var man hittar den relevanta informationen i SPSS.

Steg 1. Gör tabellen. Data till det här exemplet hämtar vi från SOM-undersökningen 2004, där en fråga ställdes om hur stort förtroende respondenten har för forskare. Det blir vår beroende variabel. De oberoende variablerna är kön och ålder. Anledningen till att det står ”Kön(Man)” är att det är en dikotom variabel, där kvinna är kodat som 0 och man som 1. Eftersom regerssionskoefficienter visar vad ett steg uppåt på den oberoende variabeln har för effekt på den beroende variabeln, kommer den här koefficienten visa vad effekten är av att ”gå från man till kvinna”, alltså hur män skiljer sig från kvinnor. Därför skriver vi (man) inom parantes. Hade man vart kodat som 0 och kvinna som 1 hade vi skrivit ”Kön(Kvinna)”. Tabellen ska se ut som i Bild 1. I tabellerubriken står tabellens nummer (här symboliserat av X), vad det är för analysmetod, vad den beroende variabeln är, och vilka koefficienter det är vi redovisar (ostandardiserade). Varje oberoende variabel har en egen rad, liksom interceptet (även kallad konstanten). Vi ska också ange N-talet, antalet analysenheter, samt R2-värdet. I tabellkommentaren skriver vi en förklaring till de stjärnor vi ska använda för att ange signifikansnivån.
Bild 1. En tom regressionstabell.


Steg 2. Genomför regressionsanalysen. Vi ska nu hämta värden från SPSS-outputen och lägga in i tabellen. I Bild 2 visas varifrån vi hämtar koefficienterna – i kolumnen där det står ”Unstandardized coefficients” och ”B”. Vi skriver varje oberoende variabels koefficient på motsvarande rad i tabellen. Därefter anger vi om de är signifikanta med hjälp av stjärnor efter koefficient-talet. Signifikansen utläser vi från kolumnen ”Sig.” i SPSS-outputen. Ju lägre tal, desto bättre.
• Om Sig. är mindre än 0,001 skriver vi tre stjärnor, som koefficienten för interceptet. Det betyder att vi med 99,9 procents säkerhet kan säga att koefficienten inte är 0.
• Om Sig. är mindre än 0,010 skriver vi två stjärnor, som på koefficienten för den oberoende variabeln kön. Det betyder att vi med 99 procents säkerhet kan säga att koefficienten inte är 0.
• Om Sig. är mindre än 0,050 skriver vi en stjärna, som på koefficienten för den oberoende variabeln ålder. Det betyder att vi med 95 procents säkerhet kan säga att koefficienten inte är 0.

Bild 2. Var man hittar värdena för b-koefficienterna och motsvarande signifikansnivåer.


Steg 3. Vi ska nu skriva ut standardfelen. De skrivs i parantes direkt under koefficienterna. Vi hittar dem i kolumnen ”Std. Error” till höger om respektive koefficient. Utifrån dem kan man om man vill räkna ut om koefficienten är signifikant eller ej.
Bild 3. Var man hittar standardfelen.


Steg 4. Ange R2-värdet. R2-värdet hittar man i SPSS-outputen i tabellen som heter ”Model Summary”. Man kan använda både R2-värdet, och det justerade R2-värdet. Det justerade värdet tar hänsyn till att R2 tenderar att stiga när man lägger in flera variabler i analysen, även om de inte har någon förklaringskraft, och justerar värdet nedåt. Det justerade värdet är alltså ett något försiktigare mått, som det inte skadar att använda. Skriv in det i tabellen som i Bild 4.

Bild 4. Var man hittar R2-värdet i SPSS-outputen.


Steg 5. För att ange N-talet behöver vi säga åt SPSS att visa oss hur många analysenheter som ingick i analysen – det är inte standard. Gå som vanligt in på ”Analyze–>Regression–>Linear”. Klicka därefter på knappen ”Statistics” och klicka i rutan ”Descriptives” (se Bild 5). Klicka därefter på OK och genomför analysen som vanligt.

Bild 5. Hur man hittar ”Descriptives” i regressionsmenyn.

I outputen kommer nu två extra tabeller. Vi intresserar oss för den som heter ”Descriptive statistics”. I kolumnen ”N” står hur många analysenheter som ingick i analysen. Skriv in det på raden ”N” i tabellen, som i Bild 6. Tabellen är nu klar!
Bild 6. Hur man hittar N-talet i SPSS-outputen.

Steg 6. Ibland vill man pröva flera olika regressionsmodeller, det vill säga först köra med bara några oberoende variabler och sedan lägga till fler, eller först göra en bivariat analys och sedan lägga in kontrollvariabler. I praktiken innebär det att man gör flera regressionsanalyser. I tabeller bör man presentera det som i Bild 7, med en kolumn för varje modell. I det här fallet kan vi tänka oss att förutom att pröva effekten av ålder och kön vill vi också pröva effekten av att ha en samhällsvetenskaplig utbildning (kodat som en dikotom variabel, där alla som har samhällsvetenskaplig utbildning är kodade som 1, och alla andra som 0). Det bör finnas en kolumnrubrik som berättar vad det är för modell. I övrigt går det till exakt som när man gör en vanlig regressionstabell, allting vi redovisade tidigare ska finnas med även för denna modell, men vi redovisar ingen koefficient för samhällsvetenskapsvariabeln i den första kolumnen, modell 1.

Bild 7. En regressionstabell med flera modeller.


Videoguide: Regressionstabeller

5 reaktioner till “Guide: Regressionstabeller

  1. Tack för en bra guide! Hittade ett (?) slarvfel: ”B-koefficienterna är kanske analysens viktigaste resultat, eftersom de visar vilken effekt de oberoende variablerna har på de oberoende.” Ska det inte vara att B-koefficienterna visar vilken effekten de oberoende variablerna har på den BEROENDE variabeln?

  2. Hej! Om man vill redovisa flera regressionsanalyser man har gjort men som har olika beroende variabler måste man göra olika tabeller för de regressionsanalyser som har olika beroende variabler eller kan mamn kombinera dessa på nått sätt i en och samma tabell?

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s