Guide: Tolka standardfel i regressionsanalys

I tidigare inlägg om regressionsanalys har jag beskrivit hur man ska tolka signifikansvärden för att se om regressionskoefficienten är signifikant skild från noll, det vill säga huruvida vi kan vara säkra på om det finns en effekt eller inte.

I det här inlägget tänkte jag beskriva hur man kan tolka regressionskoefficienternas standardfel för att avgöra om en koefficient är signifikant eller inte, och hur man också enkelt kan testa om koefficienten är signifikant skild från något annat tal än noll.

För att avgöra om en koefficient är signifikant (alltså signifikant skild från noll) eller inte räknar SPSS fram något som kallas t-värdet. Du kan se t-värdet i kolumnen t i outputen från SPSS, som i bild 1, där den beroende variabeln är personers placering på vänster-högerskalan och de oberoende variablerna är samhällsvetenskaplig utbildning, kön och om man är arbetare eller inte:

Bild 1: T-värdet i regressionsoutputen

Ju längre bort t-värdet är ifrån noll, desto mer signfikant är koefficienten. När t-värdet är högre än 1,96 eller lägre än -1,96 (om det är plus eller minus beror på om koefficienten är positiv eller negativ) så är koefficienten signifikant på 95-procentsnivån, det vill säga att signifikansvärdet är lägre än 0.05. I bilden ser vi att t-värdena för variablerna ”Man” och ”F131D: Arbetare” är högre eller lägre än 1,96 och -1,96, och Sig-värdena är för båda under 0.05. Variabeln ”utb_samhallsvetare” har ett t-värde på -1,502, och är därför inte signifikant (sig-värde 0,133).

Hur räknar man ut t-värdet då? Det är busenkelt – ta bara koefficienten delat på standardfelet (kolumnen ”Std. Err”) så får du t-värdet! För koefficienterna i tabellen:

-0,180 / 0,120 = -1,5
0,112 / 0,042 = 2,67
-0,480 / 0,043 = -11,16

Att det inte blir exakt samma tal som i tabellen beror på att talen som skrivs ut i tabellen har avrundats, och därför ger lite felaktiga decimalvärden.

I vissa vetenskapliga tidskrifter skriver man ibland inte ut om koefficienterna är signifikanta, utan bara standardfelet i parantes vid koefficienten, som i bild 2. Tabellen är hämtad från Ahlqvist (2010), i den prestigefulla tidskriften American Political Science Review. Man kan då till exempel se att koefficienten för Population inte är signifikant i Model 1, men i Model 2, och inte i Model 3. Det är svårt att tolka den här tabellen om man inte vet hur t-värden beräknas.

Bild 2. Ett exempel på en tabell där man inte rapporterar signifikansnivåer, utan bara standardfel.

Källa: Ahlqvist (2010): ”Building strategic capacity: The political underpinnings of coordinated wage bargaining” American Political Science Review 104:171-188.

Det absolut vanligaste är att man testar om koefficienter är signifikant skilda från noll. Men ibland är man intresserad av att testa om en koefficient är signifikant skild från något specifikt tal, till exempel om man replikerar en studie och vill undersöka om den koefficient man själv fått fram är signifikant skild från den som den tidigare studien fått fram.

Då gör man bara så att man tar koefficienten minus det tal man vill testa emot, och delar resultatet på standardfelet och får fram ett t-värde! Också kanonenkelt. Om vi till exempel läst en studie som säger att effekten av att vara arbetare på placeringen på vänster-högerskalan är -0,2, så kan vi undersöka om vår koefficient på -0,480 är signifikant skild från -0,2. Då tar vi bara -0,480 – (-0,20) = -0,280, och delar det på standardfelet 0,043.

-0,280/0,043 = -6,51.

-6,51 är lägre än -1,96, vårt resultat är alltså signifikant annorlunda än den tidigare studiens resultat!

4 reaktioner till “Guide: Tolka standardfel i regressionsanalys

    1. Hej!
      Standardavvikelse handlar om spridningen kring ett medelvärde på en variabel, variabelns varians.

      Standardfelet handlar om osäkerhet i skattningen av någonting, till exempel ett medelvärde eller en regressionskoefficient. För att räkna fram standardfelet utgår man bland annat från variablernas varians.

  1. Hej!
    Det är himla svårt för mig att tolka tabeller. T. exempel hur ska man tolka den ovannämnda tabellen?

    1. Jag vet inte heller. Detta är raketforskning. Vore fint med ett svar på din fråga. En video på hur man tolkar en hel regressionsanalys vore bra också.

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Twitter-bild

Du kommenterar med ditt Twitter-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s