Spelar skalnivåerna i SPSS någon roll?

En viktig sak att tänka på när man gör statistiska analyser är vilken skalnivå variablerna man använder sig av befinner sig på.

Nominalskalor är kategoriseringar. Variabeln ”Frukt” är till exempel en nominalskala – det finns bananer, päron, äpplen och så vidare. De är olika, men ingen är mer ”frukt” än någon annan. De går inte att rangordna.

Ordinalskalor är kategoriseringar som dessutom har en inbyggd rangordning. En skala som har alternativen ”Mycket bra” ”Ganska bra” ”Varken bra eller dåligt” och så vidare är till exempel en ordinalskala. ”Mycket bra” är bättre än ”Ganska bra”, men det går inte att avgöra om avståndet mellan ”Mycket bra” och ”Ganska bra” är lika stort som avståndet mellan ”Ganska bra” och ”Varken bra eller dåligt”. Det kallas att skalan inte har ”ekvidistans”.

Intervallskalor är kategoriseringar, har rangordning, och ekvidistans. Centimeter är en sådan skala. 5 cm är mer än 4 cm, och avståndet mellan 5 och 4 cm är lika stort som avståndet mellan 4 och 3 cm.

Vilka analystekniker man kan använda sig av beror på vilken skalnivå variabeln befinner sig på. Man kan till exempel egentligen bara räkna medelvärden på intervallskalor. Det är ju befängt att försöka räkna fram ett medelvärde på två bananer, ett päron och en apelsin. Väldigt många analystekniker bygger på att man räknar medelvärden (till exempel t-test, ANOVA, regressionsanalyser), vilket gör att den beroende variabeln måste vara på intervallskalenivå. Det är dock inte helt ovanligt att man av bekvämlighetsskäl gör sådana analyser på ordinalskalor ibland också, men det är alltså inte statistiskt korrekt.

I SPSS kan man ställa in vilken skalnivå variablerna befinner sig på. Alternativet ”Scale” motsvarar intervallskala. De inställningarna påverkar däremot inte analyserna. SPSS protesterar inte om du använder en nominalskala som beroende variabel i en regressionsanalys. Det måste man hålla koll på själv.

Det enda fallet där det spelar roll, vad jag vet, är när man gör grafer. Då är det viktigt att inställningarna är de rätta.

Guide: Konstruera ett index från flera variabler

I det här inlägget ska vi:
• Gå igenom när det kan vara bra att göra ett index
• Vända variabler som ska ingå i indexet
• Normera variabler som ska ingå i indexet
• Testa indexets reliabilitet med hjälp av Cronbach’s Alpha

Fortsätt läsa ”Guide: Konstruera ett index från flera variabler”

Guide: Mata in data och bygga en datamängd

I den här guiden ska vi gå igenom:

Hur man definierar variabler
Vad de olika kolumnerna i ”variable view” betyder
Hur man bäst kodar olika typer av enkätfrågor
Hur man kodar enkätdata i experimentella design

Fortsätt läsa ”Guide: Mata in data och bygga en datamängd”

Läsarfråga: Analysera grupper separat

Q: Vi har en ”grupp” variabel som består av 1= läpp och 2= läpp-käk-gomspalt. Har satt etikett på den enskilda variabeln genom att fylla i fönstret Values.

Sen när vi gör frekvensanalyser så baseras ju alla analyser på både 1 och 2 men vi vill ju kunna analyser dem var för sig, hur gör vi?

A: Det enklaste sättet är att använda sig av ”data–>split file”. Där klickar ni in ”organize output by groups”, och anger bara att ni vill använda er gruppvariabel när ni delar filen. Alla analyser ni gör efter det kommer att delas upp på de olika värdena i gruppvariabeln. Om ni sedan vill göra analyser på hela urvalet sen så går ni bara in på ”data–>split file” och trycker i ”analyze all cases, do not create groups”.

Läsarfråga: Koda variabler med villkor

Q: Hur kan man skapa en ny variabel (X) med fyra svarsalternativ eller celler med villkor från fyra dikotoma variabler d.v.s. krav1, krav2, kontroll1, kontroll2 med respektive svarsalternativ ”Ja” = 1 och ”Nej” = 2.

Cell1 med villkor: om (krav1 = 1 & krav2 = 1) & (minst ett av kontrollmåtten = 2).

Cell2 med villkor: om (minst ett av kravmåtten = 2) & (minst ett av kontrollmåtten = 2).

Cell3 med villkor: om (krav1 = 1 & krav2 = 1) & (kontroll1 = 1 & kontroll2 = 1).

Cell4 med villkor: (minst ett av kravmåtten = 2) & (kontroll1 = 1 & kontroll2 = 1).

Fortsätt läsa ”Läsarfråga: Koda variabler med villkor”

Läsarfråga: Kombinera två variabler

Q: Det är så att jag har två olika ”grupp” variabler. En heter ”Grupp” och består av 1= neuro, 2=kontroll & sedan ”Kön” 1=flicka , 2=pojke. Jag undrar hur man gör för att skapa en ny variabel, vi kan kalla den för X där man slår ihop dessa två variabler så det blir en variabel med fyra grupper (1=neuro_pojke, 2=kontroll_pojke, 3=neuro_flicka, 4=kontroll_flicka).

Fortsätt läsa ”Läsarfråga: Kombinera två variabler”

Läsarfråga: Välja ut länder i ett dataset

Q: Tänkte testa en hypotes på EU:s 27 medlemsstater, hur väljer jag ett sample (i det här fallet dessa 27 länder i SPSS)? Använder mig av QoG databasen och sitter just nu och tittar på dataview där alla länder finns med, men har ingen aning om hur jag ska göra för att bara få med mina länder.

Fortsätt läsa ”Läsarfråga: Välja ut länder i ett dataset”

Läsarfråga: Skapa index

Q: I ett enkätmaterial som handlar om miljö har jag funnit en fråga om transportbeteende som är min beroende variabel. Problemet är bara att den är uppdelad i fem kategorier av samma fråga och sedan har varje kategori sex svarsalternativ. Jag skulle behöva skapa ett index av dessa fem för att kunna få en variabel som jag kan kalla ”transportbeteende”. Just nu har jag fem beroende variabler känns det som. Är det en bra idé att skapa ett index? Hur går jag tillväga?

Fortsätt läsa ”Läsarfråga: Skapa index”

Läsarfråga: Hantera flera svarsalternativ i en enkätfråga

Q: Det är så att jag håller på att mata in uppgifter som ska användas i en rapport. Uppgifterna kommer från bedömningsformulär med frågor och svarsalternativ. Jag har kodat svaren utifrån dessa svarsalternativ. En variabel är exempelvis diagnos. Svarsalternativen blir då t.ex. 1=Depression, 2=Psykos, 3=Personlighetstörning etc. Så långt inga problem.

Men nu är det ju då så att en enskild person som detta gäller kan ha fler än en diagnos och min fråga är hur jag bäst hanterar detta? I en tidigare rapport som gjorts har man löst det genom att komponera svarsalternativ som innehåller dubbeldiagnoser, ex alt 4=depression+psykos. Problemet med detta är ju att om jag då vill veta hur många som hade depression som diagnos så måste jag ju räkna ihop både alternativ 1 och 4. Finns det något bra sätt att använda systemet på till detta? Kan man t.ex. använda sig av klassindelningar ifall man nu gör alternativ för dubbeldiagnoser? Alltså där man gör om 1 och 4 till en gemensam klass? Eller kan man på något sätt ange flera svarsalternativ för en variabel för samma inmatning, i det här fallet för en patient?

Fortsätt läsa ”Läsarfråga: Hantera flera svarsalternativ i en enkätfråga”

Guide: Logaritmera en variabel

I det här inlägget ska vi:

Transformera en snedfördelad variabel så att den blir mer normalfördelad.
Ta fram histogram över variabeln.

Fortsätt läsa ”Guide: Logaritmera en variabel”