En viktig sak att tänka på när man gör statistiska analyser är vilken skalnivå variablerna man använder sig av befinner sig på.
Nominalskalor är kategoriseringar. Variabeln ”Frukt” är till exempel en nominalskala – det finns bananer, päron, äpplen och så vidare. De är olika, men ingen är mer ”frukt” än någon annan. De går inte att rangordna.
Ordinalskalor är kategoriseringar som dessutom har en inbyggd rangordning. En skala som har alternativen ”Mycket bra” ”Ganska bra” ”Varken bra eller dåligt” och så vidare är till exempel en ordinalskala. ”Mycket bra” är bättre än ”Ganska bra”, men det går inte att avgöra om avståndet mellan ”Mycket bra” och ”Ganska bra” är lika stort som avståndet mellan ”Ganska bra” och ”Varken bra eller dåligt”. Det kallas att skalan inte har ”ekvidistans”.
Intervallskalor är kategoriseringar, har rangordning, och ekvidistans. Centimeter är en sådan skala. 5 cm är mer än 4 cm, och avståndet mellan 5 och 4 cm är lika stort som avståndet mellan 4 och 3 cm.
Vilka analystekniker man kan använda sig av beror på vilken skalnivå variabeln befinner sig på. Man kan till exempel egentligen bara räkna medelvärden på intervallskalor. Det är ju befängt att försöka räkna fram ett medelvärde på två bananer, ett päron och en apelsin. Väldigt många analystekniker bygger på att man räknar medelvärden (till exempel t-test, ANOVA, regressionsanalyser), vilket gör att den beroende variabeln måste vara på intervallskalenivå. Det är dock inte helt ovanligt att man av bekvämlighetsskäl gör sådana analyser på ordinalskalor ibland också, men det är alltså inte statistiskt korrekt.
I SPSS kan man ställa in vilken skalnivå variablerna befinner sig på. Alternativet ”Scale” motsvarar intervallskala. De inställningarna påverkar däremot inte analyserna. SPSS protesterar inte om du använder en nominalskala som beroende variabel i en regressionsanalys. Det måste man hålla koll på själv.
Det enda fallet där det spelar roll, vad jag vet, är när man gör grafer. Då är det viktigt att inställningarna är de rätta.
Hej! Jag har utfört en enkätstudie där jag nu ska analysera samband mellan företag som frivilligt väljer revision och några variabler som jag tror kan ha ett samband med det. Min beroende variabel är alltså på nominalskalenivå (företag som väljer revision och företag som inte gör det). Jag har tänkt att göra en multipel logistisk regression, men innan dess vill jag testa sambanden mellan min beroende variabel och en oberoende variabel i taget (jag har förstått att det kan vara bra för att se vilka variabler som sedan kan vara användbara i den multipla regressionen). Mina frågor summeras nedan:
1. ”Vilka analystekniker man kan använda sig utav beror på vilken skalnivå variabeln befinner sig på” – Är det vilken skalnivå den BEROENDE variabeln befinner sig på? Och isf, spelar det någon roll om de oberoende variablerna är på nominal-, ordinal- eller intervallskala?
2. Det står inget om kvotskalor.. hanteras de på samma sätt som intervallskalor?
3. Vilka alternativ har jag för att mäta samband när min beroende variabel är på nominalskalenivå? Är det chi2 eller en binär logistisk regression som gäller? Och vad är isf egentligen skillnaden på dessa två?
4. Några frågor har jag ställt på en femgradig likertskala, stämmer det att dessa då är på ordinalskalenivå?
Tack på förhand!
” Är det vilken skalnivå den BEROENDE variabeln befinner sig på?”
Ja.
” Och isf, spelar det någon roll om de oberoende variablerna är på nominal-, ordinal- eller intervallskala?”
Nej. Kategoriska variabler (nominal- och ordinalskala) modelleras med dummy-variabler.
”2. Det står inget om kvotskalor.. hanteras de på samma sätt som intervallskalor?”
I linjär regression antas att residualerna i modellen är normalfördelade – så länge detta antagande är uppfyllt spelar skalnivån ingen roll.
”3. Vilka alternativ har jag för att mäta samband när min beroende variabel är på nominalskalenivå? Är det chi2 eller en binär logistisk regression som gäller? Och vad är isf egentligen skillnaden på dessa två?”
Om har en du har en nominalskalevariabel som utfall (”beroende variabel”) med fler än två kategorier skall du tillämpa multinomial logistisk regression, annars räcker det gott med en binär logistisk regression. Hypotesprövning med Chi2-fördelning testar om associationen mellan två kategoriska variabler skiljer sig från slumpen och säger således ingenting om styrkan i associationen.
”4. Några frågor har jag ställt på en femgradig likertskala, stämmer det att dessa då är på ordinalskalenivå?”
Det är en omtvistad fråga huruvida likertvariabler skall ses som ordinala eller kontinuerliga utfall. Generellt kan man säga att de tekniskt sett är ordinala till sin natur men att de kan ses som approximativt normalfördelade om det inte föreligger starka ”golv och/eller takeffekter”, vilket innebär att en majoritet av observationerna ligger i första/sista kategorierna. Det beror helt enkelt på. Om man vill behandla dem som kontinuerliga kan man tillämpa linjär regression, annars får man anpassa en ordinal logistisk regressionsmodell (en variant av den multinomiala logistiska regressionsmodellen som tar hänsyn till att kategorierna är ordnade efter ”styrka”).
Hej!
Detta har ingenting med just nominal- ordinal eller intervallskala att göra, men jag har en fråga kring Spss. Har gjort en enkätundersökning där jag bl.a. fått in svar av typen ”instämmer, instämmer inte alls” osv. Har i nuläget 5 sådana svaralternativ i vissa frågor som jag vill lägga ihop till 3 istället för att underlätta datatolkningen. Att fixa detta på EN fråga är inga problem, men när jag sedan går in i en annan fråga och vill lägga ihop lite andra svarsalternativ där, så ligger de gamla inställningarna kvar! Hoppas ni förstår hur jag menar.. Alltså, jag går in på Transform->Recode into different variables och väljer sedan en ny Inputvariabel, döper om den, och sen när jag ska gå in på old and new values, ligger värdena för föregående fråga jag ändrade, kvar där. När jag då trycker på remove och lägger in de nya värdena så ändras även dessa för den första frågan jag la in! :(
Hur ”sparar man” inställningarna för varje fråga så att det ligger kvar även om man går in och slår ihop variabler i en ny fråga?
Detta gör mig toooookig! Haha!
Tack på förhand!
Har du tryckt på ”reset”?
Börja syntaxprogrammera istället. Då kan du med enkelhet dokumentera ditt arbetsflöde och samtidigt öka din produktivitet. Här finns en guide till hur man omkodar variabler med SPSS-syntaxer:
With havin so much content do you ever run into any problems of plagorism or copyright infringement?
My website has a lot of unique content I’ve either created myself or outsourced but it appears a lot of it is popping it up all over the web without my agreement. Do you know any methods to help prevent content from being stolen? I’d certainly appreciate it.
TACK för att ni finns!!! Tack vare den här sidan klarade jag av grundkursen i kvantimetod och klarar nu förhoppningsvis också fortbildningskursen. Ni förklarar de saker som lärarna inte är kapabla till att förmedla med pedagogiska metoder.. Så: Tack =)
Hej Spss-akuten! Först och främst – Du/ni anar inte hur mycket ni har hjälpt oss när vi har skrivit vår C-uppsats. Lite tragiskt att vår handledare inte kunnat ge oss den hjälp vi hittat här! Så tur för oss att ni finns.
Vi har fått en komplettering på vår C-uppsats då vi inte hade korstabeller och/eller korrelationer och signifikansnivåer. Dessa har vi inte lyckats få fram.
Jag har egentligen 2 frågor:
1: Vi har en fråga som vi delat upp på 4 frågor (variablar): ”Är du aktiv på xxx?” Ja/Nej
XXX är: Facebook, Google+, Twitter, Annat.
Kan vi slå ihop dessa till en enda? ”Använder sig av sociala nätvärk? Ja/Nej” ? Har provat ”compute” och lagt till dem, men då plussar den på istället
Fråga 2:
Vi verkar inte få till detta med korrelation. Om vi tillexempel gör en korstabell mellan ”Användadet av internet och synen på alkohol/droger/cigaretter” så ser vi att 113/145 som svarat på frågorna anser att deras syn påverkats.
Men provar vi göra en bivariate correlation eller via korstabellen ”chisquare” och ”correlation” så ser vi ingen signifikansnivå eller korrelation, vilket verkar vara underligt. De flesta av våra frågor är på nominal och/eller ordinal nivå. Tacksam för svar..
Vilka sambandsmått kan man använda om man har en multivariat korstabellsanalys med en variabel på nominalskalan och två variabler på ordinalskalan?
Hej,
Om jag har en likertskala med dessa svarsalternativ, ”håller med helt och hållet” håller med till stor del, varken eller, håller med till viss del, håller inte med alls, vet ej. Hur ska detta kodas(values) i spss?
Jag vill kunna räkna ut medelvärdet på varje fråga, samt frekvens på varje svarsalternativ.
Snälla, hjälp!
Hej! Någon som kan svara på varför vi inte kan välja mellan 3 olika skalnivåer under knappen measure. Vi kan endast välja mellan nominal och ordinal?
Hälsningar/ A
Vart ser jag skalnivåerna i SPSS-modellen? Om frågan är: ” på vilka skalnivåer är de oberoende variablerna?” vart kan jag då läsa av det i min modell?
Du har glömt lägga till att Intervallskala saknar nollpunkt, rätt så viktigt. Det du har skrivit är Kvotskala och inte intervallskala
vh
Skrev fel om kvotskala!
Hej! Är statistik och Spss novis, planerar att jämföra om det finns något samband mellan ålder o ryggsmärta. D.v.s nominal o kvot skala. Hur funkar det? Går det, eller måste man göra om dem till samma skalor? Enligt info från min kurs kan Phi o Cramers V användas för test av samband på nominalskala. Hittar dock inte dessa i Spss, finner endast pearson, spearmans kendall tau. Är det någon som kan förklara detta för mig?
Hej! Jag ska undersöka ett index gällande etniskt hot vilket jag gjort en index av med invånarnas sympati för främlingsfientliga partier i de skandinaviska länderna som då är på nominalskalan(jag har redan grupperat in partierna för att urskilja det främlingsfientliga partiet i varje land). Hur lägger jag samman variablerna på nominalskalan till ett värde?