Läsarfråga: Hantera flera svarsalternativ i en enkätfråga

Q: Det är så att jag håller på att mata in uppgifter som ska användas i en rapport. Uppgifterna kommer från bedömningsformulär med frågor och svarsalternativ. Jag har kodat svaren utifrån dessa svarsalternativ. En variabel är exempelvis diagnos. Svarsalternativen blir då t.ex. 1=Depression, 2=Psykos, 3=Personlighetstörning etc. Så långt inga problem.

Men nu är det ju då så att en enskild person som detta gäller kan ha fler än en diagnos och min fråga är hur jag bäst hanterar detta? I en tidigare rapport som gjorts har man löst det genom att komponera svarsalternativ som innehåller dubbeldiagnoser, ex alt 4=depression+psykos. Problemet med detta är ju att om jag då vill veta hur många som hade depression som diagnos så måste jag ju räkna ihop både alternativ 1 och 4. Finns det något bra sätt att använda systemet på till detta? Kan man t.ex. använda sig av klassindelningar ifall man nu gör alternativ för dubbeldiagnoser? Alltså där man gör om 1 och 4 till en gemensam klass? Eller kan man på något sätt ange flera svarsalternativ för en variabel för samma inmatning, i det här fallet för en patient?

A: Det vanliga när man har flersvarsalternativ i enkäter eller undersökningar är att man har en variabel för varje svarsalternativ, alltså Depression (ja/nej), Psykos (ja/nej), Personlighetsstörning (ja/nej). Vanligen kodar man ja som en etta, och nej som en nolla. De blir då så kallade dummyvariabler.

Man kunde ju också tänka sig att man har dubbelalternativ – det går ju bra om det inte är så många diagnoser. Har man tre svarsalternativ blir det ju sju kombinationer:

1. Depression
2. Psykos
3. Personlighetsstörning
4. Depression + psykos
5. Depression + personlighetsstörning
6. Psykos + personlighetsstörning
7. Depression + psykos + personlighetsstörning

Lägger man till ett till alternativ blir det fem kombinationer till om jag inte räknar fel, och då börjar det bli rätt otympligt. Jag skulle därför rekommendera att du börjar med att göra en variabel för varje diagnos. Då kan du lätt se hur många som har depression, psykos och personlighetsstörning. Om du sedan vill göra dubbelkategorier kan du göra nya variabler för detta på följande vis. Säg att vi vill göra en variabel för depression + psykos.

Du går då in på Transform –> Compute variable. I rutan ”target variable” skriver du in ”depression_psykos”. I rutan numeric expression skriver du ”0”. Därefter klickar du på knappen ”If” längst ner.

I rutan som kommer upp klickar du i knappen ”Include if case satisfies condition” letar du upp din depressionsvariabel (som kanske heter ”depression”), klickar in den i rutan, och gör sedan samma sak med din psykosvariabel (”psykos”). Sedan skriver du så att det ser ut såhär:

depression = 1 & psykos = 1

Det betyder att bara fall där depression är en etta OCH psykos är en etta kommer med i beräkningarna. Tryck på continue. Därefter klickar du på OK. Vi har nu gjort en ny variabel som heter ”depression_psykos”, där alla som har både depression och psykos har en etta, alla andra har inget värde alls. Vi vill att de andra ska ha en nolla, så gå in på Transform –> Compute variable igen. Låt ”depression_psykos” stå kvar, men ändra ettan i fönstret till en nolla. Därefter går man in på ”If” igen och ändrar ettorna till nollor. Tryck sedan på Continue och OK. SPSS kommer fråga om du vill ”Change existing variable”. Det vill du. Voila!
Du har nu en ny variabel, som har värdet 1 om man har både depression och psykos, och 0 annars. Man kan nu göra samma sak för alla andra kombinationer man är intresserad av.

Om du redan har en datamängd där det kanske finns en variabel med sju olika värden, som jag beskrev ovan, och du mest är intresserad av hur många som har depression (oavsett om man har något annat eller inte), så kan man slå ihop kategorier. Jag har skrivit ett inlägg om hur man gör det här.

5 reaktioner till “Läsarfråga: Hantera flera svarsalternativ i en enkätfråga

    1. Hej Anders!

      Jag har en variabel på nominalskala (svenska län) och där personerna fått kryssa i flera län. Varje alternativ har egen kolumn i SPSS. Mitt problem är dock att jag inte vet hur jag ska genomföra sambandsanalyser i det här fallet, när man fått svara fler än ett län. Jag vill exempelvis testa om det finns en skillnad i nöjdhet i en viss fråga mellan olika län. Hur löser jag detta problem?

      1. Hej Anna!
        Om du har en variabel för varje län kan du ju ta fram genomsnittlig nöjdhet i de olika länen och jämföra så. Om du till exempel vill signifikanstesta skillnaden mellan två län kan du ju göra en ny variabel med tre kategorier – de som svarat det ena, de som svarat det andra, och de som svarat båda två. Möjligen. Men överlag är det ju ganska svårt med sambandsanalyser på nominalskalor.

        /Anders

  1. Hej igen Anders!
    Det är inte själva skalnivån på län-variabeln som ställer till det för mig, utan just att man fått svara flera län. Den andra variabeln ”nöjdhet” är på ordinalskala och består av ett antal påståenden där man fått svara ”mycket missnöjd —- mycket nöjd”. Problemet här är att variabeln är på ordinalskala och då kan man inte räkna fram medelvärden. Möjligtvis skulle man kunna använda ett tjitvå-test, men detta är ett test för oberoende. Blir det inte någon form av beroende om man får svara flera alternativ?

  2. Hej!

    Jag har ett liknande problem. Jag har en data där en fråga om man försökt påverka politiken i kommunen har kodats med varje alternativ som enskilda variabler. Det finns alltså ”Har inte försökt påverka” samt åtta olika former av påverkan. Jag vill slå ihop dessa till en variabel där man antingen har försökt påverka (kryssat för en eller flera av de åtta) eller inte, alltså har kryssat för ”har inte försökt påverka”-variabeln. Hur gör jag detta?

    Tack!

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s