Läsarfråga: Hantera flera svarsalternativ i en enkätfråga

Q: Det är så att jag håller på att mata in uppgifter som ska användas i en rapport. Uppgifterna kommer från bedömningsformulär med frågor och svarsalternativ. Jag har kodat svaren utifrån dessa svarsalternativ. En variabel är exempelvis diagnos. Svarsalternativen blir då t.ex. 1=Depression, 2=Psykos, 3=Personlighetstörning etc. Så långt inga problem.

Men nu är det ju då så att en enskild person som detta gäller kan ha fler än en diagnos och min fråga är hur jag bäst hanterar detta? I en tidigare rapport som gjorts har man löst det genom att komponera svarsalternativ som innehåller dubbeldiagnoser, ex alt 4=depression+psykos. Problemet med detta är ju att om jag då vill veta hur många som hade depression som diagnos så måste jag ju räkna ihop både alternativ 1 och 4. Finns det något bra sätt att använda systemet på till detta? Kan man t.ex. använda sig av klassindelningar ifall man nu gör alternativ för dubbeldiagnoser? Alltså där man gör om 1 och 4 till en gemensam klass? Eller kan man på något sätt ange flera svarsalternativ för en variabel för samma inmatning, i det här fallet för en patient?

Fortsätt läsa ”Läsarfråga: Hantera flera svarsalternativ i en enkätfråga”

Guide: Regressionsanalys med interaktionseffekter

I det här (långa, men intressanta) inlägget ska vi:

Skapa en interaktionsvariabel
Göra en regressionsanalys med en interaktionsvariabel.
Tolka resultaten.
Diskutera fördelarna med att använda sig av interaktionsvariabler istället för att göra separata analyser.

Fortsätt läsa ”Guide: Regressionsanalys med interaktionseffekter”

Guide: Logaritmera en variabel

I det här inlägget ska vi:

Transformera en snedfördelad variabel så att den blir mer normalfördelad.
Ta fram histogram över variabeln.

Fortsätt läsa ”Guide: Logaritmera en variabel”

Omröstning: Vad ska nästa guide handla om?

Jag hade tänkt göra en ny guide till någon typ av analys och lägga upp här på bloggen. Tyvärr har jag inte så mycket tid som jag skulle önska, och undrar därför vad som egentligen efterfrågas. Vad ska nästa guide handla om?

Jag har försökt tänka ut några ämnen till saker som är bra att kunna och gjort en omröstning. Lägg din röst på det du helst vill se i nästa guide. Om det inte finns med i listan, välj ”Other”, och skriv vad du önskar dig!

Läsarfråga: Koda som siffror eller som text

Q: Jag kodar en datamängd för hand, och jag undrar hur jag ska skriva in olika kategoriska variabler, som till exempel parti. Det finns väl kanske egentligen ingen anledning att numrera dem, eller? Går det lika bra med bokstavsförkortningar (lättare att avläsa)?

Fortsätt läsa ”Läsarfråga: Koda som siffror eller som text”

Läsarfråga: Ordinalskalor som beroende variabel

Q: Jag har ett svagt minne av att jag under en lektion i kvantitativ metod hörde att ordinalskaltyper kan behandlas som kontinuerliga utfallsvariabler i multivariat regressionsanalys om de har 5 skalsteg eller mer. Stämmer detta?

Fortsätt läsa ”Läsarfråga: Ordinalskalor som beroende variabel”

Lögn, förbannad lögn och statistik

Statistik är ett utmärkt verktyg för att undersöka saker i samhället. Men statistiska undersökningar bygger sällan på totalurval, dvs att man undersökt alla de enheter man är intresserad av. Istället använder man sig av slumpmässiga urval. Om man till exempel vill veta hur många av Sveriges väljare som kan tänka sig att rösta på socialdemokraterna är den säkraste metoden naturligtvis att leta upp varenda väljare och fråga dem. Eftersom det är ganska opraktiskt väljer man istället ut ett par tusen väljare slumpmässigt, och frågar dem. Man antar sedan att de är representativa för resten av befolkningen. Men den här metoden gör att det blir en viss osäkerhet kring resultaten, en felmarginal. Utifrån felmarginalen kan vi sedan ta fram ett konfidensintervall. Vi kan sedan med en viss procents säkerhet, till exempel 95 procent, säga att det sanna värdet befinner sig inom konfidensintervallet.

Fortsätt läsa ”Lögn, förbannad lögn och statistik”

Läsarfråga: Multikollinearitet i dummyvariabler

Q: En av variablerna som jag testar i multipel linjär regression har svarsalternativen 1= aldrig, 2=sällan, 3=ofta, 4= väldigt ofta. Jag har i analysen nu gjort dummyvariabler av samtliga utom nr 4, vilken jag jämför med. Så långt inga problem. Däremot går jag problem med multikollinearitet i variablerna 1 & 2 när jag lägger in dem i en regressionsmodell med andra variabler. Spontant känns det inte så underligt att de kanske är beroende av varandra och verkar liknande på den beroende variabeln eftersomd de är skapade ur samma grundvariabel. Men hur tar jag hänsyn till detta? (väger jag samman svar 1 & 2 har jag åter en tolerabel nivå för multikollinearitet men jag skulle föredra att inte göra på detta vis).

Fortsätt läsa ”Läsarfråga: Multikollinearitet i dummyvariabler”

Läsarfråga: Slå ihop datamängder, korstabeller, t-test.

Q: Jag håller på att skriva en longitudinell kvantitativ studie där jag jämför data från olika utgåvor av Eurobarometern. Som läget ligger nu har jag jämfört dessa för hand men min handledare hävdar att det skall gå att slå ihop datamängder elektroniskt (två åt gången duger för mig) och då testa signifikans med hjälp av ett enkelt t-test. Hur slår jag ihop datamängderna och hur behandlar jag datan efter detta? Jag skall jämföra svaren på en fråga mellan två länder (olika för varje undersökning) och eventuellt kontrollera för kön, det är alltså alldeles vanliga Crosstabs jag arbetar med.

Fortsätt läsa ”Läsarfråga: Slå ihop datamängder, korstabeller, t-test.”

Läsarfråga: Ordinalskalor till dummies

Q: Jag har några frågor gällande ordinaldata och multivariat analys:
1. Om jag gör en linjär multipel regression och har en oberoende variabel som är ordinal, ska jag då göra en dummy variabel av denna eller inte?
2. Om jag gör logistisk regression och en av de oberoende variablerna är ordinal, gör jag då dummys eller behandlar jag variabeln som kategorisk och väljer en referensgrupp?
Fortsätt läsa ”Läsarfråga: Ordinalskalor till dummies”