Q: På vilken datanivå ligger frågor med ja- och nej-svar? Blir det skillnad om man lägger till ”Vet ej”?
Etikett: dummyvariabler
Läsarfråga: Dummyvariabler och kontinuerliga variabler i samma regression
Q: I mitt jobb sa ska jag försöka göra en regressionsanalys och testa faktorer som kan inverka på resultaten av mikroföretag. Jag hade tänkt att göra så här: som y ha procentuell skillnad i intäkter och som x variabler ha både dummyvariabler men även kontinuerliga variabler. Min fråga är nu hur gör jag för att kunna blanda dummyvariabler och kontinuerliga variabler i samma regression?
I bloggen skriver du: “När man inte har några andra oberoende variabler än dummyvariabler för en kategori med i modellen kan vi tolka interceptet som medelvärdet för referensgruppen. Men detta gäller alltså bara så länge vi inte har med några andra oberoende variabler.”
Fortsätt läsa ”Läsarfråga: Dummyvariabler och kontinuerliga variabler i samma regression”
Guide: Regressionsanalys med dummyvariabler
I detta inlägg ska vi:
• Gå igenom vad en dummyvariabel är
• Skapa dummyvariabler i SPSS
• Kontrollera så att man kodat rätt
• Tolka effekten av dummyvariabler i regressionsanalys
Läsarfråga: Hantera flera svarsalternativ i en enkätfråga
Q: Det är så att jag håller på att mata in uppgifter som ska användas i en rapport. Uppgifterna kommer från bedömningsformulär med frågor och svarsalternativ. Jag har kodat svaren utifrån dessa svarsalternativ. En variabel är exempelvis diagnos. Svarsalternativen blir då t.ex. 1=Depression, 2=Psykos, 3=Personlighetstörning etc. Så långt inga problem.
Men nu är det ju då så att en enskild person som detta gäller kan ha fler än en diagnos och min fråga är hur jag bäst hanterar detta? I en tidigare rapport som gjorts har man löst det genom att komponera svarsalternativ som innehåller dubbeldiagnoser, ex alt 4=depression+psykos. Problemet med detta är ju att om jag då vill veta hur många som hade depression som diagnos så måste jag ju räkna ihop både alternativ 1 och 4. Finns det något bra sätt att använda systemet på till detta? Kan man t.ex. använda sig av klassindelningar ifall man nu gör alternativ för dubbeldiagnoser? Alltså där man gör om 1 och 4 till en gemensam klass? Eller kan man på något sätt ange flera svarsalternativ för en variabel för samma inmatning, i det här fallet för en patient?
Fortsätt läsa ”Läsarfråga: Hantera flera svarsalternativ i en enkätfråga”
Guide: Regressionsanalys med interaktionseffekter
I det här (långa, men intressanta) inlägget ska vi:
- Skapa en interaktionsvariabel
- Göra en regressionsanalys med en interaktionsvariabel.
- Tolka resultaten.
- Diskutera fördelarna med att använda sig av interaktionsvariabler istället för att göra separata analyser.
Fortsätt läsa ”Guide: Regressionsanalys med interaktionseffekter”
Läsarfråga: Multikollinearitet i dummyvariabler
Q: En av variablerna som jag testar i multipel linjär regression har svarsalternativen 1= aldrig, 2=sällan, 3=ofta, 4= väldigt ofta. Jag har i analysen nu gjort dummyvariabler av samtliga utom nr 4, vilken jag jämför med. Så långt inga problem. Däremot går jag problem med multikollinearitet i variablerna 1 & 2 när jag lägger in dem i en regressionsmodell med andra variabler. Spontant känns det inte så underligt att de kanske är beroende av varandra och verkar liknande på den beroende variabeln eftersomd de är skapade ur samma grundvariabel. Men hur tar jag hänsyn till detta? (väger jag samman svar 1 & 2 har jag åter en tolerabel nivå för multikollinearitet men jag skulle föredra att inte göra på detta vis).
Fortsätt läsa ”Läsarfråga: Multikollinearitet i dummyvariabler”
Läsarfråga: Ordinalskalor till dummies
Q: Jag har några frågor gällande ordinaldata och multivariat analys:
1. Om jag gör en linjär multipel regression och har en oberoende variabel som är ordinal, ska jag då göra en dummy variabel av denna eller inte?
2. Om jag gör logistisk regression och en av de oberoende variablerna är ordinal, gör jag då dummys eller behandlar jag variabeln som kategorisk och väljer en referensgrupp?
Fortsätt läsa ”Läsarfråga: Ordinalskalor till dummies”
Läsarfråga: Hur tolkar man dummyvariabler?
Q: När man har dummykodat variabler så att referenskategori =0 så hamnar referenskategorin som intercept och lutningen som 1? Hur ska man då tolka en negativ laddning? I mitt fall har jag kodat kvinna som 0 och man som 1.