Läsarfråga: Multikollinearitet i dummyvariabler

Q: En av variablerna som jag testar i multipel linjär regression har svarsalternativen 1= aldrig, 2=sällan, 3=ofta, 4= väldigt ofta. Jag har i analysen nu gjort dummyvariabler av samtliga utom nr 4, vilken jag jämför med. Så långt inga problem. Däremot går jag problem med multikollinearitet i variablerna 1 & 2 när jag lägger in dem i en regressionsmodell med andra variabler. Spontant känns det inte så underligt att de kanske är beroende av varandra och verkar liknande på den beroende variabeln eftersomd de är skapade ur samma grundvariabel. Men hur tar jag hänsyn till detta? (väger jag samman svar 1 & 2 har jag åter en tolerabel nivå för multikollinearitet men jag skulle föredra att inte göra på detta vis).

Fortsätt läsa ”Läsarfråga: Multikollinearitet i dummyvariabler”

Läsarfråga: Slå ihop datamängder, korstabeller, t-test.

Q: Jag håller på att skriva en longitudinell kvantitativ studie där jag jämför data från olika utgåvor av Eurobarometern. Som läget ligger nu har jag jämfört dessa för hand men min handledare hävdar att det skall gå att slå ihop datamängder elektroniskt (två åt gången duger för mig) och då testa signifikans med hjälp av ett enkelt t-test. Hur slår jag ihop datamängderna och hur behandlar jag datan efter detta? Jag skall jämföra svaren på en fråga mellan två länder (olika för varje undersökning) och eventuellt kontrollera för kön, det är alltså alldeles vanliga Crosstabs jag arbetar med.

Fortsätt läsa ”Läsarfråga: Slå ihop datamängder, korstabeller, t-test.”

Läsarfråga: Ordinalskalor till dummies

Q: Jag har några frågor gällande ordinaldata och multivariat analys:
1. Om jag gör en linjär multipel regression och har en oberoende variabel som är ordinal, ska jag då göra en dummy variabel av denna eller inte?
2. Om jag gör logistisk regression och en av de oberoende variablerna är ordinal, gör jag då dummys eller behandlar jag variabeln som kategorisk och väljer en referensgrupp?

Fortsätt läsa ”Läsarfråga: Ordinalskalor till dummies”

Läsarfråga: Otymplig variabel

Q: I materialet har jag information för lön i timlön, vilket resulterar i en siffra för antal kronor varje individ tjänar i timmen. Det blir opraktiskt när jag vill använda informationen och försöker därför hitta ett sätt att dela in materialet i i nivåer. Alltså att nivå 1  = 38-78 kr, nivå 2= 79-130 kr osv.. Så exempelvis man kan se hur många kvinnor resp. män ligger i varje intervall.

Vet du hur jag kan göra detta på ett bra sätt??

Fortsätt läsa ”Läsarfråga: Otymplig variabel”