Läsarfråga: Analysera grupper separat

Q: Vi har en ”grupp” variabel som består av 1= läpp och 2= läpp-käk-gomspalt. Har satt etikett på den enskilda variabeln genom att fylla i fönstret Values.

Sen när vi gör frekvensanalyser så baseras ju alla analyser på både 1 och 2 men vi vill ju kunna analyser dem var för sig, hur gör vi?

A: Det enklaste sättet är att använda sig av ”data–>split file”. Där klickar ni in ”organize output by groups”, och anger bara att ni vill använda er gruppvariabel när ni delar filen. Alla analyser ni gör efter det kommer att delas upp på de olika värdena i gruppvariabeln. Om ni sedan vill göra analyser på hela urvalet sen så går ni bara in på ”data–>split file” och trycker i ”analyze all cases, do not create groups”.

23 reaktioner till “Läsarfråga: Analysera grupper separat

 1. Vi ska göra en multivariata regressionsmodell där vi har identifierat confounders ex (mammans utbildnings nivå) som påverkar amningsduration och förlossningsätt. Förlossningsättet är beroendevariabeln och amningsdurationen instrumentelvariabel, tror vi. Är vi på fel spår. Hur kan vi sätta in dessa variabler i spss, när vi ska beräkna med multivarita regressions modellen??

  1. Hej Camilla!
   Vad är frågeställningen, dvs, vad är det ni vill förklara? Är det förlossningssätt? Eller amningsduration? Jag har svårt att tänka mig att amningsduration kan vara varken oberoende variabel (det som förklarar) eller instrumentvariabel till förlossningssätt, eftersom man ammar efter förlossningen, givet att det är samma barn ni pratar om.

   Utbildning kan ju tänkas förklara både förlossningssätt och amningsduration. Den går alltså att använda som oberoende variabel eller kontrollvariabel. Man lägger in oberoende variabler och kontrollvariabler på samma sätt i SPSS, och skiljer endast på dem när man tolkar resultaten.

   Överlag tror jag inte ni behöver bry er om instrumentvariabler. Fokusera på beroende och oberoende variabel, och eventuella kontrollvariabler.

   Beroende variabel är det som ska förklaras. Oberoende variabel är det som förklarar.
   Confounders (som man behöver kontrollera för) är variabler som kan påverka både oberoende och beroende variabel.

   Ni kan läsa om hur man gör en regression på det här inlägget:
   https://spssakuten.wordpress.com/2009/12/21/regressionsanalys-1/

   /Anders

 2. Hej
  Jag har använt mig av ett program som mäter responstider implicit (IAT), och dessa tider har omkodats till D-värden enligt vad Greenwald (1995) rekommenderar. Jag undrar hur man på ett bra sätt kan förklara vad detta D-värde egentligen innebär.

 3. Hej! Jag undrar hur man kan få programmet att rita grafer av en variabel i förhållande till alla andra. Jag försöker analysera ett patientmaterial där jag har en mängd information om varje patient. Jag vill får grafer på hur till exempel en hjärtrytm förhåller sig mot ålder, kön, rökare/icke rökare mm för varje patient. Det går att göra ett åt gången i chart builder med variabeln jag vill undersöka i rows panel variable och de olika förutsättningarna som kön, ålder etc i X-axis. Jag undrar om det finns ett sätt att få programmet att göra detta för alla variabler automatiskt så det går fortare. Svårt att förklara, jag är inte så haj på detta. Hoppas någon förstår och kan svara…

 4. Hej!
  Jag har 200 enkätsvar, som jag delat in i tre grupper efter en viss variabel. Jag vill nu se hur de obereonde variablernas påverkan på den beroende variabeln skiljer sig åt mellan de tre grupperna! Hur gör jag? Jag vill alltså inte bara undersöka om regressionen för grupp ett signifikant skiljer sig från regressionen för grupp två och tre, utan också se om variabel si och så signifikant skiljer sig åt mellan de olika grupperna… Mycket tacksam för svar!

  1. Hej Mimmi!
   Om du vill se om den oberoende variabelns påverkan på den beroende variabeln skiljer sig åt inom de olika grupperna ska du göra en regressionsanalys med interaktionseffekter:
   https://spssakuten.wordpress.com/2010/03/29/guide-regressionsanalys-med-interaktionseffekter/

   I exemplet på guiden har jag bara två grupper, men du ser bara till att ha två dummyvariabler, en för grupp 2 och en för grupp 3, och så har du två interaktionstermer också, en som är den oberoende variabeln * dummyvariabeln för grupp 2, och en som är den oberoende variabeln * dummyvariabeln för grupp 3.

   /Anders

 5. Hej jag har en fråga gällande beroende variabler? Om jag vill testa prestation för pappas företag med tobins q värde måste jag då köra det parallellt med ROA?

 6. Hej och tack för er folkbildande insats!
  Mitt problem är som följer: Jag har en patientgrupp (ca 600) och en kontrollgrupp (ca 100). Patientgruppen har poäng på vissa variabler som kontrollgruppen saknar poäng på. Det jag nu vill göra är att undersöka:
  1, om gruppernas resultat skiljer sig åt på ett gäng andra variabler
  2, om patientgruppens resultat på dessa andra variabler kan relateras till deras grad av svårighet (antal poäng) på de ursprungliga variablerna.

  Vilka test skall jag använda och hur?

   1. Hej igen och tack!
    För regressionanalysen tänkte jag ta fram summapoänger. I count values within cases finns denna funktion, men programmet verkar endast räkna frekvenser av angedda värden totalt. Hur göra för att få till en sammanräkning där t.ex. 0,5, 1, 4 summeras till 5,5 och inte 3??

    Mvh Martin

   2. Jadu, om det handlar om att summera värden från flera olika variabler så gör du det lätt med ”Transform->Compute”. I rutan ”target variable” skriver du då in namnet på en ny variabel, typ ”sum_points”. I rutan ”Numeric expression” skriver du in detta om du vill summera värdena på variabel1 variable2 och variabel3:

    variabel1 + variabel2 + variabel3

    En person som har 1 på variabel1, 2 på variabel2 och 3 på variabel3 får då 1+2+3 = 6 på variabeln ”sum_points”.

    /Anders

 7. Grymt!
  Om jag sen vill använda dessa summerade variabler som beroende variabler och lägga in ordinala variabler som prediktorer – vilken modell av regression skall jag välja då?

 8. Hej,
  Jag behöver skapa en variabel ’SubID’ som numrerar våra respondenter sekventiellt. Vi har en ’repeated measures’ design med flera observationer per respondent. Antalet observationer är inte heller samma för varje respondent. Vad vi har är en annan variabel för hushållet (HHschedule_no) som är repeterad för varje hushållsmedlem för vilka vi har observationer. För varje respondent har vi även deras ’lineno’ ifrån vår hushålls ’roster’, och eftersom varje respondent kan ha flera observationer är denna ’lineno’ likaså repeterad för varje observation per respondent. Vad jag fastnat på, och vad som gör det hela komplicerat, är att ’lineno’ naturligtvis är ’nested’ i ’HHschedule_no’. Vår data med de två variablerna ser ut så här, och vi vill skapa en ’SubID’ som tar samma form som i exemplet nedan.

  Hhschedule_no lineno SubId
  1 2 1
  1 2 1
  1 5 2
  1 5 2
  2 2 3
  2 4 4
  2 4 4
  3 3 5
  4 2 6
  4 2 6
  4 4 7
  4 4 7
  4 4 7
  4 6 8
  4 6 8

  Hur kan vi lösa detta?

  Tack på förhand och ursäkta anglicismerna.
  Mattias

 9. Hej,

  Jag har ett dataset med sammansatta före/efter variabler (före=1, efter=2). Efter att ha separerat variablerna (Split File) vill jag räkna ut Chi2 (för att jämföra dem med varandra) men där kvarstår variablerna som sammansatta. Hur löser jag detta?

  Tack på förhand.
  /Emelie

  1. Hej Emelie!
   Hmm, snarare än att använda Split file ska du väl använda din före-eftervariabel som oberoende variabel i din analys? Om du till exempel har med variablen i en korstabell kan du då få fram om fördelningen i den beroende variabeln skiljer sig signifikant (utifrån Chi2) beroende på vilket värde man har på den oberoende variabeln (alltså före eller efter). Eller missförstår jag det hela?

   /Anders

 10. Hej!
  Jag har ett par tester genomförda, men behöver hjälp med vilken statistisk analysmetod som ska användas.
  Första testet handlar om ett kroppsviktsreduceringsprogram på 10 individer, där har det mätts kroppsvikt före och efter. Vad ska jag använda för statistisk analys?
  Test nummer två har uppmätt VO2-max samt kroppsvikt för 12 individer.
  Test nummer tre har kollat på tid (s) vid balanstest (stående på ett ben) bland slumpmässigt utvalda 8-åringar och 10-åringar.

  Kan ni hitta några eventuella frågeställningar till dessa data vore det jättebra. Första kanske kan vara en frågeställning om det råder signifikant skillnad mellan vikten före och efter programmet?

  1. Hej Per!
   Fragestallningarna far du komma pa utifran teorin. Vad vore intressant att veta utifran den?

   Nar det galler den statistiska metoden kan kanske t-test vara lampligt. Du hittar guide till det har pa bloggen.

   /Anders

 11. Jag ska jämföra VAS före och efter en procedur samt Välbefinnande före och efter procedur. Jag har tre olika procedurer som jag vill testa och se om det gör ont, men jag får inte till det alls. Först la jag in de tre olika procedurerna som values från 1-3 men jag få ringa bra analyser. Jag måste ha gjort eller tänkt fel när jag la in datan, jag har bara lagt in allt och kodat det som VAS1 och VAS2 osv. Hjälp?

  1. Hej Ann!
   Ett sätt är att göra två nya variabler, som är skillnaden i välbefinnande mellan före och efter.
   Därefter undersöker du medelvärdena i de olika grupperna med hjälp av en ANOVA, och ser om det finns signifikanta skillnader:
   https://spssakuten.wordpress.com/2010/12/21/guide-envags-variansanalys-anova/

   Man kan också tänka sig att man lägger in det i en panelstruktur, men det är krångligare. Då ska varje person vara med två gånger, en för före och en för efter.

   Men det enklaste är att göra differensvariabler tror jag.

   /Anders

 12. Hej

  Min data är uppdelade i två parametrar:
  Diskograferad = 1 eller 0.
  Orsak diskografi 1, 2, 3 eller 4 (de som ej diskograferats är märkta med 0 eller saknar värde(testat båda)).

  Oavsett vilken jag kör split file på så går det inte att köra en Nonparametric tests / Independent Samples analys på materialet. Får då följande felmeddelande.

  ”composite component split, data block [OrsakDisk=1.0000000000000000] npar: There is no test created
  Execution of this command stops.”

  Någon som har en bra gissning på vad jag gör fel?

  Mvh
  Wilhelm G.

 13. Just for the future reference to anyone who gets the ”Composite Component Split, Data Block [OrsakDisk = 1.0000000000000000] npar: There is no test created
  Execution of this command stops.” error line, please check the variables you are using for the level of measurement: if it is nominal, no tests are produced and the error line occurs, if you change this to higher levels of measurement (ordinal, scale), the tests are run.

 14. När jag gör detta kan jag inte göra en korstabell. Jag har en undersökning där jag vill se sjuksköterskors sjukfrånvaro i förhållande till läkares, men med variabeln ”yrke” får jag se alla yrkeskategoriers sjukfrånvaro. Hur gör jag för att dela upp ”yrke”-kategorin så att jag kan se läkare resp. sjuksköterskors sjukfrånvaro?

Kommentera

Fyll i dina uppgifter nedan eller klicka på en ikon för att logga in:

WordPress.com-logga

Du kommenterar med ditt WordPress.com-konto. Logga ut /  Ändra )

Facebook-foto

Du kommenterar med ditt Facebook-konto. Logga ut /  Ändra )

Ansluter till %s