|
|
Vraag gesteld door ellen83 op 07-03-2010Hallo,
Ik gebruik bij mijn onderzoek (n=116) 1 afhankelijke variabele en 2 onafhankelijke variabelen. Bij het bekijken of zij normaal verdeeld zijn blijkt dat er bij de eerste onafhankelijke variabele 2 outliers zijn (bij de mannen) en 1 extreme (bij de vrouwen). Bij de andere onafhankelijke variabele zijn er 4 outliers (bij de vrouwen). Ik ben bezig met correlaties te berekenen tussen deze variabelen.
Nu wil ik ook kijken of er andere correlaties uitkomen als ik deze outliers en extreme verwijder, maar hoe voer ik dit in (in SPSS?)
Maakt het veel uit of deze outliers aanwezig zijn (en de extreme?)
Groet Ellen Antwoord gegeven door Gilles op 12-03-2010Hoi Ellen,
Bij het berekenen van de correlatie is informatie over de influential data points van belang, dit hoeven niet perse outliers te zijn (kan wel), dit zijn data-punten met teveel invloed. Bij een correlatie zou het bijvoorbeeld zo kunnen zijn dat door het weglaten van zo een invloedrijk geval je correlatie erg naar beneden of naar boven gaat. In SPSS kan je zien welke datapunten teveel invloed hebben adhv. Mahalanobis distances, Cook s en de Leverage values (door ze aan te vinken als save in regressie p.230 ev. Field (2009, 3th ed). Met select if (select cases onder data in SPSS) kan je aanvinken over welke cases je de analyse wilt doen.
Succes! Manon
|
uitleg
Bij de methodologiewinkel kunt u terecht met vragen van statistische en methodologische aard.
U dient eerst een gebruikersnaam en
wachtwoord aan te maken. Daarna gaat u naar 'stel een vraag'.
De vragen worden beantwoord door studenten met een uitgebreide statistische
en methodologische achtergrond.
inloggen
Wachtwoord vergeten? Laat uw gebruikersnaam en wachtwoord
per email versturen.
|