Vraag gesteld door ellen83 op 07-03-2010

Hallo,
Ik gebruik bij mijn onderzoek (n=116) 1 afhankelijke variabele en 2 onafhankelijke variabelen. Bij het bekijken of zij normaal verdeeld zijn blijkt dat er bij de eerste onafhankelijke variabele 2 outliers zijn (bij de mannen) en 1 extreme (bij de vrouwen). Bij de andere onafhankelijke variabele zijn er 4 outliers (bij de vrouwen). Ik ben bezig met correlaties te berekenen tussen deze variabelen.
Nu wil ik ook kijken of er andere correlaties uitkomen als ik deze outliers en extreme verwijder, maar hoe voer ik dit in (in SPSS?)
Maakt het veel uit of deze outliers aanwezig zijn (en de extreme?)
Groet Ellen

Antwoord gegeven door Gilles op 12-03-2010

Hoi Ellen,

Bij het berekenen van de correlatie is informatie over de influential data points van belang, dit hoeven niet perse outliers te zijn (kan wel), dit zijn data-punten met teveel invloed. Bij een correlatie zou het bijvoorbeeld zo kunnen zijn dat door het weglaten van zo een invloedrijk geval je correlatie erg naar beneden of naar boven gaat. In SPSS kan je zien welke datapunten teveel invloed hebben adhv. Mahalanobis distances, Cook s en de Leverage values (door ze aan te vinken als save in regressie p.230 ev. Field (2009, 3th ed). Met select if (select cases onder data in SPSS) kan je aanvinken over welke cases je de analyse wilt doen.

Succes! Manon 

uitleg

Bij de methodologiewinkel kunt u terecht met vragen van statistische en methodologische aard. U dient eerst een gebruikersnaam en wachtwoord aan te maken. Daarna gaat u naar 'stel een vraag'.

De vragen worden beantwoord door studenten met een uitgebreide statistische en methodologische achtergrond.

inloggen

gebruikersnaam:
wachtwoord:

Wachtwoord vergeten? Laat uw gebruikersnaam en wachtwoord per email versturen.

Wat is RSS? RSS