|
|
Vraag gesteld door fabiola op 02-02-2010Hoi
Voor mijn onderzoek moet ik de outliers opzoeken,
nu weet ik dat je op een bepaalde manier een rij in je data krijgt en alles boven de 3 dus eruit moet,
maar hoe moet dat en kun je dan alle gegevens tegelijk invoeren, aangezien ze op elk vlak uit moeten vallen? Antwoord gegeven door Gilles op 08-02-2010Hoi Fabiola,
Ten eerste haal je nooit zomaar outliers weg uit je bestand dit moet je goed overwegen op basis van theorie. Een proefpersoon/observatie met een extreme score is niet per sé een outlier. Een outlier die je zomaar weg kan halen is bv een score die buiten het scorebereik ligt.
Ik denk dat wat je bedoelt is dat alles dat een waarde heeft boven drie standaardafwijkingen van het gemiddelde eruit moet. Je kan in SPSS bij analyze -> descriptive statistics -> discriptives in ieder geval zien wat mogelijke extreme waarden zijn met het proefpersoonnummer ernaast. Als jij aanleiding hebt om aan te nemen dat dit outliers zijn dan kan je ze er handmatig uitfilteren (zorg wel dat je altijd een bestand hebt met alle proefpersonen, gooi nooit zomaar proefpersonen weg). Wat jij wil is denk ik een lijst van standaardafwijkingen (dit moet helaas dan per variabele), en als daar een boven de drie is dan filter je de proefpersoon eruit.
De vraag is alleen dus of dat wenselijk is, zomaar proefpersonen met een extreme waarde er uit gooien. Sowieso verwacht je dat 1 % van je data hoger is dan 3 standaardafwijking.
Als je je analyse gaat doen, doe hem dan een keer met en een keer zonder uitbijters. Als de resultaten verschillen, rapporteer dan beide resultaten.
|
uitleg
Bij de methodologiewinkel kunt u terecht met vragen van statistische en methodologische aard.
U dient eerst een gebruikersnaam en
wachtwoord aan te maken. Daarna gaat u naar 'stel een vraag'.
De vragen worden beantwoord door studenten met een uitgebreide statistische
en methodologische achtergrond.
inloggen
Wachtwoord vergeten? Laat uw gebruikersnaam en wachtwoord
per email versturen.
|