Was ist eine Stichprobenverzerrung?

Eine Verzerrung der Stichprobe liegt vor, wenn die Person oder die Gruppe, die die Personengruppe für die Analyse ausgewählt hat, dies nicht zufällig getan hat. Je wahrscheinlicher diese Art von Verzerrung ist, desto weniger zuverlässig sind unsere Schlussfolgerungen.

Inhaltsverzeichnis

Arten der Stichprobenverzerrung
Praktische Beispiele für Stichprobenverzerrungen
Wie kann man Stichprobenverzerrung vermeiden?

Arten der Stichprobenverzerrung

Stichprobenverzerrung

Eine Stichprobenverzerrung liegt vor, wenn Sie eine Stichprobe von etwas nehmen, aber einige Personen nicht in der Stichprobe enthalten sind. Dies kann passieren, weil diese Personen nicht für die Stichprobe ausgewählt wurden oder weil sie sich weigern, in die Stichprobe aufgenommen zu werden. In diesem Fall sind die in der Stichprobe enthaltenen Personen möglicherweise nicht repräsentativ für die Grundgesamtheit.

Forscher verwenden Stichproben, um die Grundgesamtheit zu untersuchen. Eine Stichprobe ist eine Gruppe von Personen oder Dingen. Sie ist nicht die gesamte Bevölkerung. Stichprobenverzerrung bedeutet, dass Fehler bei der Auswahl der Stichprobe dazu führen können, dass sich die Stichprobe von anderen Stichproben unterscheidet. Dies kann sich auf unsere Fähigkeit auswirken, das, was wir von einer Stichprobe lernen, auf eine andere zu verallgemeinern. Eine Person, die eine voreingenommene Gruppe von Personen auswählt, hat einen Selektionsbias, da Fehler in jedem Prozess nach der Auswahl auch diese Art von Problem beeinflussen.

Beispiele für Stichprobenverzerrungen sind die Selbstselektion, die Vorauswahl von Studienteilnehmern, der Ausschluss von Studienteilnehmern/Tests, die nicht bis zum Ende durchgeführt wurden, und die Migrationsverzerrung durch den Ausschluss von Studienteilnehmern, die kürzlich in das oder aus dem Studiengebiet umgezogen sind, die Längenverzerrung, bei der eine sich langsam entwickelnde Krankheit mit einer besseren Prognose erkannt wird, und die Vorverzerrung, bei der die Krankheit bei den Studienteilnehmern früher diagnostiziert wird als in den Vergleichspopulationen, obwohl der durchschnittliche Krankheitsverlauf der gleiche ist.

Zeitintervall

Eine Studie kann vorzeitig beendet werden, wenn die Ergebnisse besser sind als erwartet. Eine Möglichkeit, eine Studie zu beenden, besteht darin, sie bei einem Extremwert zu beenden (oft aus ethischen Gründen). Der Extremwert wird jedoch wahrscheinlich von der Variablen mit der größten Varianz erreicht, selbst wenn alle Variablen einen ähnlichen Mittelwert haben.

Exposition (Anfälligkeitsverzerrung)

Ein klinischer Suszeptibilitätsbias liegt vor, wenn eine Krankheit die Wahrscheinlichkeit erhöht, an einer anderen Krankheit zu erkranken. Wenn Sie beispielsweise an einem postmenopausalen Syndrom leiden, haben Sie ein höheres Risiko, an Endometriumkarzinom zu erkranken. Dies kann passieren, weil Östrogene das Problem verschlimmern können.

Bei der protopathischen Verzerrung könnte man meinen, dass die Behandlung der ersten Symptome einer Krankheit das Ergebnis verursacht. Dies ist jedoch nicht der Fall. Wenn zwischen dem Auftreten der Symptome und dem Beginn der Behandlung eine gewisse Zeit verstrichen ist, könnten sie sich geirrt haben. Dies kann durch Lagging vermieden werden, d. h. durch den Ausschluss von Expositionen, die in einem bestimmten Zeitraum vor der Diagnose stattgefunden haben.

Ein Indikationsbias tritt auf, wenn Menschen behandelt werden, die mit hoher Wahrscheinlichkeit die Krankheit entwickeln werden. In diesem Fall erhalten mehr Personen mit der Krankheit die Behandlung. Dies könnte darauf hindeuten, dass die Behandlung sie krank gemacht hat.

Daten

Partitionierung (Aufteilung) von Daten mit Kenntnis des Inhalts der Partitionen und anschließende Analyse mit Tests, die für blind gewählte Partitionen ausgelegt sind.

Post-hoc-Änderung der Dateneinbindung aufgrund willkürlicher oder subjektiver Gründe, einschließlich:

Rosinenpickerei, die eigentlich keine Selektionsverzerrung ist, sondern eine Bestätigungsverzerrung, wenn bestimmte Teilmengen von Daten ausgewählt werden, um eine Schlussfolgerung zu unterstützen (z. B. das Zitieren von Beispielen von Flugzeugabstürzen als Beweis dafür, dass Flugreisen unsicher sind, während die weitaus häufigeren Beispiele von Flügen, die sicher abgeschlossen werden, ignoriert werden. )
Ablehnung von schlechten Daten aus willkürlichen Gründen, statt nach vorher festgelegten oder allgemein vereinbarten Kriterien oder Verwerfen von “Ausreißern” aus statistischen Gründen, die wichtige Informationen, die aus “wilden” Beobachtungen abgeleitet werden könnten, nicht berücksichtigen.

Studien

Auswahl der in eine Meta-Analyse einzubeziehenden Studien.

Durchführung von Wiederholungsexperimenten und Berichterstattung nur über die günstigsten Ergebnisse, eventuell Umbenennung von Laborprotokollen anderer Experimente als “Kalibrierungsversuche”, “Gerätefehler” oder “Voruntersuchungen”.

Darstellung des aussagekräftigsten Ergebnisses einer Datenauswertung, als handele es sich um ein einzelnes Experiment (was logischerweise dasselbe ist wie der vorherige Punkt, aber als viel weniger unehrlich angesehen wird).

Attrition Bias (Ausfälle)

Der Attrition Bias ist eine Art Selektionsverzerrung, die durch den Verlust von Teilnehmern verursacht wird, indem Probanden/Tests, die nicht bis zum Ende durchgeführt wurden, nicht berücksichtigt werden. Er ist eng verwandt mit dem Survivorship Bias, bei dem nur die Probanden, die einen Prozess “überlebt” haben, in die Analyse einbezogen werden, oder dem Failure Bias, bei dem nur die Probanden, die einen Prozess “nicht bestanden” haben, in die Analyse einbezogen werden. Der Failure Bias umfasst Dropout, Nonresponse (geringere Antwortrate), Abbruch und Protokollabweichungen. Sie führt zu verzerrten Ergebnissen, wenn sie in Bezug auf die Exposition und/oder das Ergebnis ungleich ist. Beispielsweise kann der Forscher bei der Erprobung eines Diätprogramms alle Teilnehmer, die die Studie abbrechen, einfach ausschließen, aber die meisten Teilnehmer, die die Studie abbrechen, sind diejenigen, bei denen die Diät nicht funktioniert hat. Unterschiedliche Verluste von Probanden in der Interventions- und der Vergleichsgruppe können die Charakteristika dieser Gruppen und die Ergebnisse unabhängig von der untersuchten Intervention verändern.

Lost to Follow-up ist eine weitere Form des Attrition Bias, die vor allem bei medizinischen Studien über längere Zeiträume auftritt. Non-Response oder Retention Bias kann durch eine Reihe von materiellen und immateriellen Faktoren beeinflusst werden, wie z. B. Wohlstand, Bildung, Altruismus, anfängliches Verständnis der Studie und ihrer Anforderungen. Forscher können auch nicht in der Lage sein, Folgekontakte herzustellen, weil die in der anfänglichen Rekrutierungs- und Forschungsphase gesammelten Identifikations- und Kontaktinformationen unzureichend sind.

Observer selection

Die Daten werden auf verschiedene Weise gefiltert. Sie können aufgrund des gewählten Studiendesigns oder der Messung gefiltert worden sein. Sie können aber auch durch die Art und Weise gefiltert sein, wie sie zustande gekommen sind – wenn jemand eine Studie durchgeführt hat und diese mit den Daten in Verbindung gebracht wird, dann treten Beobachtungsselektionseffekte auf und man muss anthropologisches Denken anwenden, um sie zu verstehen.

Ein Beispiel ist, was in der Vergangenheit auf der Erde passiert ist. Wenn große Einschläge Massenaussterben und ökologische Störungen verursachen, können sie intelligente Beobachter davon abhalten, sich lange genug zu entwickeln, um Beweise für einen kürzlichen Einschlag zu sehen. Aber es könnte eine Verzerrung geben, und das sollten wir berücksichtigen, wenn wir über astronomische Bedrohungen des Lebens nachdenken.

Volunteer Bias

Eine weitere Gefahr für die Validität einer Studie stellt der Selbstselektionsbias oder Volunteer Bias in Studien dar, da diese Teilnehmer inhärente Merkmale aufweisen können, die sich von denen der Zielpopulation der Studie unterscheiden.

Studien haben gezeigt, dass Probanden eher aus höheren sozialen Schichten stammen als aus niedrigeren sozioökonomischen Schichten. Darüber hinaus zeigt eine andere Studie, dass Frauen eher als Männer an Studien teilnehmen.

Die Voreingenommenheit von Probanden zeigt sich während des gesamten Lebenszyklus der Studie, von der Rekrutierung bis zur Nachbeobachtung. Im Allgemeinen kann die Teilnahme von Freiwilligen auf individuellen Altruismus, den Wunsch nach Anerkennung, eine persönliche Beziehung zum Studienthema und andere Gründe zurückgeführt werden. Wie in den meisten Fällen ist die Abschwächung des Volunteer Bias eine Erhöhung der Stichprobengröße.

Praktische Beispiele für Stichprobenverzerrungen

Ein tieferes Verständnis von Stichprobenverzerrungen lässt sich durch reale Beispiele erreichen. Hier sind zwei anschauliche Fälle:

Die Wahlumfrage des Literary Digest (1936): Diese berühmte Umfrage prognostizierte einen Erdrutschsieg für Alfred Landon gegen Franklin D. Roosevelt. Der Fehler lag in der Auswahl der Befragten. Das Magazin nutzte seine wohlhabenden Leser für die Umfrage, was eine erhebliche Verzerrung darstellte. Roosevelts Unterstützung in der breiten Öffentlichkeit wurde dadurch massiv unterschätzt.
Survivorship Bias in der Finanzwelt: Hierbei analysieren Investoren und Analysten häufig nur die Unternehmen, die erfolgreich waren, und ignorieren die, die gescheitert sind. Diese Verzerrung führt zu einer überoptimistischen Sicht auf den Markt und kann riskante Anlagestrategien nach sich ziehen.

Diese Beispiele illustrieren, wie wichtig es ist, bei der Gestaltung von Umfragen und Studien eine repräsentative Stichprobe sicherzustellen.

Wie kann man Stichprobenverzerrung vermeiden?

Um Stichprobenverzerrung zu vermeiden, gibt es einige Schritte, die man unternehmen kann:

Definieren Sie die Population: Bevor Sie eine Stichprobe auswählen, sollten Sie zunächst die Population definieren, auf die sich die Ergebnisse der Studie beziehen sollen. Dies hilft dabei, sicherzustellen, dass die Stichprobe tatsächlich repräsentativ für die Population ist.
Wählen Sie eine geeignete Stichprobentechnik: Es gibt verschiedene Stichprobentechniken, die verwendet werden können, um eine repräsentative Stichprobe zu erhalten. Zum Beispiel kann man zufällig aus der Population auswählen (zufällige Stichprobe), oder man kann bestimmte Gruppen innerhalb der Population gezielt anvisieren (zielgerichtete Stichprobe). Welche Technik am besten geeignet ist, hängt von der Art der Studie und der Population ab.
Vermeiden Sie Selbstauswahl: In manchen Fällen kann es vorkommen, dass sich Menschen freiwillig für eine Studie melden. Dies kann dazu führen, dass die Stichprobe verzerrt ist, da sich nur bestimmte Menschen freiwillig melden (z.B. Menschen, die besonders an dem Thema interessiert sind). Um dies zu vermeiden, sollte man versuchen, eine Stichprobe zufällig aus der Population auszuwählen, anstatt auf freiwillige Teilnehmer zu setzen.
Vermeiden Sie Verzerrung durch nicht-Antwort: In manchen Fällen kann es vorkommen, dass sich nicht alle Menschen, die für eine Studie ausgewählt wurden, auch tatsächlich beteiligen. Dies kann dazu führen, dass die Stichprobe verzerrt ist, da sich nur bestimmte Menschen beteiligen (z.B. Menschen, die besonders engagiert sind). Um dies zu vermeiden, sollte man versuchen, möglichst viele Menschen zur Teilnahme zu motivieren und alle Ergebnisse, auch die von nicht teilnehmenden Personen, in Betracht zu ziehen.
Verwenden Sie ausreichend große Stichproben: Je größer die Stichprobe, desto wahrscheinlicher ist es, dass sie repräsentativ für die Population ist. Es ist daher wichtig, dass die Stichprobe ausreichend groß ist. Wie groß die Stichprobe sein sollte, hängt von der Größe und Komplexität der Population und von den Ergebnissen ab, die man erwartet.
Berücksichtigen Sie eventuelle Untergruppen: In manchen Fällen kann es wichtig sein, dass bestimmte Untergruppen innerhalb der Population besonders berücksichtigt werden, um sicherzustellen, dass die Ergebnisse auch für diese Untergruppen repräsentativ sind. Zum Beispiel könnte es wichtig sein, dass in einer Studie über die Wirksamkeit eines Medikaments die Altersgruppen angemessen vertreten sind.

Indem man diese Schritte beachtet, kann man Stichprobenverzerrung vermeiden und sicherstellen, dass die Ergebnisse einer Studie tatsächlich auf die Population übertragbar sind.