Was ist eine Stichprobenverzerrung?

Eine Verzerrung in der Stichprobe liegt vor, wenn die Person oder Gruppe, die die Personengruppe für die Analyse ausgewählt hat, dies nicht zufällig getan hat. Je wahrscheinlicher diese Art von Verzerrung ist, desto weniger zuverlässig werden unsere Schlussfolgerungen sein.

Arten der Stichprobenverzerrung

Stichprobenverzerrung

Eine Stichprobenverzerrung liegt vor, wenn Sie eine Stichprobe von etwas nehmen, aber einige Personen nicht in der Stichprobe enthalten sind. Dies kann passieren, weil sie nicht für die Stichprobe ausgewählt wurden oder weil sie sich weigern, in die Stichprobe aufgenommen zu werden. Wenn dies geschieht, sind die Personen, die in der Stichprobe enthalten sind, möglicherweise keine genaue Repräsentation aller Personen.

Forscher verwenden Stichproben, um die Bevölkerung zu untersuchen. Eine Stichprobe ist eine Gruppe von Menschen oder Dingen. Sie ist nicht die gesamte Population. Stichprobenverzerrung bedeutet, dass Fehler bei der Auswahl der Stichprobe dazu führen können, dass sie sich von anderen Stichproben unterscheidet. Dies kann sich darauf auswirken, ob wir das, was wir von einer Stichprobe lernen, auf eine andere verallgemeinern können. Eine Person, die eine voreingenommene Gruppe von Menschen auswählt, hat einen Selektionsbias, weil Fehler in jedem Prozess nach der Auswahl auch diese Art von Problem beeinflussen.

Beispiele für Stichprobenverzerrungen sind die Selbstselektion, die Vorauswahl von Studienteilnehmern, der Ausschluss von Studienteilnehmern/Tests, die nicht bis zum Ende durchgeführt wurden, und die Migrationsverzerrung durch den Ausschluss von Studienteilnehmern, die kürzlich in das oder aus dem Studiengebiet umgezogen sind, die Längenverzerrung, bei der eine sich langsam entwickelnde Krankheit mit besserer Prognose erkannt wird, und die Vorlaufzeitverzerrung, bei der die Krankheit bei den Studienteilnehmern früher diagnostiziert wird als in den Vergleichspopulationen, obwohl der durchschnittliche Krankheitsverlauf derselbe ist.

Zeitintervall

Eine Studie kann vorzeitig beendet werden, wenn die Ergebnisse besser als erwartet sind. Eine Möglichkeit, eine Studie zu beenden, besteht darin, sie bei einem Extremwert zu beenden (oft aus ethischen Gründen). Der Extremwert wird jedoch wahrscheinlich von der Variablen mit der größten Varianz erreicht, selbst wenn alle Variablen einen ähnlichen Mittelwert haben.

Exposition (Anfälligkeitsverzerrung)

Ein klinischer Suszeptibilitäts-Bias liegt vor, wenn eine Krankheit das Auftreten einer anderen Krankheit wahrscheinlicher macht. Wenn Sie zum Beispiel ein postmenopausales Syndrom haben, haben Sie ein höheres Risiko, an Endometriumkrebs zu erkranken. Dies kann passieren, weil Östrogen das Problem verschlimmern könnte.

Bei protopathischer Verzerrung könnte man denken, dass die Behandlung der ersten Symptome einer Krankheit das Ergebnis verursacht. Dies ist jedoch nicht wahr. Wenn zwischen dem Auftreten der Symptome und dem Beginn der Behandlung eine Zeitspanne lag, könnten sie sich geirrt haben. Dies kann durch Lagging vermieden werden, was bedeutet, dass Expositionen ausgeschlossen werden, die in einem bestimmten Zeitraum vor der Diagnose stattfanden.

Indikationsverzerrung tritt auf, wenn die Behandlung Menschen gegeben wird, bei denen die Wahrscheinlichkeit besteht, dass sie die Krankheit bekommen. Dann bekommen mehr Menschen mit der Krankheit die Behandlung. Das könnte ein Hinweis darauf sein, dass die Behandlung sie krank gemacht hat.

Daten

Partitionierung (Aufteilung) von Daten mit Kenntnis des Inhalts der Partitionen und anschließende Analyse mit Tests, die für blind gewählte Partitionen ausgelegt sind.

Post-hoc-Änderung der Dateneinbindung aufgrund willkürlicher oder subjektiver Gründe, einschließlich:

  • Rosinenpickerei, die eigentlich keine Selektionsverzerrung ist, sondern eine Bestätigungsverzerrung, wenn bestimmte Teilmengen von Daten ausgewählt werden, um eine Schlussfolgerung zu unterstützen (z. B. das Zitieren von Beispielen von Flugzeugabstürzen als Beweis dafür, dass Flugreisen unsicher sind, während die weitaus häufigeren Beispiele von Flügen, die sicher abgeschlossen werden, ignoriert werden. )
  • Ablehnung von schlechten Daten aus willkürlichen Gründen, statt nach vorher festgelegten oder allgemein vereinbarten Kriterien oder Verwerfen von “Ausreißern” aus statistischen Gründen, die wichtige Informationen, die aus “wilden” Beobachtungen abgeleitet werden könnten, nicht berücksichtigen.

Studien

Auswahl der Studien, die in eine Meta-Analyse aufgenommen werden.

Durchführung von wiederholten Experimenten und Berichterstattung nur über die günstigsten Ergebnisse, vielleicht Umetikettierung von Laborprotokollen anderer Experimente als “Kalibrierungstests”, “Instrumentierungsfehler” oder “Voruntersuchungen”.

Das signifikanteste Ergebnis einer Datenauswertung so darstellen, als ob es sich um ein einzelnes Experiment handeln würde (was logischerweise dasselbe ist wie der vorherige Punkt, aber als viel weniger unehrlich angesehen wird).

Attrition Bias (Ausfälle)

Der Attrition Bias ist eine Art Selektionsverzerrung, die durch Attrition (Verlust von Teilnehmern) verursacht wird, wobei Versuchspersonen/Tests, die nicht bis zum Ende gelaufen sind, nicht berücksichtigt werden. Er ist eng verwandt mit dem Survivorship Bias, bei dem nur die Probanden, die einen Prozess “überlebt” haben, in die Analyse einbezogen werden, oder dem Failure Bias, bei dem nur die Probanden, die einen Prozess “nicht bestanden” haben, einbezogen werden. Er umfasst Dropout, Nonresponse (niedrigere Antwortrate), Rücktritt und Protokollabweichungen. Er führt zu verzerrten Ergebnissen, wenn er in Bezug auf die Exposition und/oder das Ergebnis ungleich ist. Zum Beispiel kann der Forscher bei einem Test eines Diätprogramms einfach jeden ablehnen, der aus der Studie ausscheidet, aber die meisten derjenigen, die ausscheiden, sind diejenigen, bei denen es nicht funktioniert hat. Unterschiedliche Verluste von Probanden in Interventions- und Vergleichsgruppe können die Charakteristika dieser Gruppen und die Ergebnisse unabhängig von der untersuchten Intervention verändern.

Lost to follow-up, ist eine weitere Form des Attrition Bias, der vor allem in medizinischen Studien über einen längeren Zeitraum auftritt. Non-Response oder Retention Bias kann durch eine Reihe von materiellen und immateriellen Faktoren beeinflusst werden, wie z. B. Wohlstand, Bildung, Altruismus, anfängliches Verständnis der Studie und ihrer Anforderungen. Forscher können auch nicht in der Lage sein, Folgekontakte durchzuführen, die aus unzureichenden Identifikationsinformationen und Kontaktdaten resultieren, die während der anfänglichen Rekrutierungs- und Forschungsphase gesammelt wurden.

Observer selection

Daten werden auf unterschiedliche Weise gefiltert. Sie können aufgrund des gewählten Studiendesigns oder der Messung gefiltert worden sein. Aber sie können auch durch die Art und Weise gefiltert werden, wie sie erstellt wurden – wenn jemand eine Studie durchgeführt hat und diese mit den Daten in Zusammenhang steht, dann treten Beobachtungsselektionseffekte auf und man muss anthropisches Denken anwenden, um sie zu verstehen.

Ein Beispiel ist das, was in der Vergangenheit auf der Erde passiert ist. Wenn große Einschläge Massenaussterben und ökologische Störungen verursachen, können sie intelligente Beobachter davon abhalten, sich lange genug zu entwickeln, um Beweise für einen kürzlichen Einschlag zu sehen. Aber es könnte eine Verzerrung geben, und das sollten wir auch bei der Betrachtung astronomischer Existenzgefahren berücksichtigen.

Volunteer Bias

Selbstselektionsbias oder ein Volunteer Bias in Studien stellen eine weitere Bedrohung für die Validität einer Studie dar, da diese Teilnehmer intrinsisch andere Merkmale als die Zielpopulation der Studie aufweisen können.

Studien haben gezeigt, dass Probanden tendenziell aus einem höheren sozialen Stand kommen als aus einem niedrigeren sozioökonomischen Hintergrund. Darüber hinaus zeigt eine weitere Studie, dass Frauen mit höherer Wahrscheinlichkeit als Probanden an Studien teilnehmen als Männer.

Die Voreingenommenheit von Freiwilligen ist während des gesamten Lebenszyklus der Studie offensichtlich, von der Rekrutierung bis zur Nachuntersuchung. Im Allgemeinen kann die Teilnahme von Freiwilligen auf individuellen Altruismus, den Wunsch nach Anerkennung, eine persönliche Beziehung zum Studienthema und andere Gründe zurückgeführt werden. Wie bei den meisten Fällen ist die Abschwächung im Fall von Volunteer Bias eine erhöhte Stichprobengröße.