Reliabilität

Aus PflegeWiki
Zur Navigation springen Zur Suche springen

Reliabilität ist ein Gütekriterium der quantitativen Forschung. Sie sagt aus, wie genau und zuverlässig ein Instrument oder ein Testverfahren ein Merkmal misst. Ein Instrument ist umso reliabler, je weniger Abweichungen oder Schwankungen bei einer wiederholten Messung unter denselben Bedingungen auftreten.

  • Eine reliable Waage zeigt für ein Kilo immer den Wert 1 kg an
  • Wird eine Person vor und nach dem Essen gewogen, muss die Waage im Rahmen ihrer Messgenauigkeit unterschiedliche Gewichte anzeigen, denn die Bedingungen haben sich verändert.

Um die Reliabilität eines Instruments zu messen, können verschiedene Aspekte überprüft werden: Stabilität, interne Konsistenz und Äquivalenz.

Stabilität[Bearbeiten | Quelltext bearbeiten]

Die Stabilität macht eine Aussage dazu, wie ähnlich sich die Messresultate sind, wenn das Messinstrument zu unterschiedlichen Zeitpunkten bei denselben Personen angewendet wird. Um die Stabilität zu messen, wird die Test-Retest-Reliabilität getestet.

Test-Retest-Reliabilität[Bearbeiten | Quelltext bearbeiten]

Das Messinstrument wird bei derselben Stichprobe zum Zeitpunkt A und Zeitpunkt B verwendet. Anschließend werden die Resultate von Zeitpunkt A mit Zeitpunkt B verglichen und ein Reliabilitätskoeffizient (r) ausgerechnet. Der Wert des Reliabilitätskoeffizienten liegt i.d.R. zwischen 0,00 und 1. Angestrebt wird ein Wert von mindestens 0,7, besser sind 0,85 bis 0,95. Das Instrument ist umso "stabiler", je höher der Relationskoeffizient, also je genauer die Übereinstimmung ist.

  • Das Ausmaß der Schmerzen bei einer Stichprobe von Personen mit chronischem Schmerzsyndrom wird an zwei aufeinander folgenden Tagen um 8:00, 12:00 und 20:00 Uhr anhand eines Messinstruments eingeschätzt und dann verglichen.

Die Schwierigkeit beim Test-Retest-Vorgehen ist, dass sich ein Merkmal in der Zeit zwischen Zeitpunkt A und Zeitpunkt B verändern kann. Die Messung ergibt dann ein anderes Resultat, obwohl das Instrument selber "stabil" misst. Die Zeitspanne oder die Situation bei Test-Retest-Messungen muss also je nach zu messendem Merkmal angepasst werden und eignet sich nur für relativ stabile Merkmale.

Interne Konsistenz[Bearbeiten | Quelltext bearbeiten]

Interne Konsistenz bedeutet, dass alle Teile eines Tests oder alle Unterpunkte/Items eines Fragebogens dasselbe Merkmal messen.

  • Bei einem Instrument, das z. B. die Auswirkungen von Fatigue auf die Aktivitäten des täglichen Lebens misst, müssen sich alle Items auf die Fatigue und deren Auswirkungen auf die Alltagsaktivitäten beziehen. Wenn das Instrument Items beinhaltet, welche sich auf die Auswirkungen von Schmerzen oder Übelkeit beziehen, reduziert dies die interne Konsistenz.

Früher wurde die interne Konsistenz mittels der Split-half-Technik gemessen. Heute werden genauer statistische Berechnungsmethoden angewandt z.B. Cronbachs Alpha oder der Alpha-Koeffizient.

Split-half-Reliabilität[Bearbeiten | Quelltext bearbeiten]

Bei der Split-Half-Reliabilität werden die Items eines Tests in zwei Hälften geteilt - meist gerade und ungerade Items - und bewertet. Mit den Werten, die sich aus beiden Hälften ergeben, wird ein Reliabilitätskoeffizient berechnet. Je mehr sich die Items oder Teile des Instruments auf das gleiche Merkmal beziehen, umso höher ist der Reliabilitätskoeffizient. Auch hier ergibt die Berechnung einen Wert zwischen 0,00 und 1.

Äquivalenz[Bearbeiten | Quelltext bearbeiten]

Bei der Äquivalenz wird beurteilt, ob das Messinstrument in der gleichen Situation zum gleichen Ergebnis kommt, auch wenn es parallel von verschiedenen unabhängigen Personen angewandt wird. Die Äquivalenz wird mittels der Interrater-Reliabilität, auch Beobachterübereinstimmung genannt, erhoben.

Interrater-Reliabilität[Bearbeiten | Quelltext bearbeiten]

Zwei oder mehr geschulte Personen wenden das Instrument in derselben Situation gleichzeitig und unabhängig voneinander an. Die Ergebnisse von z.B. Person A und B werden miteinander verglichen und es wird ein Reliabilitätkoeffizient berechnet. Je höher die Übereinstimmung zwischen den Messungen ist, umso genauer und zuverlässiger misst das Instrument.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Quellen[Bearbeiten | Quelltext bearbeiten]

  • D. Polit, Tatano Beck, Ch., Hungler, B.P. (2004): Lehrbuch Pflegeforschung – Methodik, Beurteilung und Anwendung. Verlag Hans Huber, Bern