Was ist Gültigkeit?
Von Saul McLeod, veröffentlicht 2013
Was bedeutet Validität in der Forschung?
Das Konzept der Gültigkeit wurde von Kelly (1927, S. 14) formuliert, der erklärte, dass ein Test gültig ist, wenn er misst, was er zu messen behauptet.
Zum Beispiel sollte ein Intelligenztest Intelligenz messen und nicht etwas anderes (wie Gedächtnis).,
Es kann zwischen interner und externer Gültigkeit unterschieden werden. Diese Gültigkeitsarten sind relevant für die Bewertung der Gültigkeit einer Forschungsstudie / eines Forschungsverfahrens.
Was ist interne und externe Validität in der Forschung?
Die interne Validität bezieht sich darauf, ob die in einer Studie beobachteten Effekte auf die Manipulation der unabhängigen Variablen und nicht auf einen anderen Faktor zurückzuführen sind.
Im-anderen-Worten gibt es eine kausale Beziehung zwischen den unabhängigen und der abhängigen variable.,
Die interne Validität kann verbessert werden, indem Fremdvariablen unter Verwendung standardisierter Anweisungen, Gegenausgleich und Eliminierung von Bedarfsmerkmalen und Untersuchungseffekten gesteuert werden.
Externe Validität bezieht sich darauf, inwieweit die Ergebnisse einer Studie auf andere Einstellungen (ökologische Validität), andere Personen (Populationsgültigkeit) und im Laufe der Zeit (historische Validität) verallgemeinert werden können.
Die externe Validität kann verbessert werden, indem Experimente in einer natürlicheren Umgebung durchgeführt und Zufallsstichproben zur Auswahl der Teilnehmer verwendet werden.,
Bewertung der Validität des Tests
Bewertung der Validität des Tests
Es gibt zwei Hauptkategorien der Validität, die zur Beurteilung der Validität des Tests verwendet werden (d. H. Fragebogen, Interview, IQ-Test usw.).): Inhalt und Kriterium.
Was ist Gesicht Gültigkeit in der Forschung?
Face validity ist einfach, ob der Test (zum Nennwert) erscheint, um zu messen, was er behauptet. Dies ist das am wenigsten ausgefeilte Maß für die Gültigkeit.,
Tests, bei denen der Zweck klar ist, auch für naive Befragte, sollen eine hohe Gesichtsgültigkeit haben. Dementsprechend haben Tests, bei denen der Zweck unklar ist, eine geringe Strebgültigkeit (Nevo, 1985).
Eine direkte Messung der Gesichtsvalidität wird erhalten, indem Personen aufgefordert werden, die Gültigkeit eines Tests so zu bewerten, wie es ihnen erscheint. Dieser Rater könnte eine Likert-Skala verwenden, um die Gesichtsvalidität zu bewerten., Beispiel:
- Der Test ist für einen bestimmten Zweck äußerst geeignet
- Der Test ist für diesen Zweck sehr geeignet;
- Der Test ist ausreichend
- Der Test ist unzureichend
- Der Test ist irrelevant und daher ungeeignet
Es ist wichtig, geeignete Personen auszuwählen, die einen Test bewerten möchten (z. B. Fragebogen, Interview, IQ-Test usw.).). Zum Beispiel wären Personen, die den Test tatsächlich ablegen, gut in der Lage, seine Gesichtsvalidität zu beurteilen.
Auch Personen, die mit dem Test arbeiten, könnten ihre Meinung abgeben (z.B. Arbeitgeber, Hochschulverwalter, Arbeitgeber)., Schließlich könnte der Forscher Mitglieder der breiten Öffentlichkeit, die an dem Test interessiert sind (z. B. Eltern von Testpersonen, Politikern, Lehrern usw.), verwenden.).
Die Gesichtsvalidität eines Tests kann nur dann als robustes Konstrukt angesehen werden, wenn zwischen den Bewertenden ein angemessenes Maß an Übereinstimmung besteht.
Es sollte beachtet werden, dass der Begriff Face validity vermieden werden sollte, wenn die Bewertung von „expert“ durchgeführt wird, da die Validität von Inhalten angemessener ist.,
Gesichtsvalidität bedeutet nicht, dass ein Test wirklich misst, was der Forscher messen will, sondern nur im Urteil der Rater, dass er dies zu tun scheint. Folglich ist es ein grobes und grundlegendes Maß für die Gültigkeit.
Ein Testelement wie „Ich habe kürzlich daran gedacht, mich selbst zu töten“ hat offensichtliche Gesicht Gültigkeit als ein Element Messung Selbstmord Kognitionen, und kann nützlich sein, wenn Symptome von Depressionen zu messen.
Die Auswirkungen von Elementen auf Tests mit klarer Gesichtsvalidität bestehen jedoch darin, dass sie anfälliger für soziale Wünschbarkeitsvorteile sind., Einzelpersonen können ihre Reaktion manipulieren, um Probleme zu leugnen oder zu verbergen, oder Verhaltensweisen übertreiben, um ein positives Bild von sich selbst zu präsentieren.
Es ist möglich, dass ein Testelement keine allgemeine Gültigkeit hat, aber dennoch allgemeine Gültigkeit hat und misst, was es zu messen behauptet. Dies ist gut, da es die Nachfragemerkmale verringert und es den Befragten erschwert, ihre Antworten zu manipulieren.
Zum Beispiel würde dem Testgegenstand „Ich glaube an das zweite Kommen Christi“ seine Gültigkeit als Maß für Depression fehlen (da der Zweck des Artikels unklar ist).,
Dieser Artikel erschien in der ersten Version des Minnesota Multiphasic Personality Inventory (MMPI) und wurde auf der Depressionsskala geladen.
Weil die meisten der ursprünglichen normativen Probe des MMPI waren gute Christen nur ein guter Christ würde denken, Christus kommt nicht zurück. Daher hat der Artikel für diese bestimmte religiöse Stichprobe eine allgemeine Gültigkeit, jedoch keine allgemeine Gültigkeit.
Was ist Konstrukt Gültigkeit in der Forschung?
konstruktvalidität wurde erfunden von Cornball und Meehl (1955)., Diese Art der Validität bezieht sich auf das Ausmaß, in dem ein Test ein bestimmtes theoretisches Konstrukt oder Merkmal erfasst, und es überschneidet sich mit einigen der anderen Aspekte der Validität
Konstruktvalidität betrifft nicht die einfache, faktische Frage, ob ein Test ein Attribut misst.
Stattdessen geht es um die komplexe Frage, ob Testscore-Interpretationen mit einem nomologischen Netzwerk aus theoretischen und beobachtenden Begriffen konsistent sind (Cronbach & Meehl, 1955).,
Um die Konstruktvalidität zu testen, muss nachgewiesen werden, dass das zu messende Phänomen tatsächlich existiert. Die Konstruktvalidität eines Intelligenztests hängt beispielsweise von einem Modell oder einer Intelligenztheorie ab.
Konstruktvalidität bedeutet, die Macht eines solchen Konstrukts zu demonstrieren, um ein Netzwerk von Forschungsergebnissen zu erklären und weitere Beziehungen vorherzusagen.
Je mehr Beweise ein Forscher für die Konstruktvalidität eines Tests nachweisen kann, desto besser. Es gibt jedoch keine einzige Methode zur Bestimmung der Konstruktvalidität eines Tests.,
Stattdessen werden verschiedene Methoden und Ansätze kombiniert, um die Gesamtkonstruktvalidität eines Tests darzustellen. Beispielsweise können Faktorenanalysen und Korrelationsmethoden verwendet werden.
Was ist gleichzeitige Gültigkeit in der Forschung?
Dies ist der Grad, in dem ein Test einem externen Kriterium entspricht, das gleichzeitig bekannt ist (dh gleichzeitig auftritt).
Wenn der neue Test durch einen Vergleich mit einem aktuell vorhandenen Kriterium validiert wird, haben wir gleichzeitige Gültigkeit.,
Sehr oft kann ein neuer IQ – oder Persönlichkeitstest mit einem älteren, aber ähnlichen Test verglichen werden, von dem bekannt ist, dass er bereits eine gute Gültigkeit hat.
Was ist prädiktive Gültigkeit in der Forschung?
Dies ist der Grad, in dem ein Test ein Kriterium, das in der Zukunft auftreten wird, genau vorhersagt.
Beispielsweise kann auf der Grundlage eines neuen Intelligenztests eine Vorhersage getroffen werden, dass Highscores im Alter von 12 Jahren einige Jahre später eher einen Universitätsabschluss erhalten. Wenn die Vorhersage geboren wird, hat der Test eine prädiktive Gültigkeit.,
APA-Style-Referenzen
Cronbach, L. J., und Meehl, P. E. (1955) Construct validity in psychological tests. Psychological Bulletin, 52, 281-302.
– Kelley, T. L. (1927).Interpretation of educational measurements. New York: Macmillan.
Nevo, B. (1985). Gesicht Gültigkeit revisited. Journal of Educational Measurement, 22(4), 287-293.
Leave a Reply