妥当性は何ですか?
ソール*マクロードによって、公開2013
研究における妥当性の意味は何ですか?
妥当性の概念は、テストが測定すると主張するものを測定する場合に有効であると述べたKelly(1927、p.14)によって定式化されました。
たとえば、知性のテストは知性を測定すべきであり、他のもの(記憶など)を測定すべきではありません。,
内部と外部の妥当性を区別することができます。 これらのタイプの妥当性は、研究研究/手順の妥当性を評価することに関連しています。
研究における内部および外部の妥当性は何ですか?
内部validity validityとは、研究で観察された効果が独立変数の操作によるものであり、他の要因によるものではないかどうかを指します。
言い換えれば、独立変数と従属変数の間には因果関係があります。,
内部validity validityは、無関係な変数を制御し、標準化された命令を使用し、カウンタバランスをとり、需要特性および調査官の効果を排除することによっ
外部validity validityとは、研究の結果が他の設定(生態学的validity validity)、他の人々(人口validity validity)、および時間の経過(歴史的validity validity)に一般化できる程度を指す。
外部の妥当性は、より自然な設定で実験を設定し、参加者を選択するために無作為抽出を使用することによって改善することができる。,
テストの妥当性を評価する
テストの妥当性を評価する
テストの妥当性を評価するために使用される妥当性の二つの主要なカテゴリーがあります(すなわち、アンケート、インタビュー、IQテストなど)。):コンテンツと基準。
研究における顔の妥当性は何ですか?
顔の妥当性は、それが主張するものを測定するためにテストが(額面で)現れるかどうかだけです。 これは妥当性の最も洗練された尺度です。,
目的が明確であることを特徴とするテストは、素朴な回答者にも、高い顔の妥当性を持っていると言われています。 したがって、目的が不明である試験は、顔の妥当性が低い(Nevo、1985)。
顔の妥当性の直接測定は、人々に見えるようにテストの妥当性を評価するように求めることによって得られる。 この評価者は、顔の妥当性を評価するためにlikert尺度を使用することができます。, たとえば、
- テストは特定の目的に非常に適しています
- テストはその目的に非常に適しています。
- テストは適切です
- テストは不十分です
- テストは無関係であるため、不適切です
テストを評価するのに適した人を選ぶことが重要です(アンケート、インタビュー、IQテストなど)。). 例えば、実際にテストを受ける個人は、その顔の妥当性を判断するために十分に配置されるでしょう。
また、テストで働く人々は、自分の意見を提供することができます(例えば、雇用者、大学管理者、雇用者)。, 最後に、研究者は、テストに興味を持って一般市民のメンバー(例えば、被験者の両親、政治家、教師など)を使用することができます。).
テストの顔の妥当性は、評価者間で合理的なレベルの合意が存在する場合にのみ、ロバストな構成と見なすことができます。
コンテンツの妥当性がより適切であるため、評価が”専門家”によって行われる場合、顔の妥当性という用語は避けるべきであることに留意すべき,
顔の妥当性を持つことは、テストが実際に研究者が測定しようとしているものを測定することを意味するのではなく、評価者の判断においてのみ、そうしているように見えるということです。 その結果、それは妥当性の粗および基本的な尺度です。
“私は最近自殺を考えている”などのテスト項目は、自殺認知を測定する項目として明らかな顔の妥当性を持っており、うつ病の症状を測定する
しかし、明確な顔の妥当性を持つテスト上の項目の意味は、彼らが社会的望ましさバイアスに対してより脆弱であるということです。, 人の操作に対応するかについての拒否または非表示の問題、または誇張挙動を正画像です。
テスト項目が顔の妥当性を欠いているが、依然として一般的な妥当性を持ち、それが測定すると主張するものを測定することは可能である。 これは、需要特性を低下させ、回答者が回答を操作することを困難にするため、優れています。
例えば、テスト項目”私はキリストの再臨を信じる”は、うつ病の尺度としての顔の妥当性を欠いているでしょう(項目の目的が不明であるため)。,
このアイテムは、Minnesota Multiphasic Personality Inventory(MMPI)の最初のバージョンに登場し、うつ病スケールでロードされました。
MMPIの元の規範的なサンプルのほとんどは良いクリスチャンだったので、唯一のうつ病のクリスチャンは、キリストが戻って来ていないと思うだろ このため、この特定の宗教サンプルの項目は一般の有効性がないます。※
研究における構築validity validityとは何ですか?
構造の妥当性は、CornballとMeehl(1955)によって発明されました。, このタイプの妥当性は、テストが特定の理論的構成または特性をキャプチャする程度を指し、妥当性の他の側面のいくつかと重複します
構築妥当性は、テストが属性を測定するかどうかという単純で事実上問題には関係ありません。
代わりに、テストスコアの解釈が理論的および観測的な用語を含むノモロジーネットワークと一致しているかどうかという複雑な問題についてです(Cronbach&Meehl、1955)。,
構造の妥当性をテストするには、測定されている現象が実際に存在することを実証する必要があります。 したがって、例えば、知性のためのテストの構成validity validityは、知性のモデルまたは理論に依存する。
構築の妥当性は、研究成果のネットワークを説明し、さらなる関係を予測するために、そのような構成の力を実証することを伴う。
研究者がテストの構成の妥当性について実証できる証拠が多いほど、より良いものになります。 ただし、テストの構成の妥当性を決定する単一の方法はありません。,
代わりに、さまざまな方法とアプローチを組み合わせて、テストの全体的な構成の妥当性を提示します。 例えば、因子分析法および相関法を使用することができる。
研究における同時validity validityとは何ですか?
これは、テストが同時に知られている(すなわち同時に発生する)外部基準に対応する程度です。
新しいテストが現在存在する基準との比較によって検証される場合、同時有効性があります。,
非常に多くの場合、新しいIQまたは性格テストは、すでに良好な妥当性を有することが知られている古いが類似したテストと比較されるかもしれ
研究における予測的validity validityとは何ですか?
これは、テストが将来起こる基準を正確に予測する度合いです。
たとえば、新しい知能テストに基づいて予測を行うことができ、12歳の高得点者は数年後に大学の学位を取得する可能性が高くなります。 予測が生まれた場合、テストは予測的な妥当性を持ちます。,
APAスタイルの参照
Cronbach、L.J.、およびMeehl、P.E.(1955)は、心理テストにおける妥当性を構築する。 心理学紀要,52,281-302.
Kelley,T.L.(1927).教育的測定の解釈。 ニューヨーク:マクミラン。
Nevo、B.(1985)。 フェイシャルエステサロン 教育測定ジャーナル、22(4)、287-293。
Leave a Reply