妥当性ってなんズラ?⑤ ~小さな事からコツコツ㌧~

難しいねぇ。The Concept of Validity

先輩に聞いてみたら,「それ俺も読んだよ」とか,「あの講義でその論文の内容発表してた人が居たよ」とか,結構色んな人の目には触れている論文らしい。確かに好奇心をかき立てられる題目だものな。

話が結構入り組んでて,かつ多岐に渡っていて,一度に紹介しきれるはずもなく。というかそれだけの素養を持っておらず。

んで,この論文の位置づけとか評価とか,結構な科学哲学的素養を要するのかもしれない。まぁ素人(駄目ジャン;;;)の安易な直感ですけどね。なんつかまぁ,現行の妥当性概念との間には,バックボーンに違いがありそうな気がするのですよ。

ということで,今日はイントロダクションの部分のみ。本文の冗長さは,僕の理解の程度を反映しております。ところで,理解の程度の分散は,因果関係的に本文の冗長さの分散を生み出すだろうか。ってな前振り。

まずはじめに構成概念妥当性の定義を書いてみれ。


冒頭はこんな感じです。なんか講義受けるみたいな感じだね。積極的な講義への参加を促されてるような。まぁ良いでしょう。これは前につらつら書いたので,ここでは繰り返さないと。

んで典型的な回答例として,


検査がその意図したものを測定できているかどうか


ってのが挙げられてます。まぁこういう説明がされることって多いですよねぇ。

しかしこれっては,これまでに色んな理論家達が提唱してきた構成概念妥当性の概念とは,大分違うんですってよ。

構成概念妥当性の定義というか概念の遍歴を歴史的に見てみると,


①意図したものを測れているかどうか(Cattel,1946; Kelly,1927)
②検査得点と法則定立的ネットワークにおける理論的関連との,実証的関連性(Cronbach & Meehl,1955)
③検査得点に基づいた解釈と行為が正当化されるかどうか。科学的根拠だけでなく,検査を使用した際の,社会的・倫理的結果にも注目する(Messick,1989)


ってな感じなんですってよ。要するに,検査得点の解釈が正当化される程度とか,そういう定義が為されているのだそうな。妥当性は検査の特徴ではなくて,検査得点の解釈に関する特徴だと。そうなると,冒頭の典型例とは違いますね。


んで,③が一番最近のものですね。Messickさん。むちゃくちゃ沢山の要素をぶち込んでくれてますね。だけど,臨床畑の人間としては,検査利用の社会的・倫理的影響なんてのを妥当性の要件の中に含めるのは,なんというか,当たり前っていう気もしなくもない。しかし,それは検査得点の解釈の妥当性ではなくて,検査利用の妥当性,つまりはその検査の利用が正当化されるか否かみたいな問題を扱ったもののような希ガス。ちょっと一緒くたにするには,あまりに複雑かもね。

理論ってのは,突っ込みどころを無くそうとすればするほど,複雑怪奇な出来になってしまうのかもしれまへん。実用性が低いというか。例えば坂野雄二センセがよく言うのは「モデルはシンプルな方が良い。現場で使えない」ってな事らしく,これはこれで真理を突いている気がしますね。


    _  ∩
  ( ゚∀゚)彡 オッカム!オッカム!
     ⊂彡


まぁそんなことは良いんですよ。


んで,この論文の著者達が盛んに言うのは,構成概念妥当性の理論家達はそやって頑張って理論化してるけど,フィールドにいる研究者とか,心理測定法を用いる実践家に,その内容が伝わってないんだ,ってことなのかしら。んでその理由が,妥当性概念が複雑すぎて,しかも実用性が低いからだ,みたいな。ん~。この辺はすこし自信がないですね。


まぁ,あまりに多くの要素を一つの見出し(つまり妥当性)の中で扱うようになってしまい,その複雑さが激しく増してしまっている事は確かな事なのかもしれない。少なくとも,妥当性の理論家の議論においては。
んで,そのような内容を,フィールドにいる研究者や実践家に伝えられていないと。なんせ,研究者や実践家にとっては,冒頭で出てきたような定義を捨てることの必然性が無いのだそうだ。


そこで,この論文では,


上記のような議論の多くが,見当違いであることを示し,シンプルかつ明確で,実行可能な代替案を提示します。


とおっしゃる。なかなか気合いの入ったコミットメントですね。ちなみに 見当違いirrelevant の訳です。そんなに強すぎる訳語ではないと思います。

んでまぁ,さっきの②③に対するぶっ込みとして,


妥当性は複雑ではない。法則定立的ネットワークに依存するのでもない。そして検査による社会的結果に依存するものでもない。


と述べています。ほう。そうですか。そうですかとしか言いようのない部分を引用する漏れの神経を疑いますね。まぁ良いんです。

んでね,この著者達が考える妥当性ってのは,端的に言うと,


意図したものを測れているかどうか(Kelly,1927)


なんですってよ。先祖返り?

これから書く内容に,彼らの主張が最もよく表されています。なんでこれをもっと早く書かない。俺よ。


①存在しないものを測定することは,誰にもできない。
②もし存在していても,それが測定法の結果の分散を因果関係的に生み出さないのであれば,その測定法は別のものを測っているか,もしくは何も測っていない。


この前提をどう評価するかが,この論文の評価の分かれ目になるんじゃないですかねぇ。

んで,これを受けて妥当性の要件が示されます。


測定法がある特性を測定するという事に関して妥当であると言われるのは,

①特性が存在していて
②その特性の分散が,因果関係的に測定法の分散を生み出している


場合だけだそうです。

ラジカルに聞こえますねぇ。前にも書いたけど,どうやって実在性を担保するんだっちゅー話ですよ。実在論とか反実在論とか社会構成主義とか,色んな議論が付いてきますのとちゃいますやろか。

ということで,そこはかとなくアフィリエイト。

科学哲学の冒険―サイエンスの目的と方法をさぐる科学哲学の冒険―サイエンスの目的と方法をさぐる
戸田山 和久

by G-Tools



んで,この話はこの著者達のオリジナルではなくて,大部分がTrout(1999)等に代表されるの測定法に関する因果理論causal theory of measurementをインスパイヤしたものらしい。妥当性に関する議論の歴史の中にも,これに似た話ってのは出てくるんだとさ。まぁそうかもね。


んで話は移って,というか分からないところを飛ばしてw


妥当性の最重要な要素は,検査得点に対する特性の因果的効果であり,妥当性の根拠の所在は,この効果を(検査得点に)移していく過程にある。


あの概念化からはそういう方略が導かれるだろう。そらそうだ。


んで,相関行列は状況的な妥当性の証拠しか提供しないと。本質ではないと言うことか。

妥当性の問題は心理統計法やモデル単体で解決されるものではなく,むしろ,実在的理論に言及せねばならないのである。


あぁ難しい。お馬鹿な漏れにはニュアンスしかわかんねーよ。統計使ったりモデル立てたりすんのは,妥当性の本質的根拠にはならず,むしろ特性の実在性とか,検査得点に対する因果的効果に言及しろってことかいな。もうかみ砕けないよ;;;;


ここまでで前口上終わり。イントロダクションの最後で,これからこの論文でやることが述べられます。なんでも,二つの論点から,彼らの妥当性概念を展開するんだそうだ。


第一に,
実在論対認識論,関係対意味,因果対相関
の3つの論点から,現行の妥当性概念と本論文での妥当性概念を対比させることで,シンプルな妥当性概念を描き出すんだそうだ。


第二に,
心理学に広く蔓延する問題を啓蒙し,それを正確に記述し,そして解決するための研究の方向性を提示する。


そうそう!それそれ。それが無いとただのお話でしょ?つか,それに則ったデータも示してくれてないと,説得力としては弱いけどね。

ということで,今日の苦闘はここでおしまい。とにかく分かり辛いエントリになってしもうた。力量不足を痛感しておりますですはい。


とりあえず次回は,実在論対認識論の話題です。ノシ

Comment

>それは検査得点の解釈の妥当性ではなくて,検査利用の妥当性,つまりはその検査の利用が正当化されるか否かみたいな問題を扱ったもののような希ガス。ちょっと一緒くたにするには,あまりに複雑かもね。

そですかね?これって,臨床においては最も重要な妥当性概念だと小生は思います。いくら理論的に妥当性が保証されても,臨床的にその測定法を用いることによるoutcomeの程度,社会・倫理面の影響が鑑みられていなければ,現実にそれを使用することの意義は?ですよね。まあ,今ある測定法でどれだけこの側面が保証されているかと言えば,それもあやしいわけですが。
>>izugaeruさん

izugaeruさんの即時強化によってこのシリーズは続いていますw

>臨床においては最も重要な妥当性概念だと小生は思います。

そうですよねぇ。ちょっと言葉足らずだったっす。スイマセン(アセアセ
言いたかったのは,それは大事な事ではあるのだけれど,何も構成概念妥当性の中で語る必要はないのでは?といった事でした。

>臨床的にその測定法を用いることによるoutcomeの程度,社会・倫理面の影響が鑑みられていなければ,現実にそれを使用することの意義は?

なんですが,これは構成概念妥当性という妥当性概念とは,別立ての妥当性概念で考えても良いんじゃないかと。
例えば臨床的妥当性とか,そういうある程度別のトピックで語る方が,問題がスッキリするのではないかと思うのです。

すなわち,構成概念を描き出す理論の中に,臨床的outcomeとか,社会・倫理面の影響ってとこまでを含めて,構成概念妥当性として評価するのか。
それとも,そのような理論・測定法の臨床的妥当性を評価する軸として,outcomeとか,社会・倫理面の影響等を持ってくるのか。

話としては後者の方が明瞭かなと思うのですが・・・。outcomeや社会・倫理面の影響ってのは,必ずしも固定的なものではなくて,利用されるケースによって異なってくるものとも考え得る。ならば,別軸に取っておいた方が分かりやすいし,測定法自体のダイナミックな運用も可能なんじゃないかと考えてます。
強化が遅くなりましたw

>outcomeや社会・倫理面の影響ってのは,必ずしも固定的なものではなくて,利用されるケースによって異なってくるものとも考え得る。

そうですね。確かにその測定が用いられる対象によって変わりますね。ちょっと視点が偏り気味でした,反省。

ただ,臨床的outcomeは

>妥当性の最重要な要素は,検査得点に対する特性の因果的効果であり,

と非常に近い所にいると思うのですよ。まだ自分でもすっきりした説明ができないのですが,今後の展開に期待します。
いえいえ。僕にとっては十分な即時性ですw

>ただ,臨床的outcomeは
>>妥当性の最重要な要素は,検査得点に対する特性の因果的効果であり,
>と非常に近い所にいると思うのですよ。

traetmentによって因果関係的にoutcomeが生み出されるとか,そういう話なんでしょうか・・・。
是非詳しくお聞きしてみたいです。
>妥当性の最重要な要素は,検査得点に対する特性の因果的効果であり,

が,著者らの主張したいことであれば,その説明は論文の中で詳述されていますよね,たぶん。そういう意味でレビューの続きに期待しているわけですよ。

小生の説明は,どちらかというと今学んでいるepidemiologyの考え方なので,まずは,当該論文の説明を聞いてみたいな,と。
お前が読めよ!という話ですがねw うちの大学からは電子ジャーナルで取れないのでめんどくさいのです。
Comment Form
公開設定

Trackback


→ この記事にトラックバックする(FC2ブログユーザー)
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。