科学的発見における有効な仮説検証方略: 計算機シミュレーションに基づく検討

in 科学を考える:人工知能からカルチュラル・スタディーズまで14の視点

 

三輪和久


1. はじめに

 今,私たちの目の前に,中身が見えない黒い箱(ブラックボックス)があるとしよう。そ のブラックボックスには,入口と出口がついている。

 入口から入力を与えると,出口から何らかの出力が得られる。例えば,入口にはキーボー ドがついていて,そこから10桁のアルファベッド記号列を入力する。出口には,スピーカ がついていて,キーボードからの入力に従って,世にも美しいメロディーの一小節が出力さ れる。

 ある人が,このブラックボックスの性質を理解すれば,どんなに壮大な交響曲をも自在に 創り出せると考え,このブラックボックスの内側がどのようになっているかを,どうしたら 知ることができるだろうかと考えた。

 第一の方法としてまず思いつくことは,このブラックボックスを分解して,中身を直接確 かめることである。しかし,一度分解したら,もとに戻せなくなるかも知れない。壊れてし まうかもしれない。ブラックボックスにふれた瞬間,大爆発をおこすかも知れない。さらに 言えば,たとえうまく分解できたとしても,中身の構成装置の構造があまりに複雑で,ハー ドウエアとしての一つ一つの装置を観察しても,そこから入出力関係のメカニズムを理解す ることができないかもしれない。

 第二の方法として有効なアプローチは,キーボードから色々な入力を与えてやってその都 度出力を確認し,入力されるアルファベッドと,出力されるメロディーの規則性をつかまえ ようとすることである。しかし,入力されるアルファベッドの組み合わせは,約百四十兆(≒ 2610;アルファベッド26文字に対して10桁の組み合わせの数)あり,そのすべてを調べる ことはできない。全てを調べずに,代表的な例だけを調べようとする場合も,例えば,入出 力を一回行うごとに何らかのコストがかかるとしたらどうだろうか。規則性を発見するだけ の大量の実験を行うことは不可能である。

 そこで,ある人が,第三の方法を考案した。それは,ブラックボックスの模型(モデル) を作るという方法である。第三の方法の考案者は,それまでに得られている情報に基づいて (例えば,第二の方法によって部分的に得られている入出力データに基づいて),このブラッ クボックスの模型を作り上げた。その模型は,すでに得られている入出力関係をうまく再現 することができた。

 さらに,第二の方法では試されていない未知のアルファベッド記号列をその模型に入力す ると,これまた今まで聞いたことのない新しいメロディーの一小節が出力された。

 しかし,この模型の製作者は,これが本当に目の前のブラックボックスの模型としてはた らいているのかが不安になった。もしかしたら,この模型は,このブラックボックスの動作 原理とは別の原理に基づいて,勝手にメロディーを生み出しているのでないだろうか。そこ で,第二の方法を考案した人のところに行き,模型が生成した無数のメロディーのうち,そ の主だったものが,本当にブラックボックスでも同じ出力が得られるかどうかを確かめても らうことにした。

 結果は,あるものはうまく一致したが,あるものは一致しなかった(中には,模型の方が, ブラックボックスよりも美しいメロディーを生成していた場合があったが,第三の方法の考 案者の目的は,あくまでもブラックボックスの模型を作るということにあったので,そのこ とは意に介さなかった)。第三の方法の発案者は,得られた結果に基づいて模型を改良し,さ らに性能のよい模型を作り上げることができた。

 しばらくして,第二の方法の考案者と第三の方法の考案者は,共同して次々と大交響曲を 発表するようになり,ついには,平成のベートーベン,モーツアルトと呼ばれるにまでに 至った。

 本章では,人間の科学的発見のメカニズムを探究するにあたっての,計算機科学からのア プローチを具体的に紹介する。

 人間の「心」は,まさに上で言うところの「ブラックボックス」である。ブラックボック スを,直接開いてみてみることはかなわないし,「物」としての「脳」を観察しても,必ず しも「心」の「はたらき」が明確に把握できるわけではない。

 そこで,上で述べた第二の方法,第三の方法が重要になってくる。

 第二の方法は,いわば「実験心理学的方法」と言うことができる。第三の方法が,ここで 述べる「計算機科学的方法」に対応する。

 以下では,科学的発見における「仮説検証方略」という題材を取り上げる中で,第三の方 法としての計算機科学的方法を,とりわけ第二の方法である実験心理学的方法との関わりの 中で検討してゆくこととする。

2. 仮説検証方略

(1) 理論,現象,仮説,実験

 科学的発見の過程に現われるもっとも一般的なプロセスは,仮説形成検証過程である。科 学者は,対象とする「現象」を統一的に説明する「理論」を発見するために,理論に関する 「仮説」を形成する。形成された仮説に基づき「実験」が計画される。実験の結果は仮説に フィードバックされ,適宜仮説は修正され,仮説は徐々に真実に接近してゆく中で「理論」 が確立されてゆく。

 仮説形成検証過程は,大きく仮説形成と仮説検証のプロセスに分解できる。後者の「仮説 検証」においては,とりわけ仮説に対する「負のフィードバック」の重要性が指摘されてい る(Platt, 1966; Popper, 1959; Wason, 1960)。仮説は次に観察されるべき現象を予測する。仮説から予測された現象が実験において確認されれば,その仮説に対して「正のフィードバッ ク」が起こり,仮説は「確証」されて仮説の蓋然性(確からしさ)は大きくなる。一方,実 験において予測に反した結果が得られれば,仮説に対する負のフィードバックが生じる。

 負のフィードバックの形態は様々である。仮説全体が棄却されることもあれば,補足的な 補助仮説を付け足して仮説を保持しようとする場合もある。時には,得られたデータを「例 外」として排除し,仮説がそのまま保持されるような場合もある(Chinnら, 1992)。しかし, 一般的には負のフィードバックは,仮説の反証を導き,仮説に何らかの修正を加える。仮説 検証においては,仮説の修正機会としての「反証」の重要性が指摘され,反証をより確実に 導く仮説検証法に関する研究が継続的に行なわれてきている。

(2) 2-4-6課題

 仮説検証に関する実験心理学からのアプローチの一つとして,実験室において,被験者に 比較的単純な発見課題を解かせ,その発見過程を分析するというものがある(Gormanら, 1984a; Gormanら, 1984b; Gormanら, 1987; Klaymanら, 1987; Klaymanら, 1989; Tukey, 1986; Tweneyら, 1980; Wason, 1960)。

 多くの研究者に取り上げられてきた課題の一つに,2-4-6課題がある。この課題では,被 験者は,三つの数字の間の規則性を発見することが求められる。発見すべき規則を「ター ゲット」と呼ぶことにする。ターゲットの探索は,現象としてのデータ(提示される三つの 数字の組)を統一的に説明する「理論」の探求を意味する。

 もっとも典型的な実験では,最初に[2, 4, 6]という数字の組が提示される。被験者は,提示された数字の組に基づいて,ターゲットに関する「仮説」を形成する。被験者は「実験」 を行なうことができる。実験とは,被験者が新しい数字の組を作り,実験者に対してその数 字を提示することである。実験において被験者が生成する三つの数字の組を「事例」と呼ぶ。

 実験者は,被験者によって提示された数字の組が発見すべき規則に従っている(Yes)か 否(No)かを被験者にフィードバックする。被験者は,得られたYes,もしくはNoのフィー ドバックに従って仮説を修正しながら,ターゲットを探求する。

 以下では,この2-4-6課題を用いた仮説検証の研究を例に取り上げ,この問題に対する計 算機科学からのアプローチを例示する。

(3) ポジティブテストとネガティブテスト

 人間の仮説検証に観察される傾向として,「確証バイアス」というものがある。表1は,2- 4-6課題の発見過程の一例である。被験者が発見すべきターゲットは「順に大きくなる三つ の数字の組」である。被験者は,はじめに「三つの連続する偶数」という仮説を形成すると, その仮説を強化する事例([8, 10, 12],[20, 22, 24])を用いて実験を行なおうとする。仮説に対する負の事例(例えば,[10, 15, 31]など)は用いられない。このような傾向は確証バイア スと呼ばれ,一般の大学生に限らず,発見のエキスパートである科学者においてもこの傾向 が観察されると言われている(Mahoneyら, 1977)。

 クレイマンらは,この確証バイアスをより一般的な概念である「ポジティブテスト方略」 という観点から捉えなおしている(Klaymanら, 1987)。ポジティブテストとは,仮説に対して「正」の事例を用いて実験を行なう仮説検証方法のことである。一方,「負」の事例を用 いて実験を行なう仮説検証法を「ネガティブテスト」を呼ぶ。

 表1の例は,このポジティブテスト方略がターゲットの発見を妨害する要因としてはたら いた状況を示している。つまり,被験者がネガティブテストを行わないことが,被験者が 持った仮説が誤りであることに気づけなかった原因であるかのように見える。この例からも わかるように,より確実に反証を導く仮説検証方略として,このポジティブテスト方略は不 適切であり,一見真実を発見するための仮説方略としては,妥当でないものであるかのよう に考えられる。

(4) 反証が生じるとき

 さて,クレイマンらは,仮説の「反証」が起こる状況を,仮説とターゲットとの関係から 整理している(図1参照)。図1において,Uは観察されうる全ての事例の集合である(2-4- 6課題であれば,あらゆる三つの数字の組の集合)。Hは仮説に属する事例の集合,Tはター ゲットに属する事例の集合である。

 さて,図1の図式の上でポジティブテストとネガティブテストを整理すると,ポジティブ テストは図1のHに属する事例を用いて仮説検証を行なう場合(表の上段)であり,一方ネ ガティブテストは図1のHに属する事例を用いて仮説検証を行なうこと(表の下段)に対応 する。

 さらに,そこに重ね合わせて「確証」と「反証」が起こる場合を考えてみると,H∩T, もしくはH∩Tの事例が観察された場合には仮説の「確証」が,逆にH∩T,もしくはH∩ Tの事例が観察された場合に仮説の「反証」が生じることがわかる。すなわち,仮説の反証 が生じるのは,ポジティブテストを行なって世界からNoの反応が返ってきた(実験に用い た事例が,ターゲットの要素ではないというフィードバックが得られた)場合,もしくはネ ガティブテストを行なって世界からYesの反応が返ってきた場合である。

 ここで,ポジティブ(正)やネガティブ(負)は「仮説」に対して定義されるのに対して, YesやNoは「ターゲット」に対して定義されていることに注意して頂きたい。

 このように,反証を導くために有効な仮説検証方略は,仮説とターゲットとの関係に依存 する。その事態は,図2によってより明確になる。図2(a)は,仮説がターゲットに包含され る状況を示し,図2(b)は逆にターゲットが仮説に包含される場合を示している。図2(a)から 明らかなように,仮説がターゲットに包含される場合には,ポジティブテストを行なう限り 仮説の反証は生じない。なぜなら,このHとTの関係においては,H∩Tの事例が存在しな いからである。逆に,ターゲットが仮説に包含される場合には,ネガティブテストは原理的 に仮説の反証を導かないのである。

 以上の検討に基づいて,冒頭に述べた表1の実験結果を再検討すれば,この実験状況にお いては,ターゲットである「順に増加する数字」が一般的な規則性であるがために(すなわ ち,TがUに占める割合が大きいために),被験者が順次形成する仮説(「連続する偶数」「2 ずつ増加する数」「等間隔で増える三つの数」など)が,常にターゲットに包含される関係 となり,そのために正事例による仮説検証が反証を導かず,結果としてポジティブテストが 仮説検証に不利にはたらいていたということがわかる。

(5) 診断テスト

 ここまでの検討を通して,「ポジティブテストとネガティブテストのいずれが有効な仮説 検証方略であるか」という問いは,発見すべきターゲットと独立に検討することができない ことがわかる。

 このように,状況に依存するポジティブテスト,ネガティブテストに対して,「診断テス ト方略」の有効性が指摘されている(Freedman, 1992; Klayman, 1989; Platt; 1964, Wason, 1972)。診断テストを行なうためには,被験者は常に複数の仮説を形成していなければならない。そ の上で,実験にあたっては,保持している仮説のうちの一つが必ず反証されるような事例を 生成する。今,一つの主仮説と一つの対立仮説を持っているとすれば,一方の仮説に対して はポジティブテスト,他方の仮説に対してネガティブテストを行なうような事例を用いて実 験を行なうのである(後に具体的に述べる)。この場合,世界の側にいる実験者からのフィー ドバックがYesであるかNoであるかに関わらず,必ず一方の仮説が反証されることになる。 例えば,主仮説に対してポジティブテスト,対立仮説に対してネガティブテストになるよう な事例を生成して実験を行なった結果,世界からNoといわれたならば,主仮説は反証され, 逆に対立仮説が確証されることになる。

 以下では,ポジティブテスト方略,ネガティブテスト方略,診断テスト方略の三つの仮説 検証法を取り上げ,それぞれの有効性についてより具体的に検討を進める。

3. なぜ計算機科学からのアプローチなのか

(1) 実験心理学からのアプローチ

 ここまでに述べてきた三つの仮説検証方略の有効性を検討するにあたって,実験心理学か らはどのようなアプローチをとることができるであろうか。

 そこでは,実験者は「教示」によって被験者にある種の方略を用いることを強要する。例 えば,「ネガティブテスト(もしくはポジティブテスト)を用いて仮説検証を行ないなさい」 とか,「常に対立仮説を作りながら仮説検証を行ないなさい」というような教示が行なわれ る。

 人間を一つの情報処理システムとみなしたとき,そのシステムはシステムの動作を規定す るいくつかのパラメータを持っていると考えられる。例えば,実験において正事例を生成す る割合を決定するパラメータ,仮説形成にあたって生成すべき仮説の優先度の決定に関わる パラメータ,真実に達したと判断してシステムを停止させる条件を決定するパラメータなど がその例である。

 人間がある方略を用いて問題を解こうとする際には,人間の認知システム全体が影響を受 けると考えられる。例えば,「ポジティブテストを行なう」という方略の選択は,「正事例」 の生成割合のパラメータを100%にセットするということに留まらず,例えば上に述べたよ うな他のパラメータに対して影響が生じることが予期される。上に呼べたような心理実験は, 人間がある方略を用いた時,すなわちシステムのある要因に関わるパラメータを自覚的に制 御しようとした結果,それが他のパラメータの変動も含めて,全体として「発見」のプロセ スにどのような影響を与えるのかということを分析するためには重要である。

(2) 計算機科学からのアプローチ

 しかし,有効な仮説検証法を検討するにあたって,他の要因とは独立に,純粋に仮説検証 方略の変動が,発見の過程にいかなる影響をもたらすのかということを理解したい場合があ る。この場合,システムの中の仮説検証に関わるパラメータだけを動かし,他のパラメータ を固定した状況下で実験を行ないたい。そのような場合には,上に述べたような実験心理学 的アプローチには限界がある。

 まずは,教示によってパラメータを制御することの困難さが上げられる。例えば,「25% をポジティブテストで,75%をネガティブテストで仮説検証を行ないなさい」というような 教示を徹底することは不可能であるし,複数の仮説を思いついてしまう被験者に対して「絶 対に対立仮説を作らないで仮説検証を行って下さい」と言うことは,そのこと自体が困難な 課題を被験者に課していることになってしまう。

 さらに,実際的な問題としては,心理実験に必要とされるコストの問題がある。検討すべ きパラメータの数の増大は,実験条件の組み合わせ的爆発を引き起こし,それに伴って実験 に必要とされる被験者の数は飛躍的に増加する。そのような大規模な実験が,事実上実施不 可能である場合も少なくはない。

 そのような場面で,計算機科学からのアプローチが有効になる場合がある。そこでは,計 算機上で実行可能な計算モデルを構成することによって,心理実験のかわりに「計算機シ ミュレーション」を通して計算機上で実験を行なう。

 モデルの中に,制御可能な形でパラメータを設定し,そのパラメータを計画的にコント ロールすることで,あらゆる方略下での発見過程を再現することができるようになる。他の パラメータを固定して,一つのパラメータだけを徐々に動かしながら発見のプロセスの変動 を観察するということも自在である。さらに,一度計算機上にモデルを構築してしまえば, 何回でも繰り返し実験が行なえ,心理実験に要するような膨大なコストもかからない。

 以下では,2-4-6課題を実験課題とする仮説検証方略に対する研究に関して,計算機科学 からのアプローチを紹介する。

4. 2-4-6課題を解決する計算モデル

(1) プロダクションシステム

 まず,本研究に用いた2-4-6課題を解決する計算機モデルを紹介する(Miwaら, 1996)。

 モデルは,「プロダクションシステム」の形式で構築されている。プロダクションシステ ムは,人間の発見や問題解決のプロセスをモデル化するために,認知科学の分野でもっとも 広く用いられている計算機言語の一つである(Anderson, 1993; Newell, 1991; Klahr, 1987, 三輪, 1996)。

 プロダクションシステムにおける一つひとつの知識は,「プロダクション」と呼ばれるルー ルに表現される。ルールは,IF節と呼ばれる条件部と,ACTION節と呼ばれる行為部から構 成される。IF節の条件が満たされたときに,ACTION節の行為が実行される。例えば,仮説 の「反証」は次の二つのルールが適宜適用されることによってなされる。

IF

・現在の「目標」が「実験結果のフィードバック」であり,

・実験のために生成した「事例」が現在保持している「仮説」に対して「正」の事例であり,

・実験者からのフィードバックがNoである(その事例がターゲットの規則に従わない)な らば,

THEN

・「目標」を「仮説の反証」に変更し,

・生成した「事例」にNoというタグをつけて記憶せよ。

IF

・現在の「目標」が「仮説の反証」ならば,

THEN

・現在保持している「仮説」を棄却し,

・次の「目標」として「新たな仮説の生成」を設定せよ。

(2) モデル

 モデルは,上に述べたようなルールの集合として構成されるが,モデルの行動をより簡潔 に説明するために,図3にこのモデルが用いる手続きのフローチャートを示す。

第一事例の提示: シミュレーションは,一つの正事例(例えば,[2, 4, 6])が提示されるところから開始される。

仮説形成: 次に,モデルは,生成可能な仮説の集合(これを,仮説空間と呼ぶ)を探索して, 可能な仮説候補の内の一つを「仮説」として生成する。

 表2が,モデルが有する仮説空間である。仮説空間は,いくつかの属性によって構造化さ れている。例えば,「偶数-奇数」という属性の中には,「連続する偶数」「連続する奇数」「(三 つの)偶数」「(三つの)奇数」「偶数-偶数-奇数」…といった一連の仮説が,その属性の値 という形で保持されている。

表2 システムの仮説空間

 属性   値
 偶数-奇数   連続する偶数, 連続する奇数, 偶数, 奇数,         偶数-偶数-奇数, 偶数-奇数-偶数, 奇数-偶数-偶数,         奇数-奇数-偶数, 奇数-偶数-奇数, 偶数-奇数-奇数  順序     順に増加する数, 順に減少する数, 同一の数,         同一もしくは順に増加, 同一もしくは順に減少,         増加-減少, 減少-増加  間隔     nずつ増加する数, 間隔同じ数, 間隔が増加する数,         間隔が減少する数  範囲     一桁の数, 二桁の数, 正の数, 負の数  あるスロット 偶数-?-?, ?-偶数-?, ?-?-偶数, 奇数-?-?, ?-奇数-?,  に特定の数  ?-?-奇数, m番目のスロットの数字がn  数学的関係  1番目+2番目=3番目, 1番目+3番目=2番目,         2番目+3番目=1番目, 1番目×2番目=3番目,         1番目×3番目=2番目, 2番目×3番目=1番目,         2番目=2×1番目かつ3番目=3×1番目,         2番目と3番目が1番目の倍数,         3番目=1番目×2番目-2  倍数     nの倍数  約数     nの約数  和      偶数, 奇数, 一桁, 二桁, 正の数, 負の数,         ある数n, nの倍数  積      偶数, 奇数, 一桁, 二桁, 正の数, 負の数,         ある数n  差異     三つの異なる数字  連言     上記の連言 (ex. 一桁の数でかつ正の数)

蓋然性評価: 仮説が生成されると,その仮説の蓋然性(確からしさ)が評価される。仮説の蓋然性が一定の基準を超えていれば,システムはターゲットを発見したとみなし,その仮説 をターゲットとしてシミュレーションは終了する。仮説の蓋然性が十分でなければ,システ ムは現在保持している仮説に基づいて実験を行なう。

事例生成: 実験における事例の生成は,仮説検証方略に従って制御される。例えば,ポジティ ブテスト方略を用いた実験を行なう場合には,仮説に属する事例の集合から一つの正事例が 生成される。ネガティブテスト方略の場合は負事例が生成される。

実験結果のフィードバック: システムに対して世界の側から,Yes,もしくはNoといった フィードバックが与えられる(Yesは生成した事例がターゲットの規則に従うこと,Noは従 わないことを意味する)。発見の過程を通して,モデルは,生成した全ての事例をYes,も しくはNoといったタグと共に記憶している。

確証: モデルが実験において正事例を生成し,Yesのフィードバックを受けた場合(H∩T), もしくは負事例を生成してNoのフィードバックを受けた場合(H∩T) を「ヒット」と呼ぶ。実験の結果がヒットした場合には,その仮説は確証され,仮説の蓋然性が増すことになる。 この場合には,その仮説を保持して再び仮説の「蓋然性評価」のプロセスに戻る。

反証: 正事例を生成しNoのフィードバックを受けた場合(H∩T),もしくは負事例を生成し てYesのフィードバックを受けた場合(H∩T)を「ミス」と呼ぶ。実験の結果,ミス状況が 発生した場合には仮説は反証される。仮説が反証された場合には,「仮説形成」のプロセス に戻り,仮説形成がやり直される。

(3) パラメータ

 モデルは,モデルの手続きを制御するいくつかのパラメータを持っている。

 本研究は,仮説検証法に関する検討を目的とするので,計算機シミュレーションにおいて は,以下に示されるパラメータの中から,仮説検証法に関するパラメータだけが制御され, 他のパラメータは固定される。

第一事例: シミュレーションでは,最初に提示される事例を制御することができる。本パラ メータは,モデルのパラメータというよりも,実験条件に関わるパラメータであるが,ここ では一括して示している。本シミュレーションでは,[2, 4, 6]が第一事例として提示される。

仮説形成方略: 仮説形成において,仮説空間の探索を制御するパラメータであり,仮説形成 方略を決定する。仮説形成に関しても,様々な方略を考えることができるが,ここでは,人 間の仮説形成方略を反映させるために,次のような心理実験を実施して仮説形成の優先度を 決定した。

 実験には92名の大学生が参加した。被験者には,[2, 4, 6]という事例が提示され,10分以内に[2, 4, 6]という数字の組の間に存在する規則をできる限り数多く生成することが求めら れた。各被験者ごとに,最初に生成された仮説には10点,2番目の仮説には9点と順次点数 をつけた。なお,10番目およびそれ以降に生成された仮説にはそれぞれ1点が与えられた。 被験者が生成した全ての仮説について得点の合計が計算され,大きな得点の仮説ほど仮説空 間内での優先度が高いとした。なお,対立仮説を形成する場合には,もっとも優先度が高い 仮説を主仮説として,次点の優先度をもった仮説を対立仮説として取り上げることとした。

蓋然性評価方略: 蓋然性評価方略についても,多くの種類を考えることができるが,ここで は以下の方略に固定してシミュレーションが実施された。すなわち,4回連続して実験結果 が「ヒット」したら,その仮説の蓋然性は十分に正しいものとして,それを発見すべきター ゲットとみなしシステムを停止する。

仮説検証方略: 計算機シミュレーションにおいて制御されたパラメータは,仮説検証に関わ るものであり,以下に詳述する。

(4) 仮説検証を制御するパラメータ

 仮説検証に関して,まず大きく二つの方略に分けて考える。一つは,対立仮説を用いるこ とができる場合である。この場合には,仮説形成の段階において,主仮説と対立仮説という 二種類の仮説が形成され,実験においては「診断テスト」が実施される。もう一つは,対立 仮説を用いることができない場合である。この場合には,「ポジティブテスト方略」と「ネ ガティブテスト方略」のいずれかが用いられることになる。

 まず,モデルが対立仮説を利用できる場合の「診断テスト」の方法について述べる。まず, 主仮説と対立仮説の関係として,図4の三種類の状況を考えることができる。図4(a)の場合 には,主仮説が対立仮説の中に包含されるような関係にある。例えば,主仮説が「2ずつ増 加する三つの数」であり,対立仮説が「等間隔の三つの数」というような場合である。この 場合には,この二つの仮説を弁別するための事例として,例えば[2, 5, 8]が生成される。この事例を用いた実験では,主仮説に対してはネガティブテスト,対立仮説に対してはポジ ティブテストを行ったことになる。その結果,Noがフィードバックされた場合(生成され た事例がターゲットに属さなかった場合),主仮説に対してはヒット状態,対立仮説に対し てはミス状態が生じたことになるので,主仮説は維持され,対立仮説が棄却されることにな る。Yesがフィードバックされれば,逆に主仮説が棄却され,対立仮説が次なる主仮説とな る。

 一方,図4(b)は,対立仮説「連続する偶数」が主仮説「2ずつ増加する三つの数」に包含 されるような状況であり,この場合の診断テストは,例えば事例[3, 5, 7]を生成することによって行なわれる。

 図4(c)は主仮説「2ずつ増加する三つの数」と対立仮説「三つの偶数」がオーバーラップ している場合である。この場合には,主仮説に対して正事例,対立仮説に対して負事例とな る[3, 5, 7],もしくは主仮説に対して負事例,対立仮説に対して正事例となる[2, 4, 8]によって診断テストを行なうことができる。実際のシミュレーションでは,この状況下では前者の テストを行なうように固定されている。

 次に,モデルが対立仮説を利用できない場合について考えてみよう。この場合には,モデ ルは,正事例と負事例の生成割合を制御することによって,仮説検証方略を決定する。正事 例の生成割合が増加するに従って,より「ポジティブテスト方略」が支配的な仮説検証法を

表3 モデルの行動の1例                 

    主仮説    対立仮説  生成事例  対仮説 対ターゲット フィードバック
 1 三つの偶数    2ずつ増加する数  -14, -14, -8 正 No ミス  2 2ずつ増加する数  3番目=1番目+2番目 -7, -5, -3  正 Yes ヒット  3 2ずつ増加する数  間隔が同じ    12, 18, 24  負 Yes ミス  4 間隔が同じ    増加する三つの数 15, 6, -3   正 Yes ヒット  5 間隔が同じ    三つの異なった数 -16, -16, -16 正 No ミス  6 三つの異なった数 なし       18, -17, -6  正 Yes ヒット  7 三つの異なった数 なし       18, 0, 4   正 Yes ヒット  8 三つの異なった数 なし       -5, 12, -16  正 Yes ヒット  9 三つの異なった数 なし       14, -18, 1  正 Yes ヒット          2, 4, 6  - Yes  1 三つの偶数   なし       14, 18, 20  正 Yes ヒット  2 三つの偶数   なし       -12, -14, -12 正 No ミス  3 増加する三つの数 なし       4, 5, 10   正 Yes ヒット  4 増加する三つの数 なし       -20, -12, -6 正 Yes ヒット  5 増加する三つの数 なし       3, 4, 11   正 Yes ヒット  6 増加する三つの数 なし       15, 25, 31  正 Yes ヒット

用いたことになり,逆に正事例の割合の減少は,「ネガティブテスト方略」傾向へのシフト を意味する。

5. シミュレーション結果

(1) モデルの行動例

 表3に,モデルの行動の二つの例を示す。上段は対立仮説を用いることができる場合の ターゲットの発見過程であり,下段は対立仮説を用いることができない場合である。第一事 例,仮説形成方略,蓋然性評価方略に関するパラメータは,前述のように一通りに固定され れている。

 表3の上段に着目すると,対立仮説を利用することによる「診断テスト」の状況を確認す ることができる。すなわち,各生成事例,[-14, -14, -8],[-7, -5, -3],[12, 18, 24],[15, 6, -3],[-16, -16, -16]は,各時点での主仮説と対立仮説を弁別する事例であり,実験の結果,主仮説もし くは対立仮説のいずれかが反証されている。この場合には「三つの異なった数字」をター ゲットとみなしてシミュレーションは停止している。

 一方,対立仮説を利用できない場合には,そのような組織的な事例生成を行なうことはで きない。モデルが制御可能なのは,正事例と負事例の生成割合だけである。この場合は,6 回のポジティブテストを行なって,最終的に「順に増加する数」を発見すべきターゲットと している。

(2) 仮説検証方略と正答率

 はじめに,対立仮説が利用できない場合のポジティブテスト方略,およびネガティブテス

ト方略の有効性について考えてみよう。そのために,以下のシミュレーションを行なっ た。第一事例,仮説形成方略,蓋然性評価方略に関するパラメータは,前述と同じく固定さ れている。この条件の下で,仮説検証方略に関わるパラメータを,モデルがポジティブテス ト方略を用いる状況(すなわち,実験において正事例のみを生成する場合)と,ネガティブ テスト方略を用いる状況(負事例のみを生成する場合)に設定した。

 モデルが持つ仮説空間において,最初に与えられる事例である[2, 4, 6]から形成可能な仮説は合計35種類となる。以下のシミュレーションでは,この35種類の中から29種類の仮説 をターゲットとして,実際にモデルにそのターゲットを発見させてみた。なお,35種類の仮 説の中から,同じような内容の仮説(例えば,「偶数」と「2の倍数」は同一内容の仮説)が 存在しているので,それを排除して29種類とした。図5の横軸には,その29種類のターゲッ トが示してある。

 図5の縦軸は,モデルが正しくターゲットを発見できた割合,すなわち正答率である。正 答率は,20回のシミュレーションを行った結果の平均である。

 さて,横軸に示された29種類のターゲットは,横軸の左から右に,特殊な規則からより 一般的な規則の順に配列されている。それぞれのターゲットの特殊性(一般性)は,そのター ゲットに属する事例の数に基づいて定義されている。例えば,「三つの偶数」というターゲッ トに属する事例の数は,「最初の数が偶数」というターゲットに属する事例の数よりも少な いので,前者は後者よりもより「特殊な」ターゲットとなる。

 図5において,□はポジティブテスト方略を用いてターゲットの発見を試みた場合,○は ネガティブテスト方略を用いた場合の正答率の推移である。

 図5より,効果的な仮説検証方略は,ターゲットの種類に依存したものであることがわか る。全体的傾向として,ターゲットが特殊な規則の場合,ポジティブテスト方略が有効であ る。特に,もっとも特殊な規則であるターゲット1からターゲット10に関しては,ターゲッ ト6を例外として,ポジティブテスト方略による発見は,100%の正答率に達している。一 方,ターゲットがより一般的な規則になるに従って,ポジティブテスト方略による仮説検証 の場合の正答率は減少し,逆にネガティブテスト方略を用いた仮説検証の場合の正答率が上 昇してゆくことがわかる。

 以上をまとめれば,ターゲットが特殊な規則の場合には,ポジティブテストが有効であり, 逆に一般的な規則の発見には,ネガティブテスト方略が有効であることが示されたことにな る。

 さらに,対立仮説を用いた「診断テスト方略」の効果は劇的である。図5において,△が 対立仮説を用いて仮説検証を行なった場合の正答率の推移を示している。対立仮説を用いな い場合には,効果的な仮説検証方略はターゲットの特殊性に依存していたが,対立仮説を用 いて「診断テスト」を行なえば,いずれのターゲットに対しても高い正答率を上げることが できることがわかる。

(3) 仮説検証方略と確証・反証

 次に,仮説検証方略と,仮説の反証および確証の生起状況との関係に着目してみたい。そ のために,前述のシミュレーションで用いた29種類のターゲットの中から,「連続する三つ の偶数」「順に増加する三つの数」「三つの数の積が偶数」という三種類のターゲットを取り 上げる。それぞれは,ターゲットの規則が特殊な場合,規則の特殊性が中程度の場合,そし て規則が一般的な場合に対応する。

 図6は,三つのターゲットのそれぞれについて,仮説検証方略と正答率との関係,および 仮説検証方略と確証,反証の生起状況との関係を示したものである。

 図6の横軸は,仮説検証方略の種類を示している。左側の五種類は,仮説検証において対 立仮説を用いなかった場合であり,数字は実験において正事例を生成する割合である。すな わち,左から右へ向かって,仮説検証方略がネガティブテスト方略からポジティブテスト方 略へとシフトしてゆくことを示している。一番右は,仮説検証において対立仮説を用いて 「診断テスト」を行なった場合である。

 折れ線グラフは,それぞれの仮説検証方略を用いた場合の「正答率」の推移である。正答 率は,20回のシミュレーションの平均値である。一方,棒グラフは「確証と反証の生起状 況」を示している。確証と反証の生起度数は,それぞれが,正事例,もしくは負事例のいず れによって得られたものであるのかに分類して示されている(すなわち,負事例による反証, 正事例による反証,負事例による確証,正事例による確証の四つに分類されている)。

 まず,「正答率」について見てみよう。ターゲットが特殊な場合(図6(a)参照)には,仮 説検証方略がネガティブテスト方略からポジティブテスト方略に遷移するに従って,徐々に 正答率が上昇してゆくことがわかる。逆に,ターゲットが一般的な規則の場合(図6(c)参照) には,その傾向は逆であり,ネガティブテスト方略を用いるに従って,正答率は上がってゆ く。ターゲットが中間的な場合(図6(b)参照)には,その中間的な傾向を示している。

 次に,「確証」の生起度数に着目してみる(正事例による確証+負事例による確証)。確証 の生起状況に関しては,三種類のターゲットについて大きな変化は見られない。確証の生起 度数は,実験において正事例の生成割合が半分程度(40%〜60%)の場合,すなわちポジ ティブテストとネガティブテストの中間的方略を用いた時にほぼ最大値をとり,そこからポ ジティブテスト優位,ネガティブテスト優位のいずれの方向にシフトしても,確証の生起度 数は若干減少するが大差は認められない。当然のことながら,ネガティブテスト方略からポ ジティブテスト方略に推移するに従って,負事例による確証の割合は減少し,かわりに正事 例による確証の数が増加する。ネガティブテスト優位の場合には,負事例による確証の割合 が増加する。

 さて,注目すべきは,「反証」の生起度数である(負事例による反証+正事例による反証)。 ターゲットが特殊な場合(図6(a)参照)には,反証は正事例よってしか生じていないことが わかる。負事例による反証は観察されない。仮説検証方略が,ポジティブテスト方略にシフ トするに従って,その正事例による反証が増加している。一方,ターゲットが一般的な規則 の場合(図6(c)参照)には事態は逆になる。反証の大多数は,負事例によって行なわれてい る。その負事例による反証が,仮説検証方略がポジティブテスト方略からネガティブテスト 方略にシフトするに従って増加していることがわかる。

 ここまでに,対立仮説を用いることができない場合について見てきたが,対立仮説を用い た「診断テスト」の場合にはどうだろうか。正答率については,三つのターゲットのいずれ に関しても高い正答率を上げている。

 次に,確証と反証の生起度数を見てみると,一見対立仮説を用いない場合に比して著しい 差異は観察されないように見える。仮説の修正機会としての反証の重要性を考えると,高い 正答率をあげる診断テスト方略において,反証の生起度数が増加しないことは不思議である。 しかし,図6に示されている確証,反証の度数は,主仮説に関するものであり,診断テスト においては,主仮説に対する確証が行なわれた場合には,対立仮説においては反証が生じる ことに注意しなければならない。すなわち,実質的な反証の度数はここに示されたものより もずっと大きいのである。実際,ターゲットが特殊な場合には主仮説の確証の37.6%,中間 的な場合には49.0%,一般的な場合には52.4%は,主仮説の確証は対立仮説の反証を伴うも のであった。

(4) シミュレーション結果のまとめ

 計算機シミュレーションの結果から得られた結論をまとめると,次のようになる。

・「ポジティブテスト方略」は,ターゲットが特殊な場合には有効である。一方,ターゲッ トが一般的な規則である場合には,「ネガティブテスト方略」が有効である。

・ターゲットが特殊な場合には,反証は正事例によって生じる場合がほとんどである。仮説 検証方略が,ポジティブテスト方略にシフトするに従って,その正事例による反証の生起 度数が増加し,それが正答率を上昇させていると考えられる。一方,ターゲットが一般的 な場合には事態は逆である。反証は負事例によって行なわれ,仮説検証方略がネガティブ テスト方略に推移するに従って負事例による反証が増加し,正答率が上昇すると考えられ る。

・「診断テスト方略」は,実験における仮説の反証機会を保証するものであることから,ター ゲットの種類に依存せず,いずれの場合にも極めて有効な仮説検証方略である。

 本章の冒頭でも紹介したように,これまでの仮説検証方略に関する研究は,仮説の修正機 会としての反証の重要性を指摘してきている。その上で,クレイマンらは,図2の枠組み を用いて,仮説の反証が,仮説とターゲットの関係に依存することを示している。

 計算機シミュレーションの結果は,旧来の知見と一貫する結果を与えている。すなわち, ターゲットが特殊な場合には,仮説とターゲットの関係が,ターゲットが仮説に包含される 状況(図2(b))の状況になりやすく,仮説の反証はポジティブテストによってしか生じない。 従って,ターゲットが特殊な場合にはポジティブテスト方略が有効な仮説検証方略となる。 同様に,ターゲットが一般的な場合には,ネガティブテスト方略が有効であったことの理由 も同様の説明が可能である。

(5) 結局どうすればよいのか

 クレイマンらは,正事例による仮説の反証の確率z+と,負事例による仮説の反証の確率 z-との関係を以下の式で与えている(Klayman, 1987)。以下の方程式は,原著からここでの検討に合わせて変形したものである。

 ここで,p(t)は,ターゲットに属する事例が,観察されうる全ての事例に占める割合,す なわち,任意に選んだ事例が,ターゲットに属する事例となる確率であり,図2で言えば, Tの面積がUに占める割合である。

 2-4-6問題においては,このp(t)は,前述したターゲットの特殊性に一致する。従って,ター ゲットが特殊な場合,すなわちp(t)が小さい場合にはz+>z-となって,ポジティブテストに より仮説の反証が生起する確率がより高くなることがわかる。計算機シミュレーションで得 られた,ターゲットが特殊な場合のポジティブテストによる反証の増加,正答率の上昇とい う結果は,クレイマンらのこの方程式の与える予測と一致する。

 それでは,一般的な科学的発見の場面において,ここまでに得られた知見はいかなる示唆 を与えるであろうか。

 まず,対立仮説が形成可能な場合には,「診断テスト」を行なうことが有効である。しか し,対立仮説を作るためには,システムの認知的コストが高くなる。複数の仮説を作るため には,より多くの観察や知識が不可欠であったり,より高度な知性が必要となる場合もある。 従って,診断テストを行なうことが常に可能であるとは限らない。そのような場合に,私た ちは,ポジティブテストとネガティブテストのいずれの方略を採用すればよいのであろうか。

 ここで,一般的な科学的発見の場面においては,観察されうる全事例にしめるターゲット に属する事例の比率p(t)は,かなり小さいものであることに注意しなければならない。観察 可能な事例の中で,発見すべきターゲットに従う事例はごくわずかである場合がほとんどで ある。「真実は奇なり」ということなのである。以上を勘案すれば,一般的な科学的発見の 場面では,ポジティブテスト方略が科学的発見のための有効な方略であることが示唆される。

 本章の冒頭で,人間の仮説検証には,「確証バイアス」が存在し,ポジティブテストをよ り多く行なう傾向があることを指摘した。そこでは,このポジティブテストに傾く人間の傾 向が,ターゲットの発見を疎外する要因としてはたらくように見えることを例示した。しか し,ここまでの検討を通して,人間が抱くこのバイアスが,現実場面では,実は合理的には たらく方略であることが明らかになった。

6. 計算機科学と実験心理学のいい関係

(1) モデルと行動

 クレイマンらは,図1の枠組みを提示した数年後,心理実験において,図2に示されたよ うな仮説とターゲットの関係を作り出すような状況を設定し,それぞれの状況において人間 が選択する仮説検証方略の検討を行なっている(Klaymanら, 1989)。その結果は次のようなものであった。

 被験者が行なった実験のうち「ポジティブテスト」が行なわれたのが約66%であったのに 対し,「ネガティブテスト」はわずか7%程度であった。また,約21%の実験では「診断テ スト」が用いられた。さらに,正答に達した被験者は相対的に「ポジティブテスト」を行な う回数が少なく,より多くの「診断テスト」を行なっていることや,ターゲットが仮説に包 含されるような状況(図2(b)のような状況)においては,「ポジティブテスト」の数が増え, それに伴って「反証」の数が他の状況に比して増加することなどを明らかにしている。

 ここで,本章で検討してきた計算機科学からのアプローチと,今述べたような実験心理学 からのアプローチの関係について検討してみよう(Miwaら, 1993)。

 図7は,「モデル」とそのモデルによって作り出された「行動」の関係を示したものであ る。心理実験におけるモデルとは,人間の頭脳のモデルであり,より具体的には人間が発見 過程に用いた知識や方略の集合である。行動とは心理実験で観察された被験者のデータであ る。一方,計算機シミュレーションにおいては,モデルとはプロダクションシステムの上に 構築されたモデルであり,行動とは計算機シミュレーションの結果がそれにあたる。

(2) 計算機科学的アプローチ

 さて,計算機シミュレーションでは,「モデル」が確定されると,次にはモデルのパラメー タを組織的に制御して,そのパラメータの変化が「行動」に与える影響を明らかにしようと する。本章の例で言えば,実験における正事例の生成割合を増やしていった時に,すなわち 仮説検証方略がポジティブテスト方略にシフトしていった際に,それに伴い正答率,仮説の 確証,反証の生起状況がどのように変化してゆくのかを観察したことなどがこれにあたる。 もちろん,そこで用いられたパラメータの値が,人間の頭脳のモデルを適切に反映している 保証が十分でない場合もある。かつ,人間が用いる手続きには多くの要因がからんでおり, 単純なパラメータの制御という考え方自体が問題になる場合もありえる。しかし,計算機科 学からのアプローチでは,「もし人間の頭脳がそのような『モデル』の形に表現できるとす れば,そこから生まれる『行動』はこのようになる」という知見を得ようとするのである。

 このように,計算機科学からのアプローチは「モデルオリエンティド」な研究方法である と言える。探求は「理論」としてのモデルから「データ」としての行動の方向へ向かい,そ の意味では「演繹」的な方向を有した探求方法であるとみなすことができる。

(3) 実験心理学的アプローチ

 一方,心理実験では,分析のためのモデルが仮定されると,次に焦点は実験によって得ら れた被験者の「行動」に移る。行動に基づいて,「モデル」がどのような手続きを用いてい たか,モデルのパラメータがどのような値をもっているかを同定しようとするのである。ク レイマンらの例で言えば,心理実験によって得られた結果から,ポジティブテスト,ネガ ティブテスト,診断テストの使用割合を割り出すことなどがこれにあたる。もちろん,人間 の行動には多くのノイズが含まれおり,同定された手続きも,パラメータの値も,被験者ご と,実験条件ごとに様々に変動することが常である。しかし,典型的な被験者を取り上げた り,統計的な方法を用いてデータをならすなどして,そこからモデルに関しての一般的な知 見を割り出そうとする。このようにして,実験心理学的アプローチでは,「実際に観察され た『行動』を生み出した『モデル』はこのような仕様をしているはずである」というような 論理が展開される。

 つまり,計算機科学的アプローチとの関係の中で実験心理学的アプローチを捉えると,そ れは「行動オリエンティド」な研究方法であると考えることができる。探求は,「データ」と しての行動から「理論」としてのモデルの方向へ向かい,いわば「帰納」的方向性をもった 探求方法であると考えられる。

(4) 計算機科学と実験心理学のいい関係

 今述べたような実験心理学的アプローチと,計算機科学からのアプローチの相補的性質は, 科学的発見の研究の様々な場面に認められる。

 例えば,ラングレーらは,与えられた数値の組から,ケプラーの法則,オームの法則,クー ロンの法則といったような一連の物理法則を発見するBACONという計算機モデルを構成し た(Langleyら, 1987)。いくつかのバージョンが存在するBACONプログラムの一つでは, 発見のプロセスで五つの方略というものを用いている。その方略の一つは「もしある変数x の値の組と別の変数yの値の組との間に線形関係があれば,xとyのその線形関係を見つけ よ(具体的には,y=ax+bなる傾きaと切片bを同定せよ)」というものであった。

 後に,チンらは,大学生にBACONで用いられたものと同じような課題を与え,ケプラー の第三法則を実験室で再発見させている(Qinら, 1990)。そこでは,14名中4名が正しい発見に達したことを報告している。さらに,それぞれの被験者が,その発見の過程でBACON に組み込まれた方略をどのように用いたかを分析した。その結果,五つの方略のうち,三つ の方略はどの被験者によっても用いられたが,残りの二つの方略は,正しい発見に達した被 験者にのみ使用可能な傾向があったことを示している。

 また,ホルムズらは,クレブスによるオルニシン回路の発見過程を取り上げ,クレブス本 人の研究日誌やインタビューを通してそのプロセスを再構成した(Holmes, 1980)。すると今度は,カルカーニらが,そのデータに基づいて,オルニシン回路の発見過程をトレースする プロダクションシステムを構成し,発見に用いられたいくつかの興味深い方略をプロダク ションルールのリストとして導き出している(Kulkarniら, 1988)。

 このように,科学的発見に関する研究方法として,計算機科学からのアプローチと実験心 理学からのアプローチを,モデルオリエンティドな探求方法と行動オリエンティドな探求方 法という枠組みの中で捉えることができる。前者は演繹的方法であるのに対して,後者は帰 納的な探求方法を提供している。

 物理学や化学などの自然科学は,「演繹」と「帰納」という二つの思惟のはたらきの相互 作用の中で発達してきた。そこでは,理論が現象を予測し(演繹),現象が実験によって確 認されて理論を検証する(帰納)。この演繹と帰納のらせんの中で理論は徐々に確立されて ゆく。

 計算機科学と実験心理学は,両者がそれぞれ演繹的方法と帰納的方法のそれぞれを提供す るという意味で,科学的発見の研究における二つの重要な柱を構成するものである。計算機 科学と実験心理学の「いい関係」は今後も続けられてゆくべきであるし,双方の努力によっ てなお一層の「いい関係」を作ってゆくことが期待される。

 本小論自体も,計算機科学にバックグランドを持つ筆者と,実験心理学者である名古屋大 学教育学部の岡田猛氏との共同研究に基づいている。共同研究者である岡田猛氏に謝意を現 わす。

参考文献

Anderson, J. R. (1993). Rules of the mind. Lawrence Erlbaum Associates.

Chinn, C. A. & Brewer, W. F. (1992). Psychological responses to anomalous data. Proceedings of the Fourteenth Anual Conference of the Cognitive Science Society, 165-170, Hillsdale, NJ: Lawrence Erlbaum Associates.

Freedman, E.G. (1992). Scientific induction: Individual versus group processes and multiple hypotheses. Proceedings of the Fourteenth Annual Conference of the Cognitive Science Society, 183-188. Hillsdale, NJ: Lawrence Erlbaum Associates.

Gorman, M. E., & Gorman, M. E. (1984a). A comparison of disconfirmatory, confirmatory and control strategies on Wason's 2-4-6 task. Quarterly Journal of Experimental Psychology, 36A, 629-648.

Gorman, M.E., Gorman, M. E., Latta, R. M., & Cunningham, G. (1984b). How disconfirmatory, confirmatory and combined strategies affect group problem solving. British Journal of Psychology, 75, 65-79.

Gorman, M. E., Stafford, A., & Gorman, M. E. (1987). Disconfirmation and dual hypotheses on a more difficult version of Wason's 2-4-6 task. Quarterly Journal of Experimental Psychology, 39A, 1-28.

Holmes, F. L. (1980). Hans Krebs and the discovery of the ornithine cycle. Federation Proceedings, 39, 216-225.

Klahr, D., Langley, P., & Nissen, M. J. (1987). Production system models of learning and development. Cambridge, MA: MIT Press.

Klayman, J., & Ha, Y.-W. (1987). Confirmation, disconfirmation, and information in hypothesis testing. Psychological Review, 94, 211-228.

Klayman, J., & Ha, Y.-W. (1989). Hypothesis Testing in Rule Discovery: Strategy,Structure, and Content. Journal of Experimental Psychology: Learning, Memory, and Cognition, 15, 596-604.

Kulkarni, D., & Simon, H. A. (1988). The processes of scienetific discovery: The strategy of experimentation. Cognitive Science, 12, 139-175.

Langley, P., Simon, H., Bradhsaw, G., & Zytkow, J. (1987). Scientific discovery. Cambridge, MA: MIT Press.

Mahoney, M. J., & DeMonbruen, B. G. (1977). Psychology of the scientist: An analysis of problem-solving bias. Cognitive Therapy and Research, 1, 229-238.

Miwa, K. & Simon, H. A. (1993). Production System Modeling to Represent Individual Differences: Tradeoff between Simplicity and Accuracy in Simulation of Behavior, Proceedings of Artificial Intelligence and Simulation of Behavior Conference, Birmingham, 158-167, IOS Press

三輪和久 (1996) 記憶のコンピュータ・シミュレーション 高野陽太郎(編) 認知心理学2記憶 東京大学出版会 253-278

Miwa, K. & Okada, T. (1996). Effective Heuristics for Hypothesis Testing: An Empirical Discussion using a Computer Simulation Method, Journal of Japanese Society for Artificial Intelligence, 11, 877-887.

Newell, A. (1991). Unified theories of cognition. Cambridge, MA: Cambridge University Press.

Popper, K. R. (1959). The logic of scientific discovery. New York: Basic Books .

Platt, J. R. (1964). Strong inference. Science, 146, 347-353.

Qin, Y. & Simon, H. (1990). Laboratory replication of scientific discovery processes. Cognitive Science, 14, 281-312.

Tukey, D. D. (1986). A philosophical and empirical analysis of subjects' modes of inquiry in Wason's 2-4-6 task. Quarterly Journal of Experimental Psychology, 38A, 5-33.

Tweney, R. D., Doherty, M. E., Worner, W. J., Pliske, D. B., Mynatt, C. R., Gross, K. A., & Arkkelin, D. L. (1980). Strategies of rule discovery in an inference task. Quarterly Journal of Experimental Psychology, 32, 109-123.

Wason, P. C. (1960). On the failure of eliminate hypothesis in a conceptual task. Quarterly Journal of Experimental Psychology, 12, 129-140.

Wason, P. C., & Johnson-Laird, P. N. (1972). Psychology of reasoning: Structure and content. London: Batsford.