| トピックス 2008.6.18 |
 |
| 小判は本物か? ― 属性サンプリングによる真贋判定 |
 |
| 監査法人トーマツ パートナー 山本 御稔 |
 |
私たちは日々、膨大な製品に取り囲まれている。テレビ、PC、自動車、携帯電話等、挙げだしたらキリがない。それらの製品は設計書に従って製造されているか、想定した性能を発揮するか。もしもそうでなかったら欠陥品である。欠陥品が市場に出回れば大問題となる。
欠陥品はどのようにして発見できるのか。一番確実な方法は製造物のすべてを検査することである。しかし、この作業には膨大な時間がかかるため、経済的には非効率である。そこで登場するのが統計学のサンプリング理論だ。サンプリング理論の中でも属性サンプリングという手法を用いれば、ある一定の数の製品の検査によって、全製品の中にどれぐらいの欠陥品があるのかがわかるのだ。この便利なサンプリング理論の仕組みについて学んでみよう。
【小判は本物か?】
| 商人 |
「イッヒッヒ。お代官の吉田様もワルでございますねぇ」 |
| 代官 |
「何を言うか、海老屋め。そちの方がワルというものよ。このような小判でわしをたぶらかそうとするのじゃからな」 |
| 商人 |
「いやはや、吉田様も強欲でおられます。黄金の輝きではお気に召しませんかな。1,000枚もの小判のせいで吉田様のご尊顔も金色でございます」 |
| 代官 |
「海老屋、そちの歯も金色じゃ。あ、それはもともと金歯であったのう」 |
| 商人 |
「ヒョッヒョッヒョ!」 |
| 代官 |
「ウォッホッホッホ!」 |
| 商人 |
「ヒョッヒョッヒョ!」 |
| 代官 |
「ウォッホッホッホ!」 |
| 商人 |
「ヒョッヒョッヒョ!」 |
| 代官 |
「いつまで笑っておるのじゃ海老屋。話が進まぬではないか。ところでのう、まさかこの小判、まがいものが混じっておるのではなかろうな。まぁ、1,000枚もあるのだから失敗作もあるであろう。よし!こうしよう。1,000枚のうち9%程度の失敗作は許そう。それを超えておるようであれば…」 |
| 商人 |
「超えていれば…」 |
| 代官 |
「超えておれば、そちに与えた利権は志賀屋のものじゃっ!」 |
| 商人 |
「な、な、なにをおっしゃいますか、吉田様。なんならお調べいただいてけっこうでございます」 |
| 代官 |
「調べろって言われてもなぁ、1,000枚もあるからのう。どうすれば良いのじゃ。困ったのぉ」 |
| 商人 |
「困りましたねぇ」 |
ということになるのである。1,000枚もある小判のひとつひとつを調べれば良いのだが、これでは効率が悪いし、実務的ではない。この難問を解決するのが統計学である。
1,000枚の小判のうち失敗作が9%なのか、それを上回るのか。この真偽を判定するための方法のひとつは「1,000枚の小判の全てを判定すること」である。このうち失敗作が90枚を超えたら、アウト!である。この作業には膨大な時間がかかる。1枚30分で成分と比重の鑑定を行っても不眠不休で20日間もかかるのだ。無駄である。
時間を節約するために統計学が考え出した理論に入る前に、考えておくべきことがある。どうして「1,000枚全てを判定しようとしたのか」である。私たちは、暗黙のうちに「失敗作の小判が混じっている」という証拠、つまり“失敗作”そのものを見つけようとするのである。だから、1,000枚全部を判定したくなるのである。
統計学はこの考え方を採用しない。次のとおりに発想の転換を行う。
| * |
まず「1,000枚の小判には90枚(<9%)を超えない失敗作がある」と考える。これを仮説という。 |
| * |
次に「1,000枚の中に90枚を超える(>9%)失敗作がある」という別の仮説を提示する。 |
| * |
ここで、発想を次のように転換する。 |
| * |
「1,000枚の中に90枚を超える(>9%)失敗作がある」ということが起きる可能性が、例えば、10%に満たないとすれば… |
| * |
「1,000枚の小判には90枚(<9%)を超えない失敗作がある」という可能性は90%程度存在する! |
| * |
ということは、90%の信頼度をもって「1,000枚の小判には90枚(<9%)超えない失敗作がある」という仮説は正しいと考えることができる |
|
【帰無仮説】
| 代官 |
「なんだか複雑になってきたのぉ、海老屋」 |
| 商人 |
「ここが、こらえどころでございますよ、吉田様」 |
| 代官 |
「まず、仮説を作るのか」 |
| 商人 |
「そうでございます。この場合の仮説は「1,000枚の小判には90枚(<9%)を超えない失敗作がある」でございますね。この仮説を証明するために、「1,000枚の中に90枚を超える(>9%)失敗作がある」という仮説を作るのです」 |
| 代官 |
「なんで2つもいるのじゃ?」 |
| 商人 |
「片方の仮説である「1,000枚の小判には90枚(<9%)を超えない失敗作がある」を、そのまま証明するのは大変だからでございます。ですので、もうひとつの仮説として「1,000枚の中に90枚を超える(>9%)失敗作がある」を用意するのです。そして、この仮説を否定するのです」 |
| 代官 |
「否定するとなにが起きるのじゃ」 |
| 商人 |
「否定すると、「1,000枚の中に90枚を超える(>9%)失敗作がある」ということは正しくない、ということになります」 |
| 代官 |
「当たり前じゃ」 |
| 商人 |
「そうです。その当たり前のことを行うのです。「90枚を超える失敗作がある」という仮説が否定されると、残るものはアレでございます」 |
| 代官 |
「アレか」 |
| 商人 |
「アレでございますよ」 |
| 代官 |
「アレってなんじゃ?」 |
| 商人 |
「なんだ分かってないのか…」 |
| 代官 |
「今、何か申したか…志賀屋に利権を…」 |
| 商人 |
「あ!お待ちください。アレとは「90枚を超えない失敗作がある」のことでございます。つまり、「90枚を超える失敗作がある」という仮説が否定されると、残るのは「90枚を超えない失敗作がある」という仮説のみになるという理屈でございます」 |
| 代官 |
「本当か?わしをたぶらかそうとしておるのではあるまいな。やっぱり志賀屋に利権を…」 |
| 商人 |
「いえいえ決してそのようなことはございません。お考えにもなってみてごらんください。この世の中には「失敗作が90枚を超えない」か「失敗作が90枚を超える」かのどちらかしかないわけでございます。このどちらかしかない状態で、片方の「90枚を超える失敗作がある」が否定されれば、残りは「90枚を超えない失敗作がある」しか残らないではないですか」 |
| 代官 |
「釈然とせぬなぁ…。なにか回り道をしておるようじゃ」 |
| 商人 |
「それでございます」 |
| 代官 |
「どれじゃ」 |
| 商人 |
「いや、漫才をしておる場合ではございません。その「回り道」が統計的仮説検定の奥義でございます。まず、「こうであってほしい」という仮説をたてます。その後、わざと「否定したい」仮説をたてるのです。今の場合、こうであって欲しいというのは「90枚を超えない失敗作がある」でございます。否定したいというのは「90枚を超える失敗作がある」でございます」 |
| 代官 |
「ひでえ話だ。ひてい話だ。否定話だ」 |
| 商人 |
「それは「ひでえ」と「否定」をかけた駄洒落でございますか」 |
| 代官 |
「なぜ、それを聞く…やはり志賀屋に利権を…」 |
| 商人 |
「いや、あっはっは!死ぬほどおもしろうございます。さて、仮説でございます。わざわざ否定したい仮説を作ってそれを否定するという回り道をとるのでございます。否定することを統計の世界では「棄却(ききゃく)」と呼びます」 |
| 代官 |
「知っておるぞ。郵便を運ぶ人のことだろ」 |
| 商人 |
「それは飛脚でしょ」 |
| 代官 |
「ならば、ひとつの椅子のことか」 |
| 商人 |
「それは一脚」 |
| 代官 |
「いつまで続けるのじゃ」 |
| 商人 |
「それはこちらのセリフでございます。否定することを棄却というのです。否定する仮説のことを帰無仮説(きむかせつ)と呼びます」 |
| 代官 |
「無に帰すからか…ロマンチックじゃのぉ」 |
【検定の実際】
「帰無仮説を棄却する」ということは日本語にすると「否定したい仮説を、望みどおりに否定する」ということである。それでは具体的に数値を入れて帰無仮説を棄却してみよう。
| * |
仮説:「1,000枚の小判には90枚(=9%)を超えない失敗作がある」
↑これは棄却したくない! |
| * |
帰無仮説:「1,000枚の小判の中に90枚を超える(>9%)失敗作がある」
↑これは棄却したい!! |
| * |
信頼水準:90% |
|
まず、失敗作ができる確率を p と置く。失敗作ができない確率は(1-p)である。次にサンプル数をNとする。すると、1件も失敗作ができない確率は(1-p)をN回掛け合わせたもの、つまり (1-p)^N となる。
次に帰無仮説「1,000枚の小判の中に90枚を超える(>9%)失敗作がある」を簡略化する。「9%を超える失敗作がある」とまで簡略化できる。もっと頑張ると「9%を超える」となる。これをもっと頑張ると「p>9%」となる。単純なことである。この「p>9%」あるいは「p>0.09」を90%の信頼水準で否定(棄却)すればいいのである。
90%の信頼水準で帰無仮説を棄却するということは、「p以内の確率で失敗作ができる確率が90%であり、pが9%を超える確率で失敗作ができる確率は10%を超えない」ということである。「10%という確率ですら起こらないような仮説は棄却する」のである。
ということは 1-(1-p)^N>0.9 ということである。
これを日本語にすると
| p以内の確率で失敗作ができる確率は90%より大きい |
である。
さて中学校の数学に戻って、さっきの式を組み替えよう。まずは左辺の1を右辺に持ってくる(懐かしいでしょ!)。
| 1-(1-p)^N>0.9 → -(1-p)^N>0.9-1 → -(1-p)^N>-0.1 |
次に両辺に-1を乗じる。すると不等号がひっくり返る(こういう法則、懐かしいでしょ!)。
となる。
この式に数字を入れてみよう。
pは9%、すなわち0.09である。ということは、上記の式は
となる。
これをNについて解くと、めでたく N>24.4 となり、N>25 と考えることができる。
| 代官 |
「海老屋…ということは…どういうことじゃ??」 |
| 商人 |
「お代官様、1,000枚の小判を全部調べずともよいのです。1,000枚のうちから25枚を選んで、それらの25枚を調べれば良いのです。25枚に失敗作がなければめでたく帰無仮説は棄却されるのです」 |
| 代官 |
「しかしのぉ…『(1-0.09)^N<0.1 をNについて解く』とか、シラッと言われてものぉ」 |
| 商人 |
「なにも綺麗に解く必要もないのでございますよ。代入すればよいのです」 |
| 代官 |
「代入か。勝手に数字を入れるのか」 |
| 商人 |
「そうでございます。例えば1,000枚のうち1枚を調べると考える場合、(1-0.09)^N<0.1 のNに1を入れるのです。1-0.09は0.91ですからその1乗は0.91のままでございます。0.91は0.1より大きいのでございます」 |
| 代官 |
「当たり前じゃ」 |
| 商人 |
「すると(1-0.09)^N<0.1は0.91<0.1 となり、これはおかしいですから1枚だけを調べてもダメなのです。次に2を代入しますと0.91の2乗は0.83ですね。まだまだダメです。そこで表をご覧ください」 |
| 代官 |
「表?どこに表があるのじゃ」 |
| 商人 |
「読者には表が見えるのです」 |
| 代官 |
「そうか!それではその表とやらを見てみよう」 |
| 商人 |
「表では小判の枚数が増えるごとに、計算結果がだんだんと小さくなることがわかります。その結果、小判の枚数が25枚になった時に数値が0.1を下回ることがわかります」 |
| 代官 |
「なるほど!式でわからなければ実際に代入すればよいのじゃな!」 |
| 商人 |
「その通りでございます」 |
| 代官 |
「そうじゃな!」 |
| 商人 |
「そうでございます!」 |
| 代官 |
「…」 |
| 商人 |
「…」 |
| 代官 |
「…」 |
| 商人 |
「どうされましたか。お気に召しませんか」 |
| 代官 |
「いや、オチがないのじゃ」 |
| 商人 |
「はぁ?」 |
| 代官 |
「説明は全部終わっておるのじゃが、なにかオチがないと話を締めくくれぬのだ」 |
| 商人 |
「勝手にせいっ」
|
|
 |
表:小判の枚数と計算結果
 |
代官・商人 「お後がよろしいようで」 |
 |
| 以上 |
 |
関連するサービス
 年金コンサルティング | サービスタイプ | クライアント別 | テーマ別 | |
 |
|
|
|