前回の続きで統計検定3級の範囲となる内容(主に数式関連)についてまとめます。
前回はデータ分析に出てくる内容を取り扱いました。
統計検定3級の勉強していますが、様々な公式が出てきます。 そんなに難しい公式はないのですが、覚えることがそこそこ多く油断…
今回は確率編です。条件付き確率やベイズの定理に触れてまいります。
はじめに
一般財団法人 統計質保証推進協会によって開催されている検定です。
その名の通り、統計学に関する知識や活用力を評価する検定試験です。
統計学を学びたい人にはお勧めの資格となっております。
試験の概要につきましては、以下の記事を参照ください。
確率で出てくる主な数式はこちら!
古典的確率
同様に確からしいと仮定できる根元事象の数がn個あり、ある事象Aに含まれる根元事象の数がk個あるとき、Aの起こる確率は次のように定義されます。
$$P (A) = \frac{k}{m}$$
カード、サイコロなんかでよく出題されていますね。
頻度確率
古典的確率の欠点を是正するために提案された頻度確率です。
根元事象がすべて等しいとみなせない場合などで活用します。
全事象を U = {ai | i = 1, 2, … k} とするとき、各aiが起こった相対頻度を考えます。
試行回数が無限大にいくときの相対頻度の極限値をpiと置くとき、事象Aの頻度確率は次のように定義されます。
$$P (A) = \sum_{a_i \in A}(p_i)$$
条件付き確率
2つの事象A、BがありAが起こったという条件の下で、Bが起こる確率を考えます。
一般に、事象Aが与えられた時の事象Bの条件付き確率 P (B|A) は次のように定義されます。
$$P (B | A) = \frac{P (A \cap B)}{P(A)}$$
ただし、P (A) > 0を仮定します。
ベイズの定理
さて、さきほど定義した条件確率について
$$P (B | A) = \frac{P (A \cap B)}{P(A)}$$
右辺の分子は P (B) P(A|B)に等しいです。
次に分母P (A)については、
$$A = A \cap U = (A \cap B) \cup (A \cap \overline{B})$$
となります。
$$(A \cap B) と (A \cap \overline{B} )$$
は互いに排反であるから、
$$ P(A) = (A \cap B) + (A \cap \overline{B})$$
が成り立ちます。したがって、条件確率の定義から
$$ P(A) = P(B)P(A|B) + P(\overline{B})P(A|\overline{B})$$
となり、以上のことから
$$P(B|A) = \frac{P(B)P(A|B)}{P(B) P(A|B) + P(\overline{B})P(A|\overline{B})}$$
が成り立ちます。
案外、読み込んでみるとそこまでではないのですが…統計検定3級の確率はここまでです。
おわりに
今回は統計検定3級で出てきた公式(確率編)をまとめてみました。
高校で数学やっていた人なら、最初ら辺は既に習っている範囲かと思われますので、案外すぐに理解できてしまうかもしれません。
ベイズの定理なんかは根本を理解すれば問題なく解ける内容ですので、本番までには抑えておきます。
…数式はLaTeX使って書いているのですが、これを扱う思いのほか大変でした。特に記号!
どこで使うか分かりませんが、こちらも良い勉強になってます。