区間推定とは
区間推定とは、推測統計学の推定の方法の一種です。
推定の手法には、次の2つがあります。
- 点推定:1点のみで推定する。
- 区間推定:区間で推定する。
点推定では、母集団の分散を標本分散から推定するように、1つの値を推定します。
一方、区間推定は、信頼区間と呼ばれる区間をを推定します。
例えば、「95%の確率で、平均値は10~11の間である」というように推定できます。
関連記事はこちら。
信頼区間の求め方
信頼区間の求め方は、母分散が既知か未知かで異なります。
母分散の既知・未知とは
既知とは「すでに知っている」、未知とは「まだ知らない」という意味合いです。
よって、母分散があらかじめ分かっているかを表します。
もともと区間推定を使う理由って、母集団全部のデータを観測できないから標本を抽出して推定するんじゃなかったっけ?
それなのに、母分散が既知な場合って、あるのか?
犬さんが言う通り、母分散が既知な場合は非常に稀です。
例えば、母集団全数を検査していないけど、それに近いくらい検査されている場合は既知と扱ったり、長年データを蓄積していてデータのばらつきがわかる場合などが、「母分散が既知」といえるケースです。
信頼区間の公式
信頼区間の公式は、次の通りです。
基本的に形は同じだけど、既知でZを使っているところで、未知ではtを使っているね
それぞれの公式の使い方はこちらの記事を参照してください。
統計学を学ぶならスクールがおすすめ
統計学を学んでデータサイエンス力を向上させるなら、データサイエンススクールに通うのがおすすめです。
データサイエンススクールをおすすめする理由は、実際にコーディングやデータ分析をしながら統計学を学べるためです。
試験勉強などのインプットと平行して、アウトプットを増やしながら学習することで、より実践で使えるスキルになるでしょう。
おすすめのデータサイエンススクールは、こちらの記事で解説しています。
あなたの目的にあったスクールを選んでみてください。