統計学の定義
『データを収集、表示、解析する科学。』統計学の種類
記述するために
- データ(分布)の特徴を把握するための指標。
- 統計量【statistic】、記述統計量、基本統計量、要約統計量:データから求める値やその計算方法を表す関数。平均や分散なども含む。
- 代表値【measure of central tendency】:集団の中心的傾向を示す値。例)平均値(算術平均)、中央値、最頻値(モード)
- 可視化:グラフ
推測するために
確率モデルからデータが生成されたと仮定して、データから確率モデルの性質を推測する。
- 確率モデル:確率変数と呼ばれる数学的な表現を用いて、ある現象がどのような確率で起こるかを表したもの。
推測統計の種類
- 統計的推定【statistical inference】:統計学的に、母集団の特性値(平均・分散など)を標本のデータから推測すること。
※あくまで憶測の範囲での推測。100%はない。不確実性の中で評価する。
- 統計的仮説検定、検定【statistical hypothesis testing】:母集団に対する仮説が標本のデータを用いて、統計学的に成立するか評価し、判断すること。
母集団【population】
興味や研究などの調査対象の集まりすべて。標本を抽出するためのデータ発生元となる統計量の集まりすべて。
標本【sample】
母集団から抽出したデータの集まり。
- 標本抽出、サンプリング:母集団から標本を取出すこと。
- 標本サイズ、サンプルサイズ、標本の大きさ:標本に含まれる要素の数
調査
- 全数調査:母集団の全要素を調査すること。※金銭的・時間的コスト多大の為、不可能がほとんど。
- 標本調査:標本から母集団の性質や特徴を調べること。
- 個体、ケース:調査する対象。