まぬねこの足跡。。。

備忘録+たのしさ+ひっそりと

統計学:ことはじめ

統計学の定義

『データを収集、表示、解析する科学。』

統計学の種類

  • 記述統計学【descriptive statistics】:手持ちの(標本・母集団)データを整理・要約して、データの特徴をわかりやすく(グラフ・表などで)表現すること。
  • 推測統計学【inferential statistics】:手持ちの(標本)データから、データ発生元(母集団)データの性質を推測すること。

記述するために

  • データ(分布)の特徴を把握するための指標。
    • 統計量【statistic】、記述統計量、基本統計量、要約統計量:データから求める値やその計算方法を表す関数。平均や分散なども含む。
    • 代表値【measure of central tendency】:集団の中心的傾向を示す値。例)平均値(算術平均)、中央値、最頻値(モード) 
  • 可視化:グラフ

推測するために

確率モデルからデータが生成されたと仮定して、データから確率モデルの性質を推測する。

  • 確率モデル:確率変数と呼ばれる数学的な表現を用いて、ある現象がどのような確率で起こるかを表したもの。

推測統計の種類

  • 統計的推定【statistical inference】統計学的に、母集団の特性値(平均・分散など)を標本のデータから推測すること。

  ※あくまで憶測の範囲での推測。100%はない。不確実性の中で評価する。

  • 統計的仮説検定、検定【statistical hypothesis testing】:母集団に対する仮説が標本のデータを用いて、統計学的に成立するか評価し、判断すること。

母集団【population】

興味や研究などの調査対象の集まりすべて。標本を抽出するためのデータ発生元となる統計量の集まりすべて。

  • 母集団サイズ、母集団の大きさ: 母集団に含まれる要素数
  • 母数統計学では、母集団の性質。例:代表値


  • 有限母集団:含まれる要素数が有限のもの。例:1クラス分の人数。
  • 無限母集団:含まれる要素数が無限のもの。例:サイコロを振った出目

標本【sample】

母集団から抽出したデータの集まり。

  • 標本抽出、サンプリング:母集団から標本を取出すこと。
  • 標本サイズ、サンプルサイズ、標本の大きさ:標本に含まれる要素の数

調査

  • 全数調査:母集団の全要素を調査すること。※金銭的・時間的コスト多大の為、不可能がほとんど。
  • 標本調査:標本から母集団の性質や特徴を調べること。
  • 個体、ケース:調査する対象。