変数とは
質的変数や量的変数にある「変数」とは、データの項目、種類のことを指します。
変数には、一般的に色んな意味があるから、要注意だ
つまり、質的変数とは「質的な種類のデータ」、量的変数とは「量的な種類のデータ」のことです。
詳しく見ていきましょう。
質的変数とは
質的変数とは、データが数字ではなくカテゴリで表せるもののことです。
カテゴリ変数や質的データとも呼ばれます。
例えば、下記のようなデータです。
- 好きな動物
- 出身地
- 血液型
「はい」「いいえ」の2択で応えられるデータも、質的変数になります。
例えば、「病気になったか」、「スマートフォンを持っているか」など、アンケート結果データにありそうなデータが該当します。
量的変数とは
量的変数とは、数字の大小に意味があるデータのことを指します。
量的データとも呼びます。
例えば、下記のようなデータのことです。
- 身長
- 距離
- 所得
このように、数字がデータになっているもののことです。
量的変数は、離散データと連続データの2種類に分けられます。
両者の違いは、正確な数で答えられるデータかどうかです。
連続データ
正確な数で答えられないデータのことを連続データといいます。
例えば、身長や体重などです。
健康診断で計測する身長は、だいたい小数点第二位を四捨五入していますが、細かく計測しようと思えば、どこまでも細かく計測できます。
確かに、僕の身長は141cmだけど、ピッタリ141cmなわけじゃないよね。
そうだね。どこかで四捨五入しないと数えられないから、便宜上141cmとしているだけなんだ。
離散データ
正確な数で答えられるデータのことを離散データといいます。
連続データの反対です。
例えば、物の数、お金などが離散データです。
りんごが5つあった場合、りんごの数は5であると正確な数で答えられます。
確かに、りんごが5.4215…個とか、ありえないよね。
他の種類のデータ
質的変数・量的変数以外にも、様々な種類のデータがあります
ストックデータ
ストックデータとは、ある時点において蓄積している量を表すデータのことを指します。
例えば、総資産額、総人口など、総〇〇と名前がつくものは、だいたいストックデータと言えるでしょう。
今ある全てのものをかき集めた数、つまり、この世界にストック(蓄積)している物の数ということか!
フローデータ
フローデータとは、一定期間の間に流れた変化量を表すデータのことを指します。
例えば、一年間で消費されたりんごの数(消費量)、1時間あたりの交通量などです。
消費量も交通量も、常に変化している値です。
常に変化している値をデータとして表すのは大変なので、1年や1時間といった時間的に区切ることでデータとして処理できるようにしています。
統計学を学ぶならスクールがおすすめ
統計学を学んでデータサイエンス力を向上させるなら、データサイエンススクールに通うのがおすすめです。
データサイエンススクールをおすすめする理由は、実際にコーディングやデータ分析をしながら統計学を学べるためです。
試験勉強などのインプットと平行して、アウトプットを増やしながら学習することで、より実践で使えるスキルになるでしょう。
おすすめのデータサイエンススクールは、こちらの記事で解説しています。
あなたの目的にあったスクールを選んでみてください。