質的変数と量的変数の違いとは?【全データ種類解説】

変数とは

質的変数や量的変数にある「変数」とは、データの項目、種類のことを指します。


変数には、一般的に色んな意味があるから、要注意だ



つまり、質的変数とは「質的な種類のデータ」、量的変数とは「量的な種類のデータ」のことです。


詳しく見ていきましょう。



質的変数とは


質的変数とは、データが数字ではなくカテゴリで表せるもののことです。



カテゴリ変数や質的データとも呼ばれます。



例えば、下記のようなデータです。

  • 好きな動物
  • 出身地
  • 血液型



「はい」「いいえ」の2択で応えられるデータも、質的変数になります。


例えば、「病気になったか」、「スマートフォンを持っているか」など、アンケート結果データにありそうなデータが該当します。

量的変数とは

量的変数とは、数字の大小に意味があるデータのことを指します。


量的データとも呼びます。


例えば、下記のようなデータのことです。

  • 身長
  • 距離
  • 所得


このように、数字がデータになっているもののことです。


量的変数は、離散データと連続データの2種類に分けられます。

両者の違いは、正確な数で答えられるデータかどうかです。



連続データ

正確な数で答えられないデータのことを連続データといいます。


例えば、身長や体重などです。

健康診断で計測する身長は、だいたい小数点第二位を四捨五入していますが、細かく計測しようと思えば、どこまでも細かく計測できます。


確かに、僕の身長は141cmだけど、ピッタリ141cmなわけじゃないよね。

そうだね。どこかで四捨五入しないと数えられないから、便宜上141cmとしているだけなんだ。



離散データ

正確な数で答えられるデータのことを離散データといいます。


連続データの反対です。



例えば、物の数、お金などが離散データです。

りんごが5つあった場合、りんごの数は5であると正確な数で答えられます。


確かに、りんごが5.4215…個とか、ありえないよね。

他の種類のデータ

質的変数・量的変数以外にも、様々な種類のデータがあります


ストックデータ

ストックデータとは、ある時点において蓄積している量を表すデータのことを指します。

例えば、総資産額、総人口など、総〇〇と名前がつくものは、だいたいストックデータと言えるでしょう。

今ある全てのものをかき集めた数、つまり、この世界にストック(蓄積)している物の数ということか!

フローデータ

フローデータとは、一定期間の間に流れた変化量を表すデータのことを指します。

例えば、一年間で消費されたりんごの数(消費量)、1時間あたりの交通量などです。


消費量も交通量も、常に変化している値です。

常に変化している値をデータとして表すのは大変なので、1年や1時間といった時間的に区切ることでデータとして処理できるようにしています。



統計学を学ぶならスクールがおすすめ


統計学を学んでデータサイエンス力を向上させるなら、データサイエンススクールに通うのがおすすめです。

データサイエンススクールをおすすめする理由は、実際にコーディングやデータ分析をしながら統計学を学べるためです。



試験勉強などのインプットと平行して、アウトプットを増やしながら学習することで、より実践で使えるスキルになるでしょう。


おすすめのデータサイエンススクールは、こちらの記事で解説しています。

あなたの目的にあったスクールを選んでみてください。

Aidemy(アイデミー)の評判や料金、転職支援を徹底解説【データサイエンス】

2022年5月30日