【データ分析】オープンデータとは?e-Statからデータを取得する方法

オープンデータとは

オープンデータとは、国民誰もがインターネットを通じて簡単に利用できるように、無料で公開されているデータのことです。


オープンデータなら、加工・編集・再利用を自由に行えます。


オープンデータの例として、次があります。



他にもたくさんあるので、興味がある方はぜひ調べてみてください。







今回は、e-Statを使ったデータの取得方法をご紹介します。

【データ分析】e-Statでオープンデータをダウンロード



「全国の小学生の体力測定と身長体重の関係を分析したい」場合を例として、データを取得してみましょう。

統計データの種類を選ぶ

e-Statを開くと、下記の画面に遷移します。



分析する統計データを取得する場合は、「統計データを活用する」の下部から該当するデータ種別を選択します。


今回は、「地域」を選びます。ここより先の説明は、「地域」データを取得方法です。

e-statトップ画面





都道府県・市町村を選択

分析するデータが、都道府県なのか、市町村なのかを選択しましょう。



今回は都道府県を選択します。

都道府県・市町村の選択



地域選択

続いて、地域の絞り込みをしましょう。


今回は、日本全国の小学生を対象にしたいため、すべての都道府県を選択します。


地域選択1





全ての項目が、「選択中地域」に移動しました。

地域選択2




全国の平均値などは不要なため、「全国」のみ選択し、削除します。

地域選択3





「全国」以外のすべての都道府県が選択状態になりました。

確定ボタンを押します。

地域選択4





表示項目選択



対象地域が選択できたら、次は分析するデータの分野や項目を選択しましょう。

今回の例では、Iの健康・医療を選択します。

分野の選択





続いて、項目を選択します。

今回は、関連する項目である「I4」から始まるすべての項目を選択し、「項目を選択」を押下します。





項目の選択



レイアウト設定

最後に出力するデータのレイアウトを設定します。


右上の「ダウンロード」を押します。



ダウンロードの設定に移ります。

今回は、pythonで分析するため、csvファイル形式でダウンロードします。




その他の項目も自由に設定しましょう。



設定が完了したら、「ダウンロード」を押下します。






確認画面の「ダウンロード」を押下しましょう。

表のダウンロード




これで、データが取得できました。