オープンデータとは
オープンデータとは、国民誰もがインターネットを通じて簡単に利用できるように、無料で公開されているデータのことです。
オープンデータなら、加工・編集・再利用を自由に行えます。
オープンデータの例として、次があります。
他にもたくさんあるので、興味がある方はぜひ調べてみてください。
- e-Stat(総務省):日本の統計データ
- 米国国勢調査局:米国の統計データ
- Amanzon API:Amazonの商品情報や在庫情報など
- unicef:UNICEFのデータ
今回は、e-Statを使ったデータの取得方法をご紹介します。
【データ分析】e-Statでオープンデータをダウンロード
「全国の小学生の体力測定と身長体重の関係を分析したい」場合を例として、データを取得してみましょう。
統計データの種類を選ぶ
e-Statを開くと、下記の画面に遷移します。
分析する統計データを取得する場合は、「統計データを活用する」の下部から該当するデータ種別を選択します。
今回は、「地域」を選びます。ここより先の説明は、「地域」データを取得方法です。

都道府県・市町村を選択
分析するデータが、都道府県なのか、市町村なのかを選択しましょう。
今回は都道府県を選択します。

地域選択
続いて、地域の絞り込みをしましょう。
今回は、日本全国の小学生を対象にしたいため、すべての都道府県を選択します。

全ての項目が、「選択中地域」に移動しました。

全国の平均値などは不要なため、「全国」のみ選択し、削除します。

「全国」以外のすべての都道府県が選択状態になりました。
確定ボタンを押します。

表示項目選択
対象地域が選択できたら、次は分析するデータの分野や項目を選択しましょう。
今回の例では、Iの健康・医療を選択します。

続いて、項目を選択します。
今回は、関連する項目である「I4」から始まるすべての項目を選択し、「項目を選択」を押下します。


レイアウト設定
最後に出力するデータのレイアウトを設定します。
右上の「ダウンロード」を押します。

ダウンロードの設定に移ります。
今回は、pythonで分析するため、csvファイル形式でダウンロードします。
その他の項目も自由に設定しましょう。
設定が完了したら、「ダウンロード」を押下します。

確認画面の「ダウンロード」を押下しましょう。

これで、データが取得できました。