全国消費実態調査の匿名データからSASのリレーショナルデータベースを完全自動構築するシステムの開発

周防節雄

共同研究集会「公的統計のミクロデータ等を用いた研究の新展開」

統計数理研究所(2015年11月27日)

要旨

昨年、全国消費実態調査(全消)の教育用擬似ミクロデータを変数ラベル付きSASデータセットに変換し、かつ変数フォーマット文も自動作成するSASプログラムを開発した(周防2014a、2014b)。本論文では、それと同様の手法を使い、1994年、1999年、2004年の3回次分の全消・匿名データ(一般世帯分と単身世帯分)を対象に同様のSASプログラムを開発した。ただ、教育用擬似ミクロデータの場合は対象データが一個だけだったので、それだけを対象にSASプログラムを書けば済んだ。しかし、今回は全部で6個のミクロデータ(単身世帯と一般世帯データ)が3年分)が対象になり、年次毎にそれぞれファイル構造が異なり、含まれている変数も必ずしも共通でないので、ひとつひとつ6個に対してプログラムを作成していては手間も時間もかかり、信頼性の問題も懸念される。そこで、「符号表(エクセル形式)などのメタデータを参照しながらオリジナルの匿名データ(固定長のCSVファイル)をSASデータセットに変換する」SASプログラム(複数)を自動生成するSASプログラム(複数)を開発することにした。要するに、「全工程を自動処理する一連のSASプログラム」をSASプログラムで書くことを思いついた。自動生成されたSASプログラム(複数)も最後に自動実行されて、変数ラベル付きSASデータセット(複数)と変数フォーマット文を定義したSASプログラム(複数)が生成される。この全工程を通して人手による操作は一切含まれていないので、信頼性は完全に保証されている。

ダウンロード

論文とSASプログラム一式がダウンロードできます。

報告予稿およびSASプログラム(圧縮ファイル形式)

(ただし、論文及びSASプログラム一式の著作権は周防節雄にあります。)

連絡先

公益財団法人統計情報研究開発センター 客員上席研究員
兵庫県立大学 名誉教授
周防節雄 (Ph. D)
suoh@gk.u-hyogo.ac.jp