二次分析って?

二次分析とは、「二次データを利用して分析を行った研究」です。
二次データ(既存データとも言う)とは、「研究者本人以外が収集したデータ」のことを言います。
二次分析は個票データを用いたものが多いですが、集計表データを用いて行うことも可能です。

二次分析の利点や意義は?

公開データに基づく二次分析による研究には、一次分析にはない次のような利点がある。
・データ収集の時間とコストが節約できる分、仮説の構築や検証過程に労力を注ぐことができる。
・データ共有化により研究者間の交流が活性化される。
・広く利用可能な公開データを用いた解析は、研究の透明性確保、第三者による研究結果の検証、若手の育成に寄与する。
・研究の無駄を減らし、必要な労力を新たな研究に向けるという意義もある。
・時系列比較や国際比較の研究を行うことが比較的容易となる。

上記内容は、「佐藤博樹,石田浩,池田謙一編:社会調査の公開データ 2次分析への招待.東京大学出版会,2000年,p2-3」から一部引用しました。本書は社会研究に関するものですが、社会研究に限らず二次分析を行う上でとても参考になります。

なぜ集計表を用いるのか?

 諸外国では、公的機関により実施された調査データはもちろん、公的な助成により得られた調査データに関しては、一定の期間が経過した後に個人が特定されない形での公開が一般的に行われています。
 このような個票データの利用が、諸外国に比べて困難な現状のわが国では、誰もが入手しやすい集計表を用いた二次分析が活躍する余地が大いにあると考えます(本当は、諸外国のように、個票データが広く使えるような世の中になってほしいのだけど)。

きっかけ

 集計表を用いた二次分析の着想は、2009年秋、公衆衛生大学院の1年コースに在籍していた頃にさかのぼります。
 CIE(注1)実習で、「日本のがん登録の現状を米国と比較せよ」というお題が出て、プレゼン&レポート作成をしたことがきっかけです。2009年当時、全国がん罹患数・罹患率推計値の人口カバー率はわずか31.0%でしたが、。

(まだ途中です)

 (注1)Clinical Information Engineeringの略で、いつもCIEと呼んでいました。あ、いや、日本の大学院ですけど。実習では、2週毎にお題が与えられ、各自がプレゼン&レポート作成をするという、楽ではない実習だったけれど、とても楽しかった。