NIH(NCI)でのOutstanding Investigator会議2 (MPE統計学)
この会議は2015年からこの賞を受賞している約50人の中から私を含めて25人の研究者が、それ以降の受賞者の約30人及びNCIの研究者を含めた約60人の出席者を前にして、これまでの4年間の研究成果を発表する形式で、2日に渡り行われました。前回も述べたとおり、これは初めての試みですが、来年以降も続いて開催される見通しです。
発表は1人15分です。多くの発表者は癌が発生、成長、進展する分子メカニズムなどを調べる基礎系の研究をしており、データを多用したプレゼンテーションを行っていました。現実にこの研究費を取得している疫学者は今の所は私ただ独りだけのようです。
私は他の発表者とは異なり、細かいデータを一切見せず、仮説と結果を出来るだけ単純化して理解しやすいように話しました。
もちろん細かい方法論やデータは最重要であり、論文などではきちんと検討し記述していることは言うまでもありませんが、私は限られた時間内でのプレゼンではそれよりも科学全体の流れの中での自分の研究の立ち位置やこれからのヴィジョンなどのより大きな概念を説明することに主眼を置くことにしています。これは一つには私の専門分野である分子病理疫学(MPE)や免疫分子病理疫学研究の専門家が少ないので、プレゼンは非専門家にも理解できるようにする必要があるためです。理解不能な講演ほど時間の無駄なものはありません。私はそういう講演をしないように心がけています。
今回の発表で、私はこのグラントを用いて行なった研究成果を発表したのですが、その中でこれまでこのブログではまだ紹介していない、MPEに関連した統計解析手法開発についての内容を少し紹介しました。
私はMPE研究のために人の大規模集団の調査結果から得られるデータを使用しています。この調査の参加者に癌が発生したときには、その癌組織を入手し分子病理・免疫・微生物解析を行います。このような研究の場合、例えばある調査項目に回答がない、あるいは癌組織が入手できないなどの理由で、統計解析から除外せざるを得ない参加者が現れるのが常です。
通常の臨床研究や疫学研究では、このような除外された参加者や症例はいないものとして統計解析の際に考慮に入れません。最近の研究で、これら除外者の他のデータを使って、除外されなかった参加者のデータの統計解析におけるバイアスの影響を下げ、結果の正確性を上げることが可能になりました。これはまるで手品みたいな話でしょう。
疫学分野ではこうしたデータ解析方法論が飛躍的な進歩をとげています。世間一般あるいは非疫学者の科学者一般のイメージと全く異なり、疫学という学問分野が最先端データ科学の一つということが分かっていただけると思います。
MPE分野における数理統計学研究を私とともに行なったのが、ハーバード大学の同僚のワング(Molin Wang)准教授とヴァンデアウィール(Tyler VanderWeele)教授です。私が数年前にある解析方法に関する数理統計学の講義に出席した際に、これはMPEに応用できると考え、数理統計学の理論の応用方法に関する論文を共同で仕上げ、実際のデータ解析に利用するに至りました。
その論文のリンクはこちらです。
実際にこの新しい解析方法を使用し、除外された参加者を使用しない通常の統計解析を行なった結果と比べてみると、確からしい仮説をより強力に支持するような結果になることが多いというのが現在までの実感です。より専門的に言えば、信頼区間範囲をそれほど変えることなく効果量が大きくなるということです。
この手法を実際にMPE研究に用いているグループがすでに増えてきています。我々は統計学の分野でもこのように最先端の手法を利用してMPEの研究方法の開拓をしています。
MPEはこうした最新のデータ統計解析手法を含む大きな学問概念であることがお分かりいただけたかと思います。
*画像:NCIのホームページより引用