タンパク質名称の統一と標準化の必要性
今回は、私が以前から問題視していた生物医学分野の大問題について書きたいと思います。それは、遺伝子から作られる物質、特にタンパク質の命名のシステムが乱立していることです。科学者はみな自分の好きなタンパク質の名称を使っていて、命名に関するルールが未だに定まっていません。
同じタンパク質に複数の別の名前がついていたり、同じ名前が全く違う複数のタンパク質に使われている現状は、誤ったコミニュケーション、検査結果の誤解、治療の間違いなどの大きな弊害をもたらす可能性があります。また、異分野で異なる呼び方をされている場合が多いので、一つの名前で検索しても他分野の研究成果がヒットせず、そのタンパク質についての総合的な知見を得にくくなります。AIなどで論文を大量に解析しようとする場合にも内容を読んで判断していく必要性が生じ、余計な手間、あるいは解析の誤りを招くことになるでしょう。このタンパク質の名称問題は些細な問題などでは全くなく、大きい視野でみると科学の進歩を阻害するひとつの要因となっています。
有名な例としてはPDCD1という遺伝子から作られるPD1(PD-1)というタンパク質が挙げられます。本庶佑教授らがノーベル賞を獲得した、癌免疫学の分野では超有名なタンパク質です。まずおわかりのように、ダッシュをつけるかどうかも統一されていません。また、PD1(PD-1)という名称が、PDCD1とは全く関係ないSNCA及びSPATA2遺伝子の産物にも使われています。昨今、高額な治療薬として話題になっている抗PD-1抗体治療薬が、全く別のタンパク質を阻害する治療薬を意味する可能性があるということです。実際は薬そのものの名称があるので起こりにくいとは思いますが、最悪のケースとして全く効果のない高額の薬を使われて副作用に苦しむ可能性を考えてください。これは恐ろしいことではないでしょうか。このように、タンパク質の名称乱立問題は深刻なのです。地震対策や癌予防の記事で述べているように、実際に被害が出る前の段階で未然に防ぐのが最善です。
もう一つの例として、新型コロナウイルスの感染に関係することが示唆され注目を浴びている受容体タンパク質、ACE2があります。最近は新型コロナウイルスの治療のためのACE2の阻害剤という文脈で、ACE阻害剤という用語が使われることがあります。しかしACEという名前は他のタンパク質にも用いられており、ACE阻害剤という言葉に2通りの意味(ACE2またはACEの阻害剤)を与えてしまっています。これもPD1(PD-1)の事例と同様に間違った治療で悪影響を与える可能性がないとは言い切れません。
このように、科学の発展の阻害や致命的な誤解を防ぐためにもタンパク質の名称の統一と標準化は急務であるのに、あまり誰もそのことを提唱していません。研究者は自分の使ってきた分子やタンパク質の名前に愛着がある場合が多いでしょうから、統一に抵抗があることが予想され容易ではありません。たとえノーベル賞受賞者であっても、彼らが用いている名称とは違う名称を使ってくださいとお願いして、納得していただかなければ標準化が進まないという困難を考えてください。
少し話がそれますが、抵抗の良い事例がアメリカが未だに使い続けているヤード(長さ)・ポンド(質量)・ガロン(体積)・ファーレンハイト(温度)など、種々の単位でしょう。日本を始めとする世界中の国々で(お隣のカナダですらも)メートル法を採用しているのに、変更の気配はありません。世界の中心であると自負しているアメリカらしい話です。しかしながら、医学研究などでは当然、世界標準であるメートル法の単位が使用されるため、アメリカの医療の現場では薬の量はグラムなのに体重はポンドといったように、両方を使っていて紛らわしいことこの上ありません。最悪の場合、単位の誤解による医療ミスを招く恐れすらあります。それなのに長年放置されているのは、一般的には広くヤード・ポンド法が使われており、変更に対して国民から大きな抵抗があるからでしょう。我々日本人もメートル法に変えるときに様々な業種の人の抵抗があったことは容易に想像できます。実際に未だに坪と畳が使われているのもその名残でしょう。
タンパク質の名称については、いくつかの団体がそれぞれ構造、機能、局在等の様々な側面から名称を決定していますが、統一されていません。また、そもそも構造、機能、局在については科学の発展により新しい知見が発見されることは多々あり、そうした従来の名称が適切でなくなることもあり得ます。そこで、私はタンパク質の元である遺伝子の名前を元にして標準化すべきだと考えています。遺伝子の名前については、Human Genome Organisation (HUGO) のGene Nomenclature Committee (HGNC) の定めたHGNC Gene SymbolとIDナンバーが標準化されています。基本的にタンパク質は遺伝子から合成されますので、すでに確立している遺伝子名称標準化を元にしてタンパク質の名称を標準化できれば、現時点において同定・測定されるタンパク質のほとんどで曖昧さを回避できます。実際に米国国立衛生研究所(NIH)などの複数の団体が以前からこの方法を推奨していますが、残念ながら未だ広く採用されるに至っていません。もちろん遺伝子産物というのは一つの遺伝子に一つの名称のような単純なものではなく、もっと複雑なものです。タンパク質の修飾その他の変化形の複雑さを記述するためにも、まずは遺伝子産物・タンパク質の名称標準化の方法論が必要なのです。
先程例に挙げた癌免疫分野の研究者にとってはPD-1タンパク質に対応する遺伝子はPDCD1と考えられます。しかし他の研究者にとってはPD-1タンパク質はSNCA遺伝子産物あるいはSPATA2遺伝子産物なのです。さらに、近年盛んなジェノム解析においてはHUGO Symbolsのみが使われていて、PD-1などの名称は使われておりません。おそらく大勢のジェノム解析をしていない免疫学者にはPDCD1が有名な遺伝子(あるいは遺伝子産物)を意味すると認識するのが困難ではないでしょうか。そもそも、遺伝子のPDCD1 とタンパク質のPD-1という2つの違う名称を使う必要性がどこにあるのでしょうか。単にPDCD1遺伝子とPDCD1タンパク質と呼べば分かりやすく簡便です。PD-1治療薬についていえば、標準化して抗PDCD1(PD-1)抗体治療薬というべきです。
ずっと使い続けているものを変更することには必ず抵抗があります。しかし、戦国時代(尺貫法)とそして明治時代(メートル法)に度量衡を統一したことを契機として我が国の科学と経済が発展したように、抵抗を乗り越えてでも、標準化をすることは科学の発展の土台となることは間違いありません。