プロテオミクス
「プロテオミクスとA I」
■背景
「タンパク質」という言葉を知らない人はいないと思います。タンパク質は三大栄養素の一つですが、なぜ、それほど大切なものなのか説明出来ますか?
遺伝子(ジーン:gene)、全遺伝子(ゲノム:genome)、全遺伝子の網羅的解析(ゲノミクス:genomics)に対して、タンパク質(プロテイン:protein)、全タンパク質(プロテオーム:proteome)、全タンパク質の網羅的解析(プロテオミクス:proteomics)と言われます。プロテオミクスは生体のその時々の状態を調べる究極の方法です。その理由を理解出来れば、上の問いに答えられるようになります。また、近年のAI技術の劇的な進歩により、プロテオミクスはさらに進化しつつあります。
図1 生命活動はタンパク質により支えられている
アスリートが筋肉を増強するための「プロテイン飲料」が強調されることが多いですが、ほとんど全ての生命活動をタンパク質が担っています。筋肉の成分はアクチンやミオシンというタンパク質の一種です。しかし、筋肉だけでなく、見るためにはロドプシンが、考えるためにはカルモジュリンが、お酒を飲んだ後にはアルコールデヒドロゲナーゼが、食べた後にはトリプシンやリパーゼといったタンパク質が身体の中で活躍しています。逆に言えば、もしもこれらのタンパク質が足りなければ、動けないだけでなく、見ることも、考えることも、お酒を飲むことも、食べることも出来なくなります(図1)。タンパク質を食べないといけないのは、筋肉をつけるためだけでなく、ほとんど全ての生命活動を維持するためなのです。
図2 生体は遺伝子(設計図)の情報をもとに生合成されるタンパク質(分子ロボット)により管理、維持されている
タンパク質は遺伝子の情報をもとに、様々な状況の変化に応じてその都度、身体の中で作られます(図2)。そのため、その時々で身体の中で働いているタンパク質は変化します。逆に言えば、身体の中で働いているタンパク質を網羅的に眺めれば、その時の身体の状態を知ることが出来ます(図3)。それがプロテオミクスなのです。
図3 働いているタンパク質(分子ロボット)を網羅的に観ることによって身体(国)の状態が判る
■研究概要
プロテオミクスは、タンパク質こそが生命現象の担い手であることが解った当初から、究極の生体診断法と考えられました。しかしながら、これまでは高品質のプロテオミクスデータを取得することも、また、その複雑で膨大な情報を読み解くことも困難で、研究や一部の高度医療でしか使われませんでした。そこで、高品質のデータ(図4:参考文献1)を短時間で少ない量のサンプルを用いて取得する技術を開発しました。また、その技術を用いて取得した教師データを使って機械学習を行ったA Iを用いてプロテオミクス(二次元電気泳動)画像データを読み解くことにより、疾患(敗血症)の診断に成功しました(参考文献2)。図5は被験者の罹患時と健常時のプロテオミクスデータ画像(左:ヒトの見方)とAIによる診断時にAIが注目している箇所の重みを可視化したもの(右:AIの見方)です。これまでの二次元電気泳動画像解析では、最初にスポットの場所を定義し、比較する画像間でそれらのシグナルの強度を比較します。他方、AIはスポットのシグナル強度だけでなくその形にも注目していることが分かりました。例えば、図5で、ヒトの眼には、疾患の有無による違いとして1のスポットの有無に注意が引かれます(図5左:ヒトの見方)。それに対して、診断時にAIが注目した部分を見ると(図5右:AIの見方)、2の部分(横に伸びる “裾“ の部分)にAIが注目したことが分かります。このことは、スポットの有る無しではなく、AIがこれまでは扱うことが難しかったスポットの形状に注目して診断したことを示しています(参考文献3)。このように、A Iはヒトよりも早く正確に画像から疾患を診断出来るだけでなく、これまでにヒトの眼では判別が難しかった部分も捉えることで、より高い次元で画像診断をしていることが分かりました。
図4 プロテオミクスデータ(二次元電気泳動画像)の一例。もともと混在しているタンパク質を大きさ(縦軸)と電荷(横軸)で分離して可視化する。
図5 二次元電気泳動画像(左)とAIが病気の診断時に注目した部分を強調した画像(右)。
■科学的・社会的意義
本研究は、理論的には生体の究極の診断法であるが、これまでは用いるのが難しかったプロテオミクスを、データをハイスループットに取得する技術とA Iを組み合わせることで実用化するためのものです。この技術が実用化されれば、病気の診断だけでなく、日常的な疲労や月経の自己管理、TPOに応じた自身の能力のコントロール、いつまでも健やかに暮らせる健康長寿、さらには牧畜や農業における健やかな家畜や農作物の収穫を実現します。近い将来、この技術が皆さんの暮らしを支えるものになることが期待されます。
■参考文献
1)林 宣宏. (2011) “生体の高精度かつハイスループットなプロファイリング:改良型2次元電気泳動法を基盤技術に用いる高性能プロテオミクス.”未来材料, 11(1), 42-49.
2)林 宣宏, 氏本 慧,澤田 好秀,佐藤 佳州,中田 透,三木 隆弘,射場 敏明. (2018) “認識・検出 深層学習に基づく転移学習を用いた臨床検体の二次元電気泳動画像診断による敗血症識別.“ 画像ラボ(日本工業出版), 29(4), 19-24.
3)Hayashi, N., Sawada, Y.,et al (2021).”Diagnosis of sepsis by AI-aided proteomics using 2D electrophoresis images of patient serum incorporating transfer learning for deep neural networks.” Applied Sciences 11,1967.
■良く使用する材料・機器
1) 等電点電気泳動装置 Ettan IPGphor 3 IEF System (Cytiva)
2) 電気泳動装置 XCell SureLock™ミニセル電気泳動システム (Thermo Fisher)
3) 蛍光イメージャー Thphoon™ FLA9500 (Cytiva)
R4年度分野別専門委員
東京工業大学・生命理工学院
林 宣宏 (はやし のぶひろ)
http://www.myr.bio.titech.ac.jp/HayashiLab/Welcome.html