「AI創薬」という言葉はさまざまな文脈で使われるが、科学技術振興機構 研究開発戦略センター(JST-CRDS)「研究開発の俯瞰報告書(2023年)」による定義が最も包括的かもしれない。つまり、標的探索や医薬品候補物質の最適化など、創薬研究の各段階の効率を目的として、広義のAIを適用する技術の確立や、それら要素技術の統合を通じて、創薬研究のあり方そのものを変革する試みのことだ。ここで「広義のAI」とは、機械学習のみでなく、従来人間が行っていた高度な判断をコンピュータによって代替する広範な技術や研究分野を指す。


 去る5月8日にはAlphabet-Google傘下のGoogle DeepMindが開発したAlphaFold(AF)3の論文が公開され、「AI創薬」の強力なツールとして世界的な注目を集めた。そこで、❶AF開発の背景、❷AF3の実際、❸日本における「AI創薬」への動きを紹介する。

※なお、『 』内に示した文中の用語を記事の最後にまとめたのでご参照いただきたい。


■他グループを圧倒したAF2の立体構造予測


 AF開発の背景には、半世紀以上にわたって世界の研究者が取り組んできた“protein-folding problem”がある。そこに稀代の天才が現れたことで、解決への糸口が見えてきた。


【タンパク質の折り畳み問題】タンパク質は、20種類のアミノ酸間の引力と斥力によって“自発的に”折り畳まれて固有の立体構造を形づくり生体内で機能を発揮するが、折り畳みのプロセスはブラックボックスの中だった。米国の生化学者C. Anfinsenは1961年、タンパク質が最終的な立体構造をとるのに必要な情報が一次構造にコーディングされていることを示唆。1972年のノーベル化学賞受賞スピーチで「いつか、アミノ酸配列だけから、あらゆるタンパク質の3次元構造を予測できるようになるだろう」と述べた。その後、X線結晶構造解析あるいは、核磁気共鳴分光装置や低温電子顕微鏡(クライオ電顕)等を用いた解析が行われてきたが、多大な労力、時間と費用を要するものだった。


【CASPでの連続優勝と相次ぐ受賞】AFが華々しく登場した舞台は『CASP』。計算構造生物学(computational structural biology)によるタンパク質立体構造予測手法の評価と発展のために、1994年から隔年で行われている国際コンテストだ。主催者は、立体構造は未解明だが上述のような構造解析が進行中で、近く三次元座標が決定されそうなタンパク質等の配列情報とモデリングのカテゴリを提示。それをもとに、参加者(研究グループ)が予測の精度を競う。CASP1(第1回)は参加グループ数、予測標的数ともに30余りだったが、直近(22年)のCASP15には100グループが、127の標的・5つのカテゴリに対し、53,000以上のモデルを提出した。


 Google DeepMindの初代AFは18年に行われたCASP13のRegular Targets部門で優勝(参加グループ名A7D)。CASP14で連続優勝した際(参加グループ名AlphaFold2)は、実験的な構造予測とほぼ同等という他を圧倒する予測精度を示して一躍脚光を浴びた。このバージョンは21年7月にAlphaFold v2.0として無償公開され、同年末にはScience誌の“The Breakthrough of the Year 2021”に選ばれた。さらに、AlphaFold開発の立役者であるDemis Hassabis氏(Google DeepMind CEO、共同創業者)とJohn Jumper氏(同社Director)は、「タンパク質の3次元構造を予測する革新的な技術“AlphaFold”の発明に対して」23年のアルバート・ラスカー基礎医学研究賞も受賞した


【AFにつながったゲーム開発手法】1976年に北ロンドンで生まれたHassabis氏は、まさに天才だ。24年4月のトークイベントで語った内容によると、彼は子どもの頃から「現実の根本的な性質」や「意識とは何か」に関心があり、「科学的発見を加速するためにAIを役立てること」を目標に、生涯をAIと汎用人工知能『AGI』に捧げる覚悟という。


 同氏は“チェスの神童”として名を馳せた10代で初期のチェスコンピュータに触れて「コンピュータが脳と同じことをできるか」に興味を抱き、人気シミュレーションゲームを開発。ケンブリッジ大学でコンピュータサイエンスを学び、2年飛び級で卒業。数年間ゲーム関連企業の仕事に携わった後、2009年にユニヴァーシティ・カレッジ・ロンドンで認知神経科学の博士号を得た。


 DeepMind Technologiesを立ち上げたのは翌2010年。まずはゲーム開発でアイディアとアルゴリズムを試した。コンピュータ囲碁プログラムAlphaGoは、何百万のゲームを自分自身と対戦する『深層強化学習』を通じて、かつてないアイディアや戦略を生み出した。また、どんな2人用ゲームもこなすAlphaZeroは、文字通りゼロからインターネット上で行われている人間のゲームを全て学習させ、24時間ほどで世界チャンピオンレベルに進化したという。


 14年にはGoogleが同社を買収し、その額は500~700億円相当と報じられた。AFの開発は16年、AlphaGoが世界最強のプロ棋士に勝ち越した直後に開始。前述のように18年以降、タンパク質の立体構造研究に大きな変化をもたらした。同氏は、23年4月にAlphabetの自社ラボGoogle BrainとDeepMindが合併してGoogle DeepMindとなってからも、引き続きこの部門を率いている。同社は、AFの他にも『マルチモーダルAI』のGeminiをはじめ、複数のAIプロジェクトを担当している。ただ、ChatGPTの出現で、Googleは23年に社内緊急事態を宣言したと報じられており、厳しい競争の最前線にいるのも事実だ。


■AI創薬を1,000億米ドル規模のビジネスに


 AF3は、Google DeepMindとIsomorphic Labsが開発したAFの最新バージョンだ。後者は、AIと計算手法を創薬に応用することを目的として21年に設立されたGoogle傘下のスタートアップで、Hassabis氏がCEOを務める。“Isomorphic”は同型を意味し、「生物学と情報科学には共通の基本構造がある」「AIファースト、デジタルバイオロジーのアプローチで創薬を0から再編集する」という考え方を示している。AFという基礎生物学ツールの作業を創薬に拡張し、副作用や毒性の劇的な低減も目指す。


 Nature誌は24年5月8日、「AlphaFold3を用いた生体分子相互作用の正確な構造予測」と題した論文を掲載した。23年12月に受理し査読後、24年4月に採択、通常の原著論文形式に整える前に速報したもので、著者には上記2社の49名が名を連ねている。


【AF3の特徴】AlphaFold-Multimer v2.3(AF2.3)と異なる特徴を、以下に挙げる。

対象となる生体分子の拡大:タンパク質だけでなく、核酸(DNA、RNA)、低分子、イオン、修飾残基などの複合体の構造予測が可能になった。

❷従来法を上回る予測の精度と速さ:AFの予測精度は、平均して1原子の幅以内。AF3は、従来の専用ツール(最新のドッキングツールによる「タンパク質-リガンド間相互作用」予測、核酸特異的な「タンパク質-核酸間相互作用」予測)に比べて精度が大幅に向上。また、AF2.3による「抗原-抗体」予測よりも精度が高かった。

❸構造予測ツールとデータベースの併用による利便性:AF3の機能は、新たに構築されたAlphaFold Server上で利用できる。また、Googleと『EMBL-EBI』が共同運用しているAlphaFold Protein Structure Database(PDB、オープンアクセス)に収納されたタンパク質の予測構造は、21年に35万超であったものが現在は2億を超え、既知のタンパク質のほぼ全てをカバーし、190ヵ国・100万人超のユーザーが利用している。なお、AF3の利用は現在のところ上記サーバーを用いた非商用利用に限られ、1利用者・1日当たりの予測件数の上限は20件である。


【AF2からの改良点】AF2では、Google開発の『Transformer』を応用した『Evoformer』を用い、「アミノ酸残基間のコンタクト予測」と「予測対象タンパク質との類似性を有すると考えられる鋳型構造情報」を『深層学習』で統合していた。AF3では、Evoformerを改良するとともに、予測プロセスに画像生成AIで汎用される『拡散モデル』を用いることで、分子構造が鮮明になったとされる。


【AF3のインターフェイス】大まかなイメージを〈図〉に示す。

❶入力:AlphaFold Serverの画面ではまず、プルダウン式で分子タイプ(タンパク質、DNA、RNA、リガンド、イオン)とコピー数を選ぶ。タンパク質はアミノ酸配列を、核酸は塩基配列を入力する。さらに、リガンドは19種、イオンは10種の選択肢(いずれもよくあり得るもの)からプルダウン式で選ぶ。必要な入力を終えたら、作業に名前をつけて保存できる。

❷結果表示:予測された立体構造とともに複数の指標が示される。主な指標として、原子ごとの信頼度推定値『pLDDT』、予測整列誤差『PAE』、立体構造全体の精度を示す『pTM』『ipTM』などがある。


【AF3の課題】より大規模で複雑な分子システムや複数の分子が関与する動的な相互作用の予測および、非標準的な化学修飾や異常な分子モデリングには限界があること、莫大な計算リソースが必要なこと、非専門家には結果の解釈が難しいことなどが指摘されている。


【AF3の位置付けと今後のビジネス展開】Hassabis氏は、生物学の範囲は広大だが、AF3は「さまざまな構造の分子が相互に作用する“ダイナミックな姿”を理解する第一歩だ」。「従来法だと1つの構造を明らかにするのに4~5年(一人の学生の博士課程全期間相当)かかる」が「それを1年に短縮できれば、2億のタンパク質で10億年だったものが2億年に節約できる」と語る。


 また、新薬承認に要する時間が長いと感じてはいるが、自分たちとしてはまず「創薬プロセスを短縮する」ことに専念するという。Isomorphic Labsは24年1月、イーライリリーおよびノバルティスと戦略的な提携を結んだことを発表。将来的には自社に30億米ドル(約4,700億円)の価値を生む可能性があるとした。今後2~3年内にAIでデザインした最初の薬が登場することを期待しており、将来的には1,000億米ドル(約16兆円)規模のビジネスを目指している。ちなみに、Alphabet全体の23年10~12月四半期売上高が約13兆円である。


 一方、創薬に限らず現在指摘されている大きな課題のうち、「AIが学習するデータの不足」はゲーム開発時のような自己学習で解決可能、「スパコンでの計算に莫大なエネルギーを要すること」は事実だが、長期的には投資を上回る社会的なメリットがあるとの考えを示している。



■ChatGPTとは異なる創薬AIの難しさ


 一方、国内では奇しくもAF3論文が公開された翌日に「医療と生命科学におけるAI活用」をテーマとしたセミナーが開催された(主催:千里ライフサイエンス振興財団)。その中で奥野恭史氏(京都大学/ 理化学研究所/ ライフ インテリジェンス コンソーシアムLINC)は、「AIは創薬を変革できるのか」と題した講演を行い、AI活用のビジョンと実例を示した。


【コロナ禍で露呈した日本の課題】コロナ禍において、米国では多数のベンチャーからシードを上げ、官民を挙げ莫大な研究費をかけて、メガファーマとベンチャーともに1年以内にワクチンを開発した。一方、国内では21年6月になってようやく内閣官房から問題点を整理したドキュメント「ワクチン開発・生産体制強化戦略(案)」が出された。こうした甘さが日本の残念なところだ。わが国の企業・研究者は世界トップレベルの研究開発力を十分に持っているが、海外に比べると規模や資本が見劣りし、ベンチャーも少ない。製薬に限らず、日本の産業界はリスクを取れない・取りたくない体質があるのではないか。


【創薬プロセス全体をAIで繋ぐ】私は、創薬を革新するには、AIをうまく活用して徹底的なDX化を図るしなかいと考えている。AF3が出たばかりだが、10年かかる創薬の問題をたった一つや二つのAI技術(要素技術)で解決できるわけではない。現在、創薬のプロセス単位でAIを使う企業が増えてきたが、担当部署ごとのばらばらな利用では変革につながらない。プロセス全体をAIで数珠繋ぎし一連のプラットフォームで動かせば、サイバー空間でシミュレーションし予測しながらリアルな現場の超効率化や生産性向上が図れるはずだ。この方法は私自身10年以上前から取り組んでおり、技術的には可能だが十分な費用がなかった。最近になって、これまで国の支援で要素技術を開発してきた実績がある、上流の部分の統合に着手した(「富岳」を基軸とした創薬DXプラットフォームの構築)。


【創薬革新には統合力が必須】「AIによる創薬の変革」に対する期待は高まっているが、ChatGPTとは異なる難しさがある。言語学習に基づくAIとは費用や時間をあまりかけずに大量のデータを取得できるが、バイオ空間やケミカル空間で実験等によって得られるデータには限界がありコストもかかるからだ。大規模なデータ収集のためには、『HTS技術』やロボティクスによる高速化や低コスト化、シミュレーションによるデータ生成などの方法がある。


 また、公開データだけよりも製薬企業からのデータを加えた方が精度は上がるが、企業同士は競争関係にあり、自社データそのものは見せたくないという要望がある。その解決策として、学習データを自社(組織内)に置いたまま、複数の組織が強調してAIモデルを学習する『連合学習』体制の構築がある。現在、製薬企業15社に導入し、動作を検証中だ(AI創薬向け機械学習ライブラリkMOL)。もはや1社で凝り固まっていては世界に勝てない。AIは重要なパーツではあるが、並行して、業界を挙げて効率的にデータを収集する仕組みを社会実装するための投資が必要だ。


 大規模なデータを集めただけでは駄目で、それを学習しきれるスパコンが必須であり、生物・化学・物理・医療等の『ドメイン知識』『アーキテクチャ』に反映させることが重要だ。所管官庁等にこだわってスパコンが分散するのは望ましくない。世界が尋常ならざる投資と規模で創薬に取り組んでいることを考えると、データ収集やプラットフォームは日本で一つでも構わないので、国として集約し、ウェットで実験・研究する方々にダイバーシティを持っていただくのがよいのではないだろうか。


 折しも5月22日には、内閣官房「創薬力の向上により国民に最新の医薬品を迅速に届けるための構想会議」の「中間とりまとめ(案)」が公開された。その中で、「我が国の医薬品産業の国際競争力低下を指摘する意見や新たなドラッグ・ラグ/ドラッグ・ロス問題が提起されている」なか、戦略目標で目指すべき事柄として、「(希少疾病を含め)治療法を求める全ての患者の期待に応えて医薬品を速やかに届けること」「我が国が世界に肩を並べる創薬の地となること」「研究開発の活性化が成果を生み、次世代の投資に繋がる、投資とイノベーションの循環的発展が継続出来る社会システム」を挙げている。「創薬エコシステムの構築は長期戦」には違いないが、奥野氏が講演冒頭で指摘した“緊急事態の勃発から1年でようやくドキュメント”の轍を踏まぬよう、早期の具体化を望みたい。「一つのAI技術では創薬を変革できない」とはいえ、日本は“統合力”で勝負できるのか。一企業に過ぎないGoogle DeepMindがAF2の公開後、早々にEMBL-EBIと協働でタンパク質構造データベースを充実させたスピード感は、やはり脅威である。


【本文中のAI創薬関連用語一覧】

(1)技術・手法

機械学習(machine learning):膨大なデータをもとに、コンピュータが自動的にルールやパターンを学習する技術。機械学習の一手法である強化学習(reinforcement learning)は、与えられたデータを手掛かりに試行錯誤しながら報酬を最大化する行動を学習することで、正解を与えなくても複雑なタスクを自己学習でこなせるようになる。

 

深層学習(deep learning): 人間の脳神経回路を模したニューラルネットワークを多層的にすることで、コンピュータ自らがデータに含まれる潜在的な特徴をとらえ、より正確で効率的な判断を実現する技術。

 

連合学習(federated learning):複数の組織等(クライアント)が所有し分散している生のデータセットではなく、各クライアントが学習したAI(機械学習)モデルを中央サーバーに送ることによって、横断的に学習させる技術。

 

拡散モデル(diffusion model):データの拡散過程(ノイズが付与されて破壊される過程)を利用したAI技術。対象となるコンテンツ(画像、テキスト、音声等)にノイズを加えて段階的に劣化させた後、劣化の過程を遡るようにノイズを除いて段階的に再構築させていく過程を繰り返し学習させることで、従来法より高品質な画像を生成する。


トランスフォーマー(Transformer):Googleが2017年に公開した機械学習技術。ある単語と、その周囲の文中すべての単語との関係の強さを効果的に学習できる自己注意機構(Attention)という仕組みによって学習の効率を上げ、文章の離れた位置にある単語同士の関係をつかむことを得意とする。

 

エボフォーマー(Evoformer): AF2以降、前処理(embedding)の後、構造予測の前段階として、MSA(multiple sequence alignment、アミノ酸の入力配列と似た多数の配列をデータベースから探索し、対応する残基が並ぶように配列させたデータ)および、pair representation(残基間の相対的な位置関係の記録)の特徴を抽出し、情報交換させるモジュール。


マルチモーダルAI(multimodal AI):テキスト、音声、画像、動画、センサ情報など2つ以上の異なるモダリティ(データの種類)から情報を収集し、統合して処理するAI。


(2)AlphaFoldで提示される指標

pLDDT(predicted local-distance difference test):AFにおける、原子ごとの信頼度推定値。値が大きいほど信頼度が高い。構造の画像にも色分けで示される。


PAE(predicted aligned error): AFで予測された構造内の2つのトークン(処理単位)間の相対的な位置と方向の誤差の推定値。値が大きいほど予測誤差が大きい。


pTM(predicted template modeling)とipTM(interface predicted template modeling):いずれもTMスコアと呼ばれる尺度から導かれる、予測された立体構造の精度に関わる指標。pTMは複合体の全体的な予測折り畳みの精度を示す推定値で、pTM>0.5は真の構造に類似している可能性があるとされる。ipTMは複合体のサブユニットの予測された相対位置の精度を示す予測値で、ipTM>0.8は予測品質が高いとされる。

 

(3)その他

汎用人工知能(AGI, artificial general intelligence):人間のように汎用的な知能処理が可能で、さまざまなタスクや課題を理解し、解決するための行動をとるAI。自己学習を繰り返しながら成長していくとされる。AI研究者の究極の目標でもある。


HTS(high-throughput screening)技術:膨大な数の化合物から、自動化されたロボットなどを用いて有用な活性を持つ化合物を高効率で選別する技術。


ドメイン知識(domain knowledge):デジタルプロダクト開発において、そのプロダクトが対象とする事業・業務領域に特化した知見や情報のこと。


アーキテクチャ(architecture):コンピュータシステム設計上の基本的な考え方。例えば、収集したデータをどこに集め、アプリケーションやアルゴリズムをどう使うか、データセンターの要件、分析・判断手法、管理方法などをアーキテクチャに落とし込む。

 

CASP(Critical Assessment of Structure Prediction):米国国立総合医科学研究所(NIGMS)が、1994年から隔年で行っているタンパク質立体構造予測技術に関する国際コンテスト。2022年からはRNA、リガンドを含む高分子複合体も対象になった。

 

欧州分子生物学研究所-欧州バイオインフォマティティクス研究所(EMBL-EBI, European Molecular Biology Laboratory- European Bioinformatics Institute):EMBLは、欧州19ヵ国の出資により1974年に創設された分子生物学の研究所(本部:独ハイデルベルク)。EBIはその一部門で英国ケンブリッジ近郊にあり、DNA配列、タンパク質配列、高分子構造、医薬品・医薬品候補化合物などの生物活性低分子のデータベースを提供している。


2024年5月24日時点の情報に基づき作成

・・・・・・・・・・・・・・・・・・・・・・・・・・・・

本島玲子(もとじまれいこ)

「自分の常識は他人の非常識(かもしれない)」を肝に銘じ、ムズカシイ専門分野の内容を整理して伝えることを旨とする。

医学・医療ライター、編集者。薬剤師、管理栄養士、臨床検査技師。