発表・掲載日:2018/01/31

人工知能(AI)で触媒反応の収率を予測

-キャタリストインフォマティクスで触媒の発見に道-

ポイント

  • 使用する触媒構造の情報だけで触媒反応の収率を予測するAI技術を開発
  • 予測に大きく寄与するパラメーターを自動的・客観的に選別し、触媒活性の鍵となる化学構造を特定
  • 今後、キャタリストインフォマティクス(触媒化学と情報科学の融合)を活用した触媒の発見に期待


概要

 国立研究開発法人 産業技術総合研究所【理事長 中鉢 良治】(以下「産総研」という)触媒化学融合研究センター【研究センター長 佐藤 一彦】革新的酸化チーム 矢田 陽 研究員、同センター 佐藤 一彦 研究センター長、人工知能研究センター【研究センター長 辻井 潤一】機械学習研究チーム 永田 賢二 主任研究員、機能材料コンピュテーショナルデザイン研究センター【【研究センター長 浅井 美博】物性機能数理設計手法開発チーム 安藤 康伸 研究員らは、国立研究開発法人 新エネルギー・産業技術総合開発機構【理事長 古川 一夫】(以下「NEDO」という)のプロジェクトで、有機合成に用いられる触媒反応の収率を人工知能(AI)で予測する技術を開発した。

 近年、製品ライフサイクルの短縮化に伴って、従来よりも短期間で医薬品や電子材料などの機能性化学品の開発・製造を可能にする触媒の発見・開発が必要になってきた。従来の触媒開発では触媒の設計・合成や触媒活性の評価・検証を繰り返し行う必要があるため、開発期間が長く、多大な労力やコストが掛かるなどの課題があった。

 今回、この課題を解決するために、産総研が提唱するキャタリストインフォマティクスという概念に基づき、触媒構造データのみから触媒反応の収率を簡単に予測できるAIを構築した。具体的には、過酸化水素によるオレフィンのエポキシ化反応について、触媒構造から計算機シミュレーションで得た複数のパラメーターと、実際に触媒反応によって得られる実験収率を用いてAIを構築した。このAIを用いることで、使用する触媒構造データのみからエポキシ化反応の収率が予測できることをはじめて示した。今回の成果は、今後触媒開発期間を大幅に短縮させる触媒の自動発見を目指したAI技術への先鞭をつけるものである。

 なお、この成果の詳細は、平成 30 年 1 月31日 (日本時間)に日本化学会が発行する学術誌のChemistry Lettersに掲載される。(DOI: 10.1246/cl.171130)

人工知能によって触媒反応の収率を予測の図
人工知能によって触媒反応の収率を予測


開発の社会的背景

 触媒は、特定の化学反応を促進することで、触媒が無いと進行しない反応を進行させたり、生成物の選択性を上げたり、短期間で生成物を得たりすることができる。このように触媒を用いる技術は、化学物質の合成を担う重要な基盤技術である。現在の化学産業では、基礎化学品や、医薬品、香料、電子材料などの機能性化学品などさまざまな物質の合成において触媒が使用される。

 近年、製品ライフサイクルの短縮化に伴って、機能性化学品などの新しい素材を、従来よりも短期間で効率的に開発・製造することへの要求が高まっている。また、化学品製造プロセスでは、高い生産性や低コスト、省エネルギー、省資源、低環境負荷なども重要である。このような製造プロセスに対して最も反応成績の良い触媒を、正確に、素早く見つけ出すことが強く望まれている。

 従来の触媒開発では、まず論文や特許などの先行事例を参考にその周辺技術の調査を行って触媒を設計する。次に、それを実際に試作して、触媒反応の実験による反応成績を確認して、その反応成績をフィードバックして再度触媒を設計する。このサイクルを繰り返し、実験方針を練り直しながら少しずつ反応成績の高い触媒を徐々に開発していく、という手法しか存在しなかった(図1)。そのため、触媒開発は、長い開発期間と多大な研究費や労力が必要であり、非効率的なものであった。近年、計算機の性能向上に伴って、計算科学を活用して触媒反応機構や触媒反応中間体を解析できるようになり、触媒設計がより容易になった。しかし、その進歩は依然として遅く、触媒設計・開発を一層加速させる新たな手法が必要であった。

研究の経緯

 産総研は、電子材料などの機能性化学品の開発・製造を加速する新しい触媒の開発研究を行っている。その一環として、触媒化学と情報科学を融合させるキャタリストインフォマティクスという概念のもと、機能性化学品などの製造に必要な有機合成反応の触媒の活性をAIによって予測する技術の開発に取り組んでいる。今回、電子材料や樹脂などの原料となるエポキシ化合物を、過酸化水素を使ってオレフィンからハロゲンフリーで製造する触媒反応をターゲット反応に設定し、触媒活性、すなわち触媒反応の収率を、AIによって予測する技術の開発に取り組んだ。

 なお、この研究開発は、NEDOの委託事業「超先端材料超高速開発基盤技術プロジェクト(平成28~33年度)(プロジェクトリーダー:村山 宣光)」による支援を受けて行ったものである。

触媒開発の現状と今回の開発した技術の図
図1 触媒開発の現状と今回の開発した技術

研究の内容

 AIにより触媒反応の収率を予測するために、まず触媒分子の構造や特徴を計算機シミュレーションによって数値化したパラメーターを用意した。次に、触媒分子のパラメーターとその触媒による反応の実験収率とを相関づけて機械学習させた。このAIに、触媒反応の収率を予測したい触媒分子を数値化したパラメーターを入力すると、収率を予測することができる。今回、電子材料や樹脂などの原料となるエポキシ化合物の合成反応として有用で、従来から産総研で開発を進めてきたハロゲンフリーエポキシ化反応をモデル反応として機械学習させ、触媒反応の収率をAIによって予測できることを検証した(図2)。

モデルとしたエポキシ化反応図
図2 モデルとしたエポキシ化反応

 この反応は、タングステン酸塩とアンモニウム塩とホスホン酸の3つの化合物を混合した触媒(三元系触媒)によって進行する。3つの化合物のさまざまな組み合わせについて検討した実験データのうち、各種ホスホン酸分子を用いた実験データに着目した。14種類のホスホン酸分子について、計算機シミュレーションによって数値化した原子の電荷や赤外吸収波数など30個のパラメーターを用意した。それらとホスホン酸分子を三元系触媒の1成分とした実際のエポキシ化反応の実験収率とを相関づけて機械学習させ、AIを構築した(図3)。今回開発した技術によって、予測に大きく寄与するパラメーターを自動的・客観的に選別できた。これは、世界に先駆けて開発した成果である。今回のエポキシ化反応では、30個のパラメーターのうち11個が予測に大きく寄与するパラメーターとして選別された。また、選別されたパラメーターの予測への寄与の大きさを比較して、触媒活性の鍵となる触媒分子の化学構造や特徴を特定できた。今回の反応では、ホスホン酸のリン—酸素二重結合による赤外吸収の強度が最も重要であることが特定できた。

実験データを機械学習させて人工知能を構築の図
図3 実験データを機械学習させて人工知能を構築

 構築したAIに、これまでに反応成績が知られていない、いわゆる触媒活性を予測したい8種類のホスホン酸分子について、計算機シミュレーションによって数値化したパラメーターを入力すると、予測収率が得られた。予測に用いたホスホン酸分子を実際に三元系触媒の1成分として用いてエポキシ化反応実験を行い、エポキシ化合物の実験収率を評価し、実験収率と予測収率を比較した(図4)。これは、収率の予測に寄与するパラメーターを自動的・客観的に選別して構築したAIで、収率が予測できることをはじめて示した研究成果である。現在のところ、平均平方二乗誤差は26%であるが、今後開発が進むことで精度の向上が期待される。

AIによる収率の予測の図
図4 AIによる収率の予測

 今回開発した技術は、触媒の自動発見を目指したAI技術への先鞭をつけるものである。今後、触媒開発期間が大幅に短縮され、機能性化学品の開発・製造の高速化に貢献することが期待される。

今後の予定

 今後は、計算機シミュレーションによって触媒反応中間体を数値化したパラメーターを使ってAIを構築し、予測精度の向上を目指す。また、原料物質の構造や反応温度、反応時間、触媒の量など、さまざまな条件での実験データを取り入れてAIを構築し、触媒活性や最適な反応条件を予測する技術を開発する予定である。



用語の説明

◆キャタリストインフォマティクス
産総研が提唱している触媒化学と情報科学を融合させた学際領域。近年、さまざまな分野と情報科学の融合研究が推進されており、例としてバイオインフォマティクス(生命科学と情報科学)、ケモインフォマティクス(化学と情報科学)、マテリアルズインフォマティクス(材料科学と情報科学)などが挙げられる。[参照元へ戻る]
◆収率
理論上得ることができる物質の最大量(理論収量)に対する実際に得られた物質の量(収量)の比率のこと。[参照元へ戻る]
◆エポキシ化反応、エポキシ化合物
炭素—炭素二重結合から、炭素2個と酸素1個からなる三角形型の構造へと変換する酸化反応。得られた生成物はエポキシ化合物と呼ばれ、各種電子材料の原料として幅広く使用されている。[参照元へ戻る]
◆触媒反応中間体
触媒反応は、触媒が関与する多段階の過程を経て進行する。その各段階で生じる物質が触媒反応中間体である。例えば第一段階では、触媒と反応物が結合を形成した触媒反応中間体が生じる。[参照元へ戻る]
◆ハロゲンフリー
ハロゲンは周期表で第17族に属する元素。フッ素、塩素、臭素、ヨウ素、アスタチンの5種類を指す。また、これら5種類の原子を製品中に一定の濃度以下しか含まないこと(明確な基準はないが、高純度品の場合、おおむね数十ppm以下が推奨される)をハロゲンフリーという。特に塩素が混入すると機能性材料の劣化が早まる(絶縁性能が落ちる、腐食が早まる、など)ため、ハロゲンフリーの材料の開発が盛んである。[参照元へ戻る]
◆機械学習
コンピューターが入力データと出力データから知識やルールを自動的に発見できるようにする技術。今回開発した技術では、ホスホン酸分子の計算機シミュレーション結果を入力、エポキシ化反応の実験収率を出力とし、入力と出力の関係を表す関数を自動で作成している。[参照元へ戻る]
◆三元系触媒
機能の異なる3種類の化合物を組み合わせた触媒。今回モデル反応としたエポキシ化反応では、タングステン酸塩は直接的に過酸化水素によるエポキシ化の促進、アンモニウム塩は触媒の輸送、ホスホン酸はタングステン酸塩活性化のサポートという役割を担っていると考えられている。これらの3成分の割合を最適化しないとエポキシ化反応が進行しない。[参照元へ戻る]
◆赤外吸収波数
物質に赤外光を照射して分子の振動や回転に基づいて吸収された赤外光を測定して、化学構造や状態に関する情報を得る手法を赤外吸収分光法という。また、この時吸収された赤外光の波長(単位:μm)の逆数が赤外吸収波数(単位:cm–1)である。赤外吸収波数は計算機シミュレーションで簡単に求めることができる。[参照元へ戻る]
◆平均平方二乗誤差(Root Mean Squared Error
数値予測問題で用いられる精度評価指標の1つ。計算は以下の式で行われる。
平均平方二乗誤差(Root Mean Squared Error)説明図
ただし、nはデータの数、yi,predは予測収率、yi,expは実際の反応の結果得られた実験収率である。[参照元へ戻る]



お問い合わせ

お問い合わせフォーム