ジェネレーティブAIとは？

2022/10/26

ジェネレーティブAI

とは？

―「次世代のAI」に期待されていること―

科学の目でみる、
社会が注目する本当の理由

ジェネレーティブAIとは？

米国Gartner社が、2022年の「戦略的テクノロジーのトップ・トレンド」で注目すべきキーワードとして挙げたのが「ジェネレーティブAI」です。「コンテンツやモノについてデータから学習し、それを使用して創造的かつ現実的な、まったく新しいアウトプットを生み出す機械学習手法」と定義されています。ジェネレーティブAIをはじめ、これまでのAI技術では扱えなかった「AI未踏の領域」に踏み出した技術が、現在注目を集めています。

AIにとって、世界は二つに分かれます。大量のデータが「ある世界」と「ない世界」です。これまで、膨大な量のデータから特徴を抽出することや、大量の教師データから判断を学ばせることがAIにとっての学習でした。十分な量のデータが存在しない世界でも機能する「次世代のAI」の可能性について、人工知能研究センターの村川正宏副研究センター長に聞きました。

ジェネレーティブAIとは

ジェネレーティブAIとはなにか？

　Gartner社が2022年の「戦略的テクノロジーのトップ・トレンド」として発表したキーワード「ジェネレーティブAI」。ジェネレーティブAIとは、「コンテンツやモノについてデータから学習し、それを使用して創造的かつ現実的な、まったく新しいアウトプットを生み出す機械学習手法」と言われています。データ駆動型のAIが得意とする「データがたくさんある世界」だけで活躍する技術ではなく、少ない情報から新しいことを生み出せるなど、データが十分でない領域に踏み出す技術、という点で「次世代のAI技術」のひとつとして注目されています。

次世代のAIはこれまでと何が違うのか？

　従来の大量データを使って開発されたAIがやっていることは大量のデータから「特徴」を学んで「予測」すること。AIが特徴をつかむのに必要な大量の、十分な質のデータが存在することが性能の良いAIをつくる前提となっています。

　GAN（Generative Adversarial Network, 敵対的生成ネットワーク）に代表されるような画像や動画の合成や、GPT-3 （Generative Pre-trained Transformer 3）のような言語モデルを活用した文章の合成・生成は、インターネット上などにある大量の画像データやテキストデータを学習することで、性能を上げています。

　また、2021年頃から画像生成の分野において「革命」とも言えるような変化が起きています。DALL・E 2やImagen、Midjourneyなどの、言語で指示をすると指示にあった画像を生成するAIが次々と登場しました。一番注目されているのは、オープンソースとして2022年の夏に公開されたStable Diffusionです。まるで人間が多くの労力をかけて描いたかのような絵も、数十秒から数分で作成でき、いまSNS上ではAI生成画像が大量に投稿されています。このStable Diffusionが革命と呼ばれるのは、膨大なデータで学習したモデルを誰もが使える形で提供したことです。しかし、その学習にはまだ「膨大なデータ」が必須となっています。

　一方で、「ジェネレーティブAI」をはじめとして今研究の進んでいるAIが「次世代」といえる理由は別にあります。現実世界は、まだ全ての物事がデータ化されているわけではありません。大量の学習データが無い、または大量データを作るのにとてもコストがかかるためデータ取得が現実的でない場合が多くあります。さらに、これまでまったく人間が経験したことがない世界には、当然ながらデータはありません。データの少ない、あるいはデータが無い問題であっても、結果を出せる次世代のAIを実現させるための研究を進めています。

　その場合AIがやらなくてはいけないことは「予測」に加えて「探索」や「計画」すること。「考える」に近いことです。人間が日常的に行っている「見当をつける」「（答えに近づきそうな）手順を組み立てる」アプローチを組み合わせて結果をだすのが次世代のAIの役割です。

データが存在しない世界でAIを活用する

　AIにとってデータがない世界はたくさんあります。そもそも、人間が経験したことがない事象についてはデータがありません。例えば、100年に一度の確率で起こる気象現象や患者数の少ない疾患に関連するデータや、センサを設置することが困難な場所の計測など同じ条件で繰り返し測定することが難しいケースなどでは、従来のAIが「特徴を学んで予測する」のに十分な量のデータがありません。また、動物をつかった実験や、無限の組合せの中から新しい機能を持つ材料を探索する実験、現実の社会システムを使ったスマートシティの実証実験など、なかなかデータがとれなかったり、データを得るのに高いコストがかかったりするものも事実上データがない世界といえるでしょう。

　このようなデータの無い領域でもAI技術を応用していかなければならない、というのがAI研究者たちの感じている課題であり、現在さまざまなアプローチが試みられています。そのひとつが、「予測」することに加えて「探索・計画する」AIです。

　「次世代のAI」といえるAI技術を実現するには、大量データをもとにした過去の経験から判断できる最善手段を選択するだけではなく、人間が知識として知っている物理法則や経験則や似たような現象での過去のデータなどを総動員して、予測できるもののなかからより良いものや方法を見つけなければいけません。

　いまあるAIが、過去の大量データの中から一番近い答えを返してくれるツールだとすれば、次世代のAIはデータがない手探りの世界で一緒に考えてくれる、伴走できるパートナーになれる可能性があるでしょう。

次世代のAI研究の現在地

次世代のAIに求められる技術要素とは

技術要素として、次世代のAIを実現するために求められることは大きく3段階に分けられます。

　1. 実世界を計測する
　2. 計測した上で、モデル化する（AIが理解できる形に加工し取り込む）
　3. モデルをもとに、一番良い（と思われる）値に最適化／計画する

　現在、１については産業界にDXの波がきており、企業のさまざまな活動がデジタル化されて計測され、データが取られ始めています。データが取れるのであれば次はモデル化ですが、実際にはモデル化に十分なデータが確保できるとは限りません。そこで重要になるのが、データのみではなく人間の知識もモデルに加えて、未知のことに対しても大きく外さないモデルを作っていくことです。データがまったく無かったり少なかったりする世界で、物理や化学反応における既知の法則、シミュレーションで得られた情報など、これまでに人間が知っている「知識」を盛り込んだモデル化を行うことが大事になっていきます。

　モデル化できてようやく、最適化したり新たなものを見つけたり、計画したりするという段階に進めます。実は、「計画する」という技術については、まだ大規模な問題や複雑な制約がある問題ではほぼ実現できていないといえます。人間は、何かプロジェクトや目標を達成したいとき、簡単に中間地点の目標をたてるなどして段階を踏んだ計画を立てて物事を進められますが、機械にこれをさせるのは大変難しいのです。しかし、AI研究としてはこの部分に取り組んでいかなければいけないと強く認識しています。

次世代AIの具体例①――知識を取り入れて酵素を自動設計する

　酵素の設計とは、自然界にある酵素を改変して、より性能の高い酵素を創出するための研究です。ある酵素タンパク質の機能を高める研究例で説明します。

　タンパク質の中に変異させる箇所が複数あるとします。タンパク質を構成するアミノ酸は20種類あるので、5箇所で変異する場合の組み合わせは20種の5乗で320万通り存在します。このすべての変異パターンを実験のみで検証し、狙い通りの機能を持った酵素を見つけることは現実的には不可能です。そのため、どのような変異を加えたらよいのか、ある程度見当を付ける必要がありました。

　この事例では、まず技術要素の１つめ「実世界を計測する」ことが高コストで時間がかかるため、実験回数を減らしたいというニーズがありました。そこで、現実的な実験回数で得られる80種程度の変異体だけの実験結果から得られたデータを教師データとしました。このデータを用い、酵素のアミノ酸配列から触媒の活性と発現量が予測できるモデルを作ります。これが技術的要素の２つ目「モデル化」です。このときデータ量が少ないので、これまでに知られている既知の特徴を利用して予測精度を上げます。この上でAI技術のひとつであるベイズ最適化を用いて最適な変異方法の候補を複数探し出すのです。こうして得られた変異体候補の実験データを取得し、モデル化、最適化を繰り返すことで、高活性な変異体の組み合わせを見つけることができました。（産総研プレスリリース 2018/08/31、東北大学プレスリリース 2021/12/2）

　さらに、自然界には存在しない組み合わせの中に高い性能のタンパク質がある可能性を示すデータが示されていて、新しいタンパク質の開発手法として期待されています。

次世代AIの具体例②――花火大会の人流を計測しモデル化し最適化する

　withコロナ時代を迎え、人々の動きや動線、つまり人流の制御は日常的に重要度が増しました。しかし、そのために必要な人流解析もこれまでのAIでは扱いにくいテーマです。

　対象が大勢の人間であることから、経路の安全性や自分だけ長く待たされているのではないか…？といった個人が感じる不公平感にも配慮が必要です。なにより、移動経路や誘導員の配置などを細かく変えながら何度もデータを取って検討するのは非現実的です。

　例えば、年に一度の花火大会。終了後の駅まで移動は混雑し、過去には人が密集したことにより事故も起きていますが、誘導方法を変えれば人流を変えることができます。混雑を緩和して安全に移動時間を短縮できる新しい誘導方法の提案が求められていました。

　この研究の場合も、まずは技術要素の１つ「実世界を計測する」ために、カメラ画像やGPSを用いて少人数の人がどのような経路で移動したか、移動軌跡データを計測します。次は「モデル化」。人の流れをモデル化して、シミュレーションによる予測をします。この予測モデルと実測値が近づいてくるように、データ同化の手法を用いて最適なモデルを決定します。実際に測定できるデータの少なさを人の流れに対する人間の知識を組み込んで克服しているといえます。このAIモデルに基づき、花火大会の会場から駅までにある信号のタイミング制御、経路の誘導方向の最適解を探索させました。AI技術でなにかしらの解が出てきたからそれでよしとするのではなく、さらに今後はそれを実際の現場にどう提示していくのかなど現実社会にあったかたちにしていくことが重要と考えています。

花火大会会場からの帰宅動線制御のシミュレーション実験
（赤い点が会場から駅までの動線で混雑している箇所。計測データと信号などを制御するシミュレーション結果を組み合わせて最適な人流制御方法を探索する。）

次世代のAIで社会を変えられるか

　次世代のAI活用においては、人間が当たり前のように知っていることや人類がこれまでの歴史で積み上げてきた知識体系をどう組み込んでいくかがテーマの1つになります。

　人間が何気なく行っている「見当を付けて試してみる」は実はすごいことなのです。経験のない状況で数多くのパラメータを組み合わせる場合、人間は「より可能性の高そうなパターン」を選ぶ、いわゆる「見当を付ける」という思考をします。また、答えの方向性を出したり、遠い未来を予想したり、中間目標を立てたりすることもAIにとっては非常に高度な要求で、これから研究が進む分野となります。

　人間だけでは実現できないこと、AIだけでも実現できないこと。それを理解し、相互に活用する、人間とAIが協働できる社会が目指されるのではないかと考えています。

この記事へのリアクション

この記事をシェア