エッジAIとは?
エッジAIとは?
2025/01/22
エッジAI
とは?
―“機器内のAI”の実現を支える半導体技術―
科学の目でみる、
社会が注目する本当の理由
エッジAIとは?
エッジAIとは、例えば私たちが毎日使用するスマホなどの身近な電子機器を、人工知能(AI)のソフトウェア の実行に活用することです。ChatGPTなどのAIがクラウド上で実行されるのに対して、インターネットの“逆側の端(エッジ)”にある装置を使うので、こう呼ばれています。スマホやパソコンに続き、今後は自動車や家電、工場などで使用される幅広い機器に広がって、動作の自動化や安全性の確保などに活用されていくことが予想されています。その実現のカギの一つとなるのが、電力効率や性能を高める専用半導体の開発です。
エッジAIが身の回りの多彩な製品で活用されることにより、AIは近い将来、もっと身近で便利な存在になりそうです。スマホの音声アシスタントが格段に賢くなり、高度な自動運転が実現したり、器用で便利な家事ロボットが登場したり、インテリジェントなカメラが無数に連携することで、盤石な防犯ネットワークができたりするかもしれません。そんな未来をもたらしてくれるエッジAIの特徴と必要となる技術を、先端半導体研究センター 集積回路設計研究チームで研究チーム長を務める日置雅和に聞きました。
エッジAIとは?
エッジAIは、インターネットでつながったクラウドと通信せず、近くにある装置だけでAIの動作が完結します。「ChatGPT」など、クラウド上で動くAIの場合は、ユーザーの質問をクラウドに送って返事が返ってくるまでに、どうしても遅れが生じます。エッジAIにはこの遅れがないので、高速な応答が可能です。例えば、自動運転車が前方に障害物を見つけた時に、カメラのデータをクラウドに送っていてはブレーキが間に合いません。エッジAIならば、自動車に組み込まれた操縦用のAIが即座に判断するので、素早く安全に運転してくれるのです。
また、クラウドにデータを送る必要がないので、ユーザーのプライバシーも守れます。スマホに健康管理用のエッジAIが入っていれば、誰にもデータを見られずに健康状態を見張ってくれます。工場のロボットにエッジAIを組み込んで不良品の選別を任せれば、新製品の秘密が他社に漏れる心配がありません。他にも、通信が不安定な場所でも使える、通信料金を節約できるなど、エッジAIには数々の利点があります。
エッジAIの「エッジ」とは、インターネットの端(エッジ)にある装置をAIの実行に使うという意味です。ネットの向こう側にあるクラウドと対比させた言葉で、ユーザーの近くにある機器であれば何でも構いません。家庭や職場にある電子機器はもちろん、街中の監視カメラ、店舗の設備、工場の製造装置などもエッジAIの適用範囲です。また、エッジには「境界」という意味もあり、例えばスマホとクラウドの間にある携帯電話網の基地局や、家庭内のネットワークとインターネットをつなぐルーターも、エッジAIの対象です。
エッジAIのもとになった言葉として、「エッジコンピューティング」があります。エッジにある機器を使うのは同様ですが、AIの技術が今ほど発達していなかった時代の言葉なので、データ処理一般を表すコンピューティングという言葉を使っていました。エッジコンピューティングが前提とする、現実世界の多彩な機器がネットにつながる状況が進展し、AIの性能向上が並行して進んだ結果、エッジAIという言葉が生まれました。
エッジAIの実用化に向けて
エッジAIの実用化はすでに始まっています。2024年5月にマイクロソフトが発表した新ジャンルのパソコン「Copilot+ PC」、またグーグルの「Pixel 9」、アップルの「iPhone 16」といった2024年発売の最新スマホは、エッジAIの初期の例といえそうです。これらはAIを実行する専用の半導体を搭載し、AIによる文書や画像の各種処理を端末上で実行できます。
エッジAIの実行に使う半導体は、NPU(Neural Processing Unit)などと呼ばれます。実はスマホには、数年前からNPUが搭載されてきました。当初は性能が限られていましたが、時間とともに能力が高まり、スマホ上のAIでできることが次第に増えています。現状では「ChatGPT」のような高度なAIをエッジ側のスマホでスムーズに実行することは難しいものの、半導体などの技術進歩によって、いずれは可能になるでしょう。
業務用の装置にも、エッジAIが入り込みつつあります。各種セキュリティや交通管理、製造ラインでの製品チェックなどに、エッジAIを搭載した監視カメラが活用されています。業務用のエッジAIでも、NPUの性能向上が後押しして、異常検知や渋滞予測など、さまざまな機能が盛り込まれていきます。ただし、エッジAIを使った自動運転など、人の安全性が重要な用途では慎重に有効性を確認する必要があるので、実用化はしばらく先になりそうです。
さらに将来的には、個別に動作していたエッジAI同士が連携し始める見込みです。例えば交差点に設置されたエッジAI搭載カメラがひき逃げを検出したら、事故を起こした自動車が向かう方向にあるカメラに連絡して追跡するといった具合です。その延長線上には、多くの自動運転車、交差点のカメラや信号のエッジAI、さらにはクラウド上のAIが互いに連携して、渋滞知らずの交通管理システムが実現するかもしれません。
エッジAIは、いわば人の代わりにさまざまな作業を肩代わりしてくれる存在といえます。現在は人同士の交渉や、やり取りを必要とする多種多様な行為が、将来エッジAIによって自動化されても不思議ではありません。
エッジAIの技術的な課題
エッジAIにNPUのような専用の半導体が必要な理由は、AIのソフトウェアを通常の計算に使うCPU(Central Processing Unit)で実行すると効率が悪いことです。現在主流の、いわゆるディープラーニングに基づくAIの実体は、単純な計算を膨大に組み合わせた巨大な数式と見ることができます。極めて大量のパラメータを持つ数式なのですが、部分を小分けにして並列に実行することで効率的に計算できます。ところが通常のCPUは、こうした並列処理に向いていないのです。
しかも、スマホなどのエッジ側にある機器は、利用できる電力に限りがあります。そこでAIの処理に最適化した半導体を設計して、少ない電力の範囲内で、実行速度を最大限高める仕組みが必要になります。その結果生まれたのが、NPUです。なお、AIの処理には画像処理用のGPU(Graphics Processing Unit)を使うこともありますが、NPUはGPUよりもさらにAI向けに改良された回路を使っています。
エッジAIの性能を引き上げ、用途を大きく広げていくためには、NPUの性能を改善し続けることが大切です。これまでにも、具体的な技術が多数開発されています。例えば、計算に使う数字をデジタル化するときの精度を落とす量子化という方法です。クラウド側では32ビットや16ビットなどのきめ細かい表現を使うのに対して、エッジ側では半分以下の8ビットや、極端な場合は1ビットまで減らしてしまう提案があります。ビット数を減らすほどNPUの電力が減り、速度が高まるからです。このほか最近では、AIを構成する無数のパラメータを記憶させたメモリに計算機能も持たせる方法(CiM、Compute in Memory)といった斬新な手法も現れ始めました。
どの技術を使う場合でも、NPUの設計では、サービスやソフトウェアの開発者との連携が非常に重要です。そもそもクラウドで実行するAIは、時にはパラメータの数が1兆を超えるなど極めて規模が大きく、そのままではエッジ側で実行できません。大規模なAIのどこまでが必要か、精度をどこまで下げても大丈夫かなど、用途によって許容できる条件は変わります。ソフトウェア側で、AIの規模や精度をどの程度にするかが決まらないと、それに適したNPUは設計できません。NPUは、ある程度の汎用性を持ちますが、それでも対象とする用途の範囲はありますし、そこに向けて最適化していくべきなのです。
ちなみにNPUは、独立した半導体チップではなく、1つのチップであるSoC(System on a Chip)の回路の一つとして組み込むことが普通です。SoCとは、CPUに加えて、データを一時的に保存するメモリや、GPUなどの多数の機能を一つのチップに統合した半導体のことです。スマホやパソコンといったエッジ側にある様々な機器が、それぞれに適したSoCを利用しています。
エッジAIの性能向上に向けた研究開発の取り組み
産総研では、NPUの高度化を促す研究や事業を手がけています。その一つは、独自のアイデアを盛り込んだ高速処理技術の開発です。例えば、AIの処理に必要な多数の掛け算をそのつど実行する代わりに、あらかじめ実行した掛け算の結果をメモリに保存しておき、それを読み出すだけで済むチップを開発*1しました。掛け算の処理をデータの読み出しに置き換えることで、大幅な高速化が見込めるというわけです。
この研究では、設計した回路をFPGA(Field Programmable Gate Array)に実装して実際の動作を確認済です。FPGAとは、新たに設計した回路を個別の部品を使って一から組み上げる代わりに、あたかもソフトウェアを書き込むかのように、簡単に半導体上で再現できる技術です。FPGAのままでは回路に冗長性があるため、必ずしも電力を減らせませんが、FPGAで有効性を確認してから回路の効率化を進めることで、高性能・省電力のNPUの実現につながります。
もう一つの取り組みは、小規模なスタートアップなど、資金や人材に限りがある企業を対象にした設計の支援です。東京大学と連携した「AIチップ設計拠点(AIDC、AI chip Design Center)」の本格運用を、2023年3月に開始しました(2023/3/17プレスリリース)。設計(EDA、Electronic Design Automation)ツールやハードウェアシミュレータなど、半導体設計に不可欠な各種環境を提供しています。すでに、この拠点を利用して開発したチップの事例がいくつも生まれています。
かつて世界ナンバーワンだった日本の半導体産業は、今では米国や台湾・韓国などの企業に大きく後れをとってしまいました。半導体産業にかかわる世界情勢が日々大きく変化するなかで、日本政府はその重要性を鑑みて、世界最先端の半導体製造技術の実現を目指すラピダス社への支援など、産業強化に向けた政策を矢継ぎ早に打ち出しています。その一環として、ラピダス社や産総研などが参加する最先端半導体技術センター(LSTC)は、新エネルギー・産業技術総合開発機構(NEDO)からの委託を受けて、「2nm世代半導体技術によるエッジAIアクセラレータの開発」に取り組んでいます。
こうした活動を通じて産総研は、エッジAIの性能向上や普及促進はもちろん、日本の半導体産業の強化に貢献していきます。
*1: Fuketa, Hiroshi, et al. "Multiplication-Free Lookup-Based CNN Accelerator using Residual Vector Quantization and Its FPGA Implementation." IEEE Access (2024) [参照元へ戻る]