国立研究開発法人 産業技術総合研究所【理事長 石村 和彦】(以下「産総研」という)情報・人間工学領域【領域長 関口 智嗣】が、5月10日より一般提供を開始した大規模AIクラウド計算システム「ABCI 2.0」が、世界のスパコン性能ランキングTOP500 Listの12位を獲得しました。この結果は、オンラインで開催されたスーパーコンピューターに関する国際会議「ISC HIGH PERFORMANCE (ISC 2021)」において6月28日(中央ヨーロッパ時間)に発表されました。
従来システムである「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下「ABCI」という)」は、わが国の人工知能技術開発の加速を目的として、産総研が設計・開発を行った計算システムで、産総研 柏センターのAIデータセンター棟に導入され、2018年8月に運用を開始しました。2021年5月にはABCIのGPUより高性能で省電力の最新GPUが搭載された計算サーバー等の増強を行い、ABCI 2.0として一般提供を開始しました。ABCI 2.0は、高性能で省電力のGPUを5312基(うち960基が最新GPU)搭載しており、これらのGPUをフル活用することで、演算性能22.20ペタフロップスを記録し、TOP500 Listの世界12位で、実運用される計算システムとしては国内2位になりました。従来は19.88ペタフロップスで世界14位でした。またABCI 2.0は、高温になる演算処理装置などをAIデータセンター棟が供給する外気に近い温度の冷却水で冷却するなどの工夫により、参考記録ながらABCI 2.0で増強された計算サーバーのみを用いた計測では、1ワットあたり21.89ギガフロップスを記録し、Green500 Listの世界14位相当になりました。
高い計算能力や省電力性を活かして、先進的なAI研究開発・応用実証や国内のデータ保有企業によるABCIの活用の加速が期待されます。
2018年8月の運用開始以来、ABCIを活用した国内企業が、深層学習における世界一の計算速度を達成したことを始め、多くの機関の利用により、顕著な成果を挙げています。また、特徴的な省電力運用への高い関心を寄せられてきました。一方で、運用開始から2年余りを経て、想定を超える高い需要のため、利用を開始できるまでの待ち時間が長いなどの課題がありました。また、大規模なデータ処理が必要となる先進的なAI研究開発・応用実証には、さらに高い計算能力が求められています。
これらの課題に対し、ABCI 2.0では、ABCIのGPUより高性能で省電力の最新GPUが960基搭載された計算サーバー、およびストレージシステムの増強を行いました。
1) 高性能・省電力のGPUを5312基搭載
高性能で省電力のGPU「NVIDIA V100 SXM2」を4352基、最新GPU「NVIDIA A100 SXM4」を960基、計5312基搭載します。これにより、ABCI 2.0のピーク性能は、倍精度で56.6ペタフロップス、単精度で226.0ペタフロップス、半精度で851.5ペタフロップスとなります。
2) 世界トップクラスの省電力運用
サーバーと冷却システムの双方が世界トップクラスの省電力性能を持ちます。計算サーバーは、電力あたり性能が高い最新GPUを搭載しています。冷却システムは、高温になるCPU、GPU、メモリなどの基幹部品は直接水冷で、残熱は空冷で冷却します。AIデータセンター棟の冷却塔のみを使って作った冷水をこれらの冷却に一括して使用することで省電力を実現しています。このような工夫により、高性能でもより少ない電力消費になりました。
ABCI 2.0の計算資源の一覧は以下で公表されています。
ABCI計算資源: https://abci.ai/ja/about_abci/computing_resource.html
今後の予定
産総研は、今回優れた計算能力や省電力性が認められたABCI 2.0を用いて、産学官や多様な事業者による利用の促進と高い計算能力を生かした人工知能技術の研究開発・実証を加速し、社会実装を推進します。産総研では、容易に構築できる人工知能技術の開発を目指して、汎用性の高い大規模な機械学習モデルの構築とその利用技術の開発を進めており、ABCI 2.0はこうした技術開発にも生かしていきます。また、ビッグデータ活用のためのシステム連携技術や大規模データ解析技術の研究開発を行うとともに、運用から課題を洗い出し、次世代ABCI構築技術をはじめとするデジタルアーキテクチャのコア技術の高度化を図ります。
本件問い合わせ先
国立研究開発法人 産業技術総合研究所
情報・人間工学領域 デジタルアーキテクチャ研究センター
総括研究主幹 小川 宏高
〒135-0064 東京都江東区青海2-4-7 産業技術総合研究所 臨海副都心センター 別館
E-mail:abci-application-ml*aist.go.jp(*を@に変更して使用してください。)
用語の説明
- ◆TOP500 List
- スパコンのベンチマーク性能値を半年ごとに世界1位から500位までランキングしているリスト。
https://top500.org/lists/top500/ [参照元へ戻る]
- ◆GPU(Graphics Processing Unit)
- 本来はコンピューターグラフィックス専用のプロセッサーだったが、グラフィックス処理が複雑化するにつれて性能や汎用(はんよう)性が増し、現在では高性能計算向けの汎用ベクトル・行列演算プロセッサーに進化している。深層学習(ディープラーニング)の高速化にも広く用いられている。[参照元へ戻る]
- ◆ペタフロップス(Peta FLOPS)、ギガフロップス(Giga FLOPS)
- フロップス(FLOPS, Floating-point Operation Per Second)は1秒間に行える浮動小数点演算の回数。ペタは(10の15乗)、ギガは(10の9乗)を意味する。[参照元へ戻る]
- ◆Green500 List
- 近年のグリーン化の潮流を受け、TOP500 Listのスパコンの電力性能値(速度性能値 / 消費電力)を1位から500位までランキングしているリスト。
https://top500.org/lists/green500/ [参照元へ戻る]
- ◆倍精度、単精度、半精度
- 数値(実数)のコンピューター内での表現方法。倍精度は8バイト(有効桁数約16桁)、単精度は4バイト(有効桁数約7桁)、半精度は2バイト(有効桁数約3.3桁)で表現する。最新のGPUなどを用いると、半精度・単精度では倍精度よりも大幅に高速な演算処理が可能になるため、機械学習・AI分野において活用が進んでいる。[参照元へ戻る]
関連記事