国立研究開発法人産業技術総合研究所(注1)(以下、産総研)が運用するスーパーコンピュータシステム「AI橋渡しクラウド基盤」(以下、「ABCI」)の約半分の規模と、国立研究開発法人理化学研究所(注2)(以下、理研)と富士通株式会社(注3)(以下、富士通)が開発中のスーパーコンピュータ「富岳」の約10分の1の規模で計測した結果が、スーパーコンピュータ規模の処理を必要とする大規模機械学習処理のベンチマークであるMLPerf HPC(注4)において、それぞれ最高レベルの性能を達成し、上位を独占しました。
「ABCI」では約半分の規模を用い、深層学習に特化した演算装置で構成されたGPUタイプのスーパーコンピュータの中で最高記録となり、GPUタイプの他システムの性能と比較し20倍となる処理速度を達成しました。同様に、「富岳」では約10分の1の規模を用い、汎用的な演算装置で構成されたCPUタイプのスーパーコンピュータの中で最高記録となり、CPUタイプの他システムの性能と比較し14倍となる処理速度を達成しました。
今回の結果は、現在オンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際学会「SC20」において、11月18日付(日本時間11月19日)にMLPerf HPC v0.7として発表されました。
MLPerf HPCは宇宙論的パラメータを予測する「CosmoFlow」(注5)と異常気象現象を特定する「DeepCAM」(注6)という2本のベンチマークプログラムのそれぞれにおいて性能を競うものです。「CosmoFlow」については、「ABCI」の全体の約半分のシステム規模での計測(注7)において、今回登録した全システムの計測値で1位、「富岳」の全体の約10分の1のシステム規模での計測(注8)において2位となりました。GPUとCPUのそれぞれのタイプの他システムの性能値に対して、「ABCI」は20倍の性能、「富岳」は14倍の性能になります。「DeepCAM」についても、「ABCI」の約半分の規模を用いた計測は、今回登録した全システムの計測値で1位となりました。このように、「ABCI」と「富岳」が圧倒的大差をつけて上位を独占し、日本のスーパーコンピュータが機械学習の分野でも高い技術力を有することを示しました。
富士通、産総研、理研および、株式会社富士通研究所(注9)は、今回の計測にあたり開発した大規模機械学習処理を高速化するライブラリやAIフレームワークといったソフトウェアスタックを今後一般公開します。これにより、スーパーコンピュータでの大規模機械学習の活用が容易となり、シミュレーション結果の解析による異常気象の検出や宇宙物理学上の新たな発見への応用が期待できます。また、膨大な計算性能を必要とする汎用的な言語モデルの実現といった応用への広がりが期待できるなど、Society5.0実現のための中核プラットフォームとして社会的・科学的課題の解決に貢献します。
MLPerfは、2018年5月に、機械学習アプリケーションを実行するシステムの性能リストを作成することを目的に設立された機械学習ベンチマークCommunityです。これまで膨大な時間を要していた規模の機械学習計算をスーパーコンピュータを使って行った時の性能評価を行うため、MLPerfは新たな機械学習ベンチマークとしてMLPerf HPCを策定しました。世界各国のスーパーコンピュータで利用され、新たな業界標準として期待されています。
今回のMLPerf HPCはv0.7として、スーパーコンピュータを利用しなければならない大規模の機械学習性能を測定することを目的として、「CosmoFlow」と「DeepCAM」の2つの実アプリケーションで性能評価が実施されました。
すべての計測データは下記サイトにて公開されています。
関連リンク: https://mlperf.org/
記載されている製品名などの固有名詞は、各社の商標または登録商標です。