国立研究開発法人 産業技術総合研究所【理事長 中鉢 良治】(以下「産総研」という)情報・人間工学領域【領域長 関口 智嗣】は、平成30年8月1日より運用を開始した「AI橋渡しクラウド(AI Bridging Cloud Infrastructure、以下「ABCI」という)」の能力限界に挑戦するABCIグランドチャレンジを実施しています。10月に実施した第2回ABCIグランドチャレンジにおいて、ソニー株式会社(以下「ソニー」という)の研究グループが深層学習の学習速度の世界最速記録を大幅に更新したことが同社のプレスリリースにて11月13日に公表されました。また、世界のスパコンの省エネ性能ランキングGreen500 Listの4位、共役勾配法による処理性能ランキングHPCG Performance Listで5位を獲得しました。Green500 ListおよびHPCG Performance Listの結果は、米国テキサス州ダラス市で開かれたスパコンに関する国際会議「The International Conference for High Performance Computing, Networking, Storage, and Analysis (SC18)」において11月12日(アメリカ中部標準時間)に発表されました。
10月に実施したABCIグランドチャレンジでは、ソニーの研究グループがImageNetの画像分類データセットを利用したResNet-50の学習を、2176GPUを用いて約3.7分で完了し、これまで最速とされていた中国Tencent社が7月に記録した6.6分を大幅に短縮しました。また、ABCIグランドチャレンジと併せて実施したベンチマークの結果、1ワットあたり14.423ギガフロップスで、Green500 Listの世界4位になりました。また、6月にTop500 Listで世界5位を獲得したのに引き続き、HPCG Performance Listでも508.85テラフロップスで、世界5位になりました。
産総研は、今後もABCIグランドチャレンジを通じて、ABCIの高い計算能力により初めて可能になる人工知能分野の最重要課題への挑戦を支援します。
|
|
|
左:ABCI計算ノードラックの一部、中央:冷却システムの一部、右:AIデータセンター棟 |
ABCIは、経済産業省「人工知能に関するグローバル研究拠点整備事業」(平成28年度2次補正予算)の一環で整備された、高度な人工知能処理を可能にする大規模で省電力のクラウド型計算システムで、2018年8月1日に運用を開始しました。このシステムは、わが国の人工知能技術開発のためのオープンで先進的な高速計算基盤として、産学官連携や多様な事業者による利用を促進し、高い計算能力を活用した人工知能技術の研究開発・実証を加速し、社会実装を推進するとともに、人工知能分野の最重要課題への挑戦を目的としています。設計・開発は、産総研 人工知能研究センターと産総研・東工大 実社会ビッグデータ活用オープンイノベーションラボラトリ(AIST-Tokyo Tech Real World Big-Data Computation Open Innovation Laboratory; RWBC-OIL)が行い、産総研 柏センターのAIデータセンター棟に構築されました。ABCIは、高性能で省電力のGPUを4352基搭載するとともに、演算処理装置などを外気に近い温度の水で直接冷却することで、世界トップクラスの実運用される省電力クラウド型計算システムを実現しています。
ABCIを用いた人工知能分野の最重要課題への挑戦を促進するため、産総研はABCIグランドチャレンジという公募型プログラムを2018年度より実施しています。本プログラムでは、国内の大学、公的研究機関、民間企業に所属する者を対象に、ABCI上で最大1088ノード(4352GPU)を最長24時間使用して大規模処理を行う人工知能に関する挑戦的な課題を公募し、各回とも2課題程度を採択します。採択された課題についてはABCIグランドチャレンジ実施と小規模実行によるリハーサルを行う機会を無償で提供します。2018年度は計3回の公募を行う予定です。なお利用にあたっては、国立研究開発法人産業技術総合研究所共用高性能計算機ABCI利用約款に定められた事項を順守する必要があります。
第1回の公募では、国立大学法人 東京工業大学(以下「東工大」という)、ソニー、株式会社富士通研究所の3課題を採択し、運用開始前の7月に実施しました。第2回の公募では、東工大、ソニーの2課題を採択し、10月に実施しました。第1回、第2回の計5課題は、ImageNetの画像分類データセットを利用したResNet-50の学習を、ABCIが搭載する膨大な数のGPUを用いて精度を落とすことなく大規模並列で高速に実行するという共通の課題への挑戦でした。なお、Green500 ListおよびHPCG Performance Listのベンチマーク計測は、第2回のABCIグランドチャレンジと併せて実施しました。また、第3回の公募は、11月末に締め切られ、1月末に実施される予定です。
画像処理に適した深層学習においては学習の速度が重要になります。深層学習のアルゴリズムの性能評価の一つに、ImageNetの画像分類データセットを利用したResNet-50の学習速度を競う国際的なベンチマークがあります。大規模GPUを利用した分散深層学習では、バッチサイズが巨大になるため学習精度が低下し、またGPU間の通信オーバーヘッドがボトルネックとなって学習スピードも低下することが知られています。今回ソニーが開発した手法をABCIに適用することで、2176GPUを用いて約3.7分で完了し、これまで最速とされていた中国Tencent社が7月に記録した6.6分を抜いて、現時点で世界最速の深層学習処理が可能になりました。また、本チャレンジは、ABCIが提供するSingularityと呼ばれるコンテナミドルウェアを利用して実行しており、コンテナを用いた分散処理の実例としても世界最大級となります。
ABCIの利用者は、本チャレンジのベースとなったNeural Network Libraries (NNabla) のオープンソース版を自由に使うことができます。今回の成果の一部は以下で公表されています。
ImageNet/ResNet-50 Training in 224 Seconds [PDF:523KB]
また、ABCIは6月のGreen500 Listで世界8位になっていましたが、今回新たに1ワットあたり14.423ギガフロップスと電力あたりの性能に最適化した計測を行ったことで、前回のランキングを更新し4位にランクアップしました。
さらに、HPCG Performance Listにおいて508.85テラフロップスで世界5位を達成し、産業利用など実際のアプリケーションを実行する上での優位性を示すことができました。
今回、優れた性能や省電力性が認められたABCIは、2018年8月より本格運用を開始しています。本格運用では、学習済みモデルやオープンデータ、学習済みデータセットの提供を視野に入れたABCI利用サービスを構築します。ABCIを活用し、産学官連携や多様な事業者による利用を促進し、高い計算能力を活用した人工知能技術の研究開発・実証を加速し、社会実装を推進するとともに、人工知能分野の最重要課題への挑戦を支援します。また、ビッグデータ活用のためのシステム連携技術や大規模データ解析技術の研究開発を行うとともに、運用から課題を洗い出し、計算プラットフォーム構築技術の高度化研究につなげます。