国立研究開発法人 産業技術総合研究所【理事長 石村 和彦】(以下「産総研」という)サイバーフィジカルセキュリティ研究センター【研究センター長 松本 勉】ソフトウェア品質保証研究チーム【研究チーム長 大岩 寛】と人工知能研究センター【研究センター長 辻井 潤一】は、民間企業・大学などの有識者と共同で、AIシステムの設計開発における品質マネジメントについて体系的にまとめた「機械学習品質マネジメントガイドライン」をサイバーフィジカルセキュリティ研究センターのウェブサイトで公開した。
URL:https://www.cpsec.aist.go.jp/achievements/aiqm/
ITシステムを安全、安心に管理するために品質マネジメントは必須であるが、機械学習を用いたAIシステムは開発者の明示的なプログラムによる指示によらず、訓練データを用いた学習による間接的な構築が行われるため、一般のソフトウエアと比較して品質マネジメントが格段に難しい。今回のガイドラインは、対象となるAIシステムのライフサイクル全体にわたる品質マネジメントを扱い、AIシステムのサービス提供で求められる品質要求を充足するための必要な取り組みや検査項目を体系的にまとめたものである。開発の当事者間で品質について意思疎通できるよう、ガイドラインはAIシステムの利用時に求められる品質要求を(1)リスク回避性、(2)AIパフォーマンス、(3)公平性という3つの外部品質軸として新たに整理し、それぞれの要求の強さに応じてレベル分けした。開発の当事者は機械学習の正確性やデータ設計の十分性など8つの内部品質を開発作業中などに確認して、外部品質の充足性を客観的に判断する構成となっている。AIシステムの開発者と利用者が、システムに求められる品質要件を合意でき、品質に関する不透明性を取り除いて、AIシステムのビジネス活用を加速させることが期待される。
機械学習品質マネジメントガイドライン
機械学習を用いたAIシステムは、プログラムによる開発者の直接の指示ではなく、訓練データを用いた学習によって間接的に機能を獲得する。そのため、開発成果物であるソフトウエアプログラムの文面などを確認しても、目的の機能や品質を達成したかどうかが検査できない。このことが、AIシステムの品質マネジメントを一般のソフトウエアに比べて格段に難しくしている。今後AIシステムが、自動運転やロボット制御など安全性の確認が不可欠な分野や、個人の融資などの信用管理など公平性が重要な分野など、さまざまな用途で価値を発揮するには、AIシステムを安心して利用できるための品質マネジメントが不可欠である。近年、内閣府『統合イノベーション戦略推進会議』で決定された「人間中心のAI社会原則」のほか、OECD、EUなど海外のさまざまな機関からも人工知能技術の社会受容性に関する提言がなされ、AIシステムの開発や利用ビジネスの当事者が対応を迫られている。また、AIシステムやAIコンポーネントが部品としてサプライチェーンの中で多様なシステムに組み込まれて活用されるためには、AIシステムの開発関係者の間で品質を定義し、合意できるための枠組みが欠かせない。
現状ではAIシステムの品質の定量的な評価基準がないため、受発注などのやり取りの場面においてシステム要件を確認するための意思疎通に時間がかかることが多くなっており、この面からも総合的な品質マネジメントの仕組みが求められている。しかし、AIシステムの品質の要件定義や、要件を満たすために確認すべきAIシステムの性質とその方法について、システムライフサイクル全般にわたって系統だって網羅的にとりまとめたものや規格などはまだ存在していない。AIシステムの開発や利用でビジネスを行う企業には、AIシステムの構築工程全般を通じた品質マネジメントやその達成を、社会へ説明することが求められるため、今回のようなガイドラインの策定が期待されている。
技術開発の側面では、AIシステムの性能評価技術が多く開発され、研究会議などで発表されているほか、
AI プロダクト品質保証コンソーシアムは「AI プロダクト品質保証ガイドライン」として、このような性能評価技術の適用方法や品質確保上の留意点などを応用事例ごとにまとめている。今回公開するガイドラインは、このような技術開発の成果も参考に、実際のAIシステムの開発現場が取り組むべきAI品質マネジメントの方向性を整理したものである。
今回のガイドラインは、国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)からの受託事業として2018年度から検討を開始し1、2020年度に移行した「人と共に進化する次世代人工知能に関する技術開発事業/実世界で信頼できるAIの評価・管理手法の確立/機械学習システムの品質評価指標・測定テストベッドの研究開発」で、産総研が企業・大学・国立研究機関などの有識者委員とともに構成した「機械学習品質マネジメント検討委員会」でとりまとめた。産総研が作成したドラフトをベースとして、検討委員会での2年間の議論やレビューを経て第一版のガイドラインを策定した。
1 2018年度~2019年度は「次世代人工知能・ロボット中核技術開発/グローバル研究開発分野/機械学習AIの品質保証に関する研究開発」事業で実施され、本ガイドラインはその成果である。
● ガイドラインの位置づけ
今回のガイドラインは、内閣府『統合イノベーション戦略推進会議』による「人間中心のAI社会原則」の下位に位置づけられ、AIシステムの品質評価の枠組みと方法論を提供する。ガイドラインはAIシステムと、その中に含まれる機械学習技術で実装されたソフトウエアコンポーネント(機械学習要素)の、品質に関する基準と達成目標を定める。ガイドラインを利用する企業などが、AIを利用する製品の品質を自ら測定し向上させ、AIの誤判断による事故や経済損失などを減少させる一助となることを目的としている。また、このようなアプローチにより、達成した品質の認識を開発当事者間で共有し、社会に対し品質を基準として示せるようにすることで、受発注などの条件の明確化や問題点の特定、高品質による付加価値の提示などを実現して、「優れたAIシステムを作る事業者がより高く評価される」健全なビジネス環境実現への寄与も目的としている。
● ガイドラインの概要
機械学習を利用したAIシステムにおける「品質」を、
- AIシステム利用時に必要な「利用時品質」
- AIシステム中で機械学習要素に要求される「外部品質」
- 機械学習要素そのものが持つ「内部品質」
の3つに分け、機械学習要素の「内部品質」の向上により「外部品質」を必要なレベルで達成し、最終的な製品の「利用時品質」を実現すると整理した(図1)。
本ガイドラインは検討委員会での分析と議論に基づき、「リスク回避性」「AIパフォーマンス」「公平性」の3つを、機械学習要素に特有の外部品質として特定した。AIシステムの利用時品質についても、この3つを基本として表現される。
一方で内部品質については、機械学習要素の構築プロセスや性能劣化原因の分析などを行い、(1)「要求分析の十分性」、(2)「データ設計の十分性」、(3)「データセットの被覆性」、(4)「データセットの均一性」、(5)「機械学習モデルの正確性」、(6)「機械学習モデルの安定性」、(7)「プログラムの健全性」、(8)「運用時品質の維持性」の8項目(図2)に整理した。これらの内部品質をプロセス管理や数値評価によって具体的に確認して、外部品質に求められる要件を達成する。
ガイドラインが求める品質マネジメントの対象は、機械学習要素の開発だけではなく、機械学習要素を組み込むAIシステムの品質要件定義、実証実験、システム開発、保守・運用までのシステムライフサイクル全体に及ぶ。それぞれのAIシステムの開発事情などに応じて、サービス提供者・システム開発者(SIベンダー・エンジニア)などのステークホルダーの間で役割分担を定め、これらの品質マネジメントの要求を満たしていくことが想定されている。また、開発作業の受発注・委託での合意形成や検収条件の設定などにも用いられることも想定している。
今回公開するガイドラインの第一版は、機械学習品質マネジメント検討委員会のAI実ビジネスに携わる企業委員との2年間に亘る議論と、2019年12月に、国立研究開発法人 科学技術振興機構(JST)・独立行政法人 情報処理推進機構(IPA)や大学の専門家と、プロダクト品質保証コンソーシアムの主要メンバーにより実施したレビューを経て策定されており、大枠の品質評価の枠組みを完成させ、企業での適用と評価に利用できる段階に達している。
なお、今回のガイドラインは、AIシステムを利用したシステム・サービスの開発を主導する企業などが、そのビジネスなどへの影響を踏まえて主体的にその採用の有無を選択し、共同開発者などとともに実践するものであって、法令・公的指針などとの関係では非拘束的なものである。
図1 品質実現の全体構造
図2 着目する内部品質特性
今後は、実ビジネスでの活用とそこからのフィードバックを元に、NEDOプロジェクト「人と共に進化する次世代人工知能に関する技術開発事業/実世界で信頼できるAIの評価・管理手法の確立/機械学習システムの品質評価指標・測定テストベッドの研究開発」において、定期的なガイドライン改訂と英文ガイドラインの作成、産業用途別の実アプリケーションを対象とする具体的適用事例としてのリファレンスガイドの作成、本ガイドラインを用いた評価作業を支援するソフトウエア開発基盤の構築、そして種々の評価技術の開発を予定している。また国内では、ステークホルダー間での品質マネジメントに広く用いられることによるデファクトスタンダード化を目指し、並行してISO/IEC JTC1/SC42 (Artificial Intelligence) などへの提案といった国際標準化活動を行う予定である。