SlideShare a Scribd company logo
1 of 27
©
All rights reserved. No reproduction without prior consent.
機械学習品質マネジメントプロジェクト
のご紹介
産業技術総合研究所
デジタルアーキテクチャ研究センター
副研究センター長・機械学習品質マネジメントプロジェクトリーダー
大岩 寛
Rev. 2.8.0 (2022-09-08)
1
©
All rights reserved. No reproduction without prior consent.
なぜ AI に品質が必要か?
• ソフトウェアによる複雑な制御に
人命を預ける時代
– 航空機・鉄道車両
– 自動車
– 消費者機械
– インフラ(電力等)
– 医療・ヘルスケア
×
• 機械学習AI等に依存するソフトウェア構築
– 人間でもルールを記述しきれない複雑な問題への対処
• 従来型ソフトウェアの構築手法にも限界
– 逐一変化する実世界への追従
2
©
All rights reserved. No reproduction without prior consent.
社会からみた AI への恐怖と要求
• 一方で、
AIの「得体の知れなさ」「社会的影響」への恐怖も顕在化
– 動作が説明できないブラックボックス的なシステム
– 「人が作ったものでない」
⇒ 規制や合意で制約を掛ける動きが起こる
– 社会原則・Principles レベル
– 法律・社会的ガイドライン レベル
– 技術ガイドライン・技術標準レベル
3
©
All rights reserved. No reproduction without prior consent.
社会からみた AI への恐怖と要求
• 2019年頃から: AIに対する社会からの要求の明文化の動き
• 人間中心のAI社会原則
(2019. 3 統合イノベーション戦略推進会議)
– 人間中心の原則
– 教育・リテラシーの原則
– プライバシー確保の原則
– セキュリティ確保の原則
– 公正競争確保の原則
– 公平性・説明責任及び透明性の
原則
– イノベーションの原則
• OECD Principles on AI
(2019. 5. 22)
– 全ての人への普遍的利益
– 公平性と公正性の確保
– 透明性の確保と責任ある開示
– 堅牢・セキュア・安全性と
リスクアセスメント
– 開発運用者の責任
©
All rights reserved. No reproduction without prior consent.
社会からみた AI への恐怖と要求
• 2020年代: 法律・ガイド層の取り組み
5
米国 欧州 日本
NIST
AIリスクマネジメント
フレームワーク作成開始
(2021.7)
欧州委員会
AI法案を公表
(2021.4.21)
経産省
AIガバナンス・
ガイドラインを発表
(2021.7.9)
米国政府調達要件に入ると
サプライチェーンに連なる
日本企業にも影響する恐れ
高リスクAI応用を特定
施行されると欧州市場向け
ビジネスで必須に
法的拘束力はないが、共通
認識形成を通じて、各社の
自主的取り組みを促進
©
All rights reserved. No reproduction without prior consent.
ビジネスから見た AI と品質
• 実世界の応用を阻む「品質の問題点」
1. 顧客に安心して買ってもらえない
– 一定品質を保証できないので、PoCから先に進めない
2. 誤動作時に責任を取れない/逃れられない
– 「無過失」を証明できないので、
想定外の結果に全責任を負う羽目になりかねない
3. 売買契約において不利になる
– 「想定内の瑕疵」と「当初想定を超えた機能拡張」が
区別できない ⇒ 延々とメンテナンスする羽目になる
– 安いデータでいい加減に作った手抜きのAIと、
きちんと慎重に作ったAIが区別できない ⇒ 競争に負ける
©
All rights reserved. No reproduction without prior consent.
機械学習ソフトウェアの特異性
• 機械学習AIはデータから統計的に構築
– リスク要因を学習させても、
常に正しく判断するとは限らない
– 学習結果の構造が判らないので、
検査をしても網羅性を確保できない
– 修正をすると、他の所に未知の影響が出る
→ 従来のソフトウェアのための品質管理技術をそのまま適用しても
十分な結果が保証されない = 既存の技術標準だけでは不足している
• 機械学習AIに適合した
新たな「品質の作り込み」の枠組みを検討・提案
7
©
All rights reserved. No reproduction without prior consent.
機械学習品質マネジメントガイドライン
機械学習AIの品質を「作り込み」「確認し」「説明する」
ためのガイドライン
• 主な想定読者:
– 機械学習を利用して作られる製品やサービスの提供者
– 実際に製品・サービスをソフトウェアとして
実装するシステム開発者
• 2次的な想定読者:
– サービス利用者:サービス選択する基準として
– 第三者評価機関:品質評価・認証の基準として
8
©
All rights reserved. No reproduction without prior consent.
ガイドラインの位置づけ
• 技術的な側面から
AIの社会適用を支える
ガイドライン
– 社会規範ガイドライン類の下位
• 「正しさ」の定義はしない
• 実現する為に何が必要かを整理
– IEC 61508 などに相当
• 汎用性を持ったガイドライン
• 業種特有の具体化は有り得る
• 「自社ガイドライン」を
各企業が作るベース
• どう実現するかには任意性がある
社会規範
人間中心のAI社会原則・
OECD Principle等
機械学習品質
マネジメント
ガイドライン
AIガバナンス
ガイドライン
業種別品質
ガイドライン
各企業の
開発方針
社会性要求
社会規範・
倫理性
工学・
品質・
工程管理
組織運営など
自動車・金融
工場・医療など
cf. IEC 61508
cf. ISO 26262 etc.
AI契約
ガイドライン
データ契約など
9
©
All rights reserved. No reproduction without prior consent.
機械学習品質マネジメントガイドライン:
検討体制
– 「機械学習品質マネジメント検討委員会」
• 産総研
• 民間企業10社以上
– 製品ベンダ・大手ITベンダ・中堅ITベンダー
• 国立情報学研究所・東京理科大学
• オブザーバ: IPA・NEDO・METI
– 2018年9月より開催
+ 週1回程度の詳細検討タスクフォース
10
©
All rights reserved. No reproduction without prior consent.
取り組みの狙い
① 社会全体でのAIの受容性向上・安全性向上
– 劣悪なAIの排除による利用者の安全性の向上
– 製造物責任の基準明確化による提供者のリスク軽減
② AI構築のサプライチェーンの健全性・競争力強化
– AIのサプライチェーン全体での品質管理
– 受発注基準の明確化によるビジネスの障壁除去
– 製品価値のメトリクス提供による日本産AIの競争力の明確化
⇒ 「安心を説明でき、納得して使えるAI」の実現を目指す
©
All rights reserved. No reproduction without prior consent.
AI品質管理と
サプライチェーンマネジメント
• AI 品質を軸にしたサプライチェーン構築支援
– 品質に関するベストプラクティス・社会合意の整理
– ステークホルダー間の健全な情報共有・役割分担の形成
利用者・
社会
製品
提供者
AI構築
ベンダ
データ
構築・
提供者
機械学習品質マネジメントガイドライン
AI品質についての
社会合意形成・
ベストプラクティス提示
製品品質からみた
受発注基準の明確化
データ構築の役割
・責任分担の明確化
©
All rights reserved. No reproduction without prior consent.
ガイドライン:発行実績
• 日本語第1版: 2020年6月公開
• 日本語第3版: 2022年8月公開
• 英語第2版: 2022年2月公開
• 英語第3版 準備中
https://www.digiarc.aist.go.jp/publication/aiqm/
©
All rights reserved. No reproduction without prior consent.
品質管理の対象と考え方
• 着目する「品質」
– 利用時品質
• サービス利用者にとっての品質
– 安心・公平など
– 外部品質
• システムに「求められる」性質
→ 目標を設定
– 内部品質
• システムが「持つ」性質
→ 達成を確認
それぞれ依存・実現の関係
15
©
All rights reserved. No reproduction without prior consent.
品質管理の対象と考え方
• 超基本的な流れ
– 利用者に提供すべき利用時品質を考える
– 製品の設計をして、
機械学習要素に必要な外部品質を考える
– 外部品質の品質レベルを決定する
– 外部品質レベルに対応した、
内部品質の要求事項をガイドラインで確認する
– それぞれの内部品質の達成を確認する
16
©
All rights reserved. No reproduction without prior consent.
ガイドラインの品質確保の構造
• 機械学習AIが「持つべき品質」の目標
① リスク回避性(安全性)
– 7レベルを設定
② AIパフォーマンス(トータル性能)
③ 公平性
④ プライバシー
– 各3レベルを設定
⑤ セキュリティ
• 品質を向上させるために押さえるべき
技術的ポイントを9項目に整理
• 左の品質レベルごとに
要求事項を設定
品質目標: 5特性 × レベル
(外部品質特性)
品質管理の9ポイント
(内部品質特性)
©
All rights reserved. No reproduction without prior consent.
内部品質9項目
A-1. 問題領域分析の十分性
A-2. 問題に対する被覆性
B-1. データセットの網羅性
B-2. データセットの均一性
B-3. データの妥当性
C-1. 機械学習モデルの正確性
C-2. 機械学習モデルの安定性
D-1. プログラムの信頼性
E-1. 運用時品質の維持性
©
All rights reserved. No reproduction without prior consent.
内部品質9項目
基本的な考え方
A) 問題の分析に基づく
あるべきデータセットの設計
B) 設計に合致する
良いデータセットの確保
C) 良いデータセットから得られる
良い機械学習モデル
D) 信頼できるソフトウェア
E) 品質を維持する運用
19
©
All rights reserved. No reproduction without prior consent.
システムライフサイクルプロセス
• 品質マネジメントの全体プロセスモデル
– 企画段階から運用・利用終了までの
総合的な品質マネジメントを想定して整理
– AI 特有のPoCプロセスや、繰り返し型の開発工程と、
品質管理を整合
20
©
All rights reserved. No reproduction without prior consent.
AI品質ガイドラインの社会展開
21
• 2022/8 日本語3版公開
• 2022/2 英語版2版
政府系での利用
• 経産省・消防庁・厚労省
プラント分野AI信頼性評価ガイドライン
• OECD・EU 協調などでの日本側材料に
産業展開
民間企業による利用
• ガイドライン適用サポート事業
• 自社AIへの適用
国際標準化
• ISO/IEC TR 最新ドラフトに貢献
AIシステムの品質評価支援
テストベッド
• 2020/11/18 公開
機械学習品質マネジメント
ガイドライン
©
All rights reserved. No reproduction without prior consent.
国際標準化: TR 5469
(Functional Safety and AI systems)
担当: ISO/IEC JTC 1/SC 42/WG 3
Editor: 日本
IEC側 (IEC 61508-3) チームと (事実上合同で) 検討
Scope:
機能を実現するための安全性機能内部でのAIの利用
AIで制御される機器の安全性担保のための非AI機能の利用
AIシステムを用いた安全性関連機能の設計と開発
AIQMガイドラインの内部品質の整理などをインプット
投票中
22
©
All rights reserved. No reproduction without prior consent.
プロジェクトの全体像
全産業共通の
ガイドライン
(品質目標の類別・レベル分け・測定指標)
事例毎の
リファレンス
事例毎の
リファレンス
事例毎の
リファレンス
具体化
共通要素の抽出
フィードバック
具体化
具体化
①要件の明確化と
エコシステム開発
⇒ 機械学習品質管理ガイドライン
⇒ 産業分野別リファレンスガイド
実際の製品開発プロセス
参照
利用 管理
機械学習品質管理テストベッド
②実際に品質を作り込む
道具立て
⇒品質管理テストベッド
⇒評価ツール
③ 具体的なAI評価技術の先端開発
対応
呼び出し 結果の集積管理
個別の品質評価技術
©
All rights reserved. No reproduction without prior consent.
品質評価テストベッドQunomon
• 高品質AIを実現するための品質評価環境
– 機械学習品質ガイドラインに沿ったテスト管理
– 豊富な品質テストパッケージと、柔軟な拡張性
– 品質評価レポートの自動生成
2020.11 公開・随時更新中
発見可能性 入手可能性 相互適合性 再利用性
オープンテストベッド
Qunomon
AIテスト技術の流通を促進
AIテスト技術開発者 AI品質評価者
AIテスト技術を登録 AIテスト技術を利用して
AI品質評価レポートを取得
https://aistairc.github.io/qunomon/
24
©
All rights reserved. No reproduction without prior consent.
応用別のリファレンスガイド
• ガイドラインを実際に製品に適用するために
「こうすればできる」を示す事例集
– 2022年3月に第1版を公開
• 民間企業の具体的事例を共有知に
– 民間企業から出向して頂き、産総研で研究
25
©
All rights reserved. No reproduction without prior consent.
応用別のリファレンスガイド
• 検討内容例
– データラベルの設計やラベル付けの精度・ツール支援
– コーナーケースの分析・モデルの安定性などの検証
26
©
All rights reserved. No reproduction without prior consent.
応用別のリファレンスガイド
• 品質アセスメントシート
– 製品全体の安全性管理と連結させるための
チェックシート
27
©
All rights reserved. No reproduction without prior consent.
まとめ
• 機械学習AIの品質ガイドライン
– 品質を「作り込み」「確認し」「説明する」
ためのガイドライン
– サービス提供者とシステム開発者の活用を想定
– サプライチェーンの確立と利用者・提供者双方の安心感の醸成
– 品質の基準や認証の基盤としての活用を期待
28

More Related Content

What's hot

【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究Satoshi Hara
 
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIPDeep Learning JP
 
【論文紹介】U-GAT-IT
【論文紹介】U-GAT-IT【論文紹介】U-GAT-IT
【論文紹介】U-GAT-ITmeownoisy
 
ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)cvpaper. challenge
 
物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDEGuoqingLiu9
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted WindowsDeep Learning JP
 
【DL輪読会】大量API・ツールの扱いに特化したLLM
【DL輪読会】大量API・ツールの扱いに特化したLLM【DL輪読会】大量API・ツールの扱いに特化したLLM
【DL輪読会】大量API・ツールの扱いに特化したLLMDeep Learning JP
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太Preferred Networks
 
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image TranslationDeep Learning JP
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法Tatsuya Shirakawa
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised LearningまとめDeep Learning JP
 
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3Preferred Networks
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性Satoshi Hara
 
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Yoshitaka Ushiku
 
AI勉強会用スライド
AI勉強会用スライドAI勉強会用スライド
AI勉強会用スライドharmonylab
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detectionharmonylab
 
時系列分析による異常検知入門
時系列分析による異常検知入門時系列分析による異常検知入門
時系列分析による異常検知入門Yohei Sato
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE広樹 本間
 

What's hot (20)

【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究【論文調査】XAI技術の効能を ユーザ実験で評価する研究
【論文調査】XAI技術の効能を ユーザ実験で評価する研究
 
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
[DL輪読会]Wav2CLIP: Learning Robust Audio Representations From CLIP
 
【論文紹介】U-GAT-IT
【論文紹介】U-GAT-IT【論文紹介】U-GAT-IT
【論文紹介】U-GAT-IT
 
ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)ECCV2020 Oral論文 完全読破(1/2)
ECCV2020 Oral論文 完全読破(1/2)
 
物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE物体検出エラーの分析ツール TIDE
物体検出エラーの分析ツール TIDE
 
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
[DL輪読会]Swin Transformer: Hierarchical Vision Transformer using Shifted Windows
 
【DL輪読会】大量API・ツールの扱いに特化したLLM
【DL輪読会】大量API・ツールの扱いに特化したLLM【DL輪読会】大量API・ツールの扱いに特化したLLM
【DL輪読会】大量API・ツールの扱いに特化したLLM
 
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
東北大学 先端技術の基礎と実践_深層学習による画像認識とデータの話_菊池悠太
 
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
[DL輪読会]Few-Shot Unsupervised Image-to-Image Translation
 
データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法データに内在する構造をみるための埋め込み手法
データに内在する構造をみるための埋め込み手法
 
【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ【DL輪読会】ViT + Self Supervised Learningまとめ
【DL輪読会】ViT + Self Supervised Learningまとめ
 
自然言語処理向け データアノテーションとそのユースケース
自然言語処理向け データアノテーションとそのユースケース自然言語処理向け データアノテーションとそのユースケース
自然言語処理向け データアノテーションとそのユースケース
 
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
Optunaを使ったHuman-in-the-loop最適化の紹介 - 2023/04/27 W&B 東京ミートアップ #3
 
“機械学習の説明”の信頼性
“機械学習の説明”の信頼性“機械学習の説明”の信頼性
“機械学習の説明”の信頼性
 
Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)Curriculum Learning (関東CV勉強会)
Curriculum Learning (関東CV勉強会)
 
BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装BlackBox モデルの説明性・解釈性技術の実装
BlackBox モデルの説明性・解釈性技術の実装
 
AI勉強会用スライド
AI勉強会用スライドAI勉強会用スライド
AI勉強会用スライド
 
Towards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly DetectionTowards Total Recall in Industrial Anomaly Detection
Towards Total Recall in Industrial Anomaly Detection
 
時系列分析による異常検知入門
時系列分析による異常検知入門時系列分析による異常検知入門
時系列分析による異常検知入門
 
2019年度チュートリアルBPE
2019年度チュートリアルBPE2019年度チュートリアルBPE
2019年度チュートリアルBPE
 

Similar to 機械学習品質マネジメントプロジェクトのご紹介

スマートデバイスSIの落とし穴と適した開発手法とは?
スマートデバイスSIの落とし穴と適した開発手法とは?スマートデバイスSIの落とし穴と適した開発手法とは?
スマートデバイスSIの落とし穴と適した開発手法とは?Takuya Kitamura
 
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan Yusuke Suzuki
 
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証Kuniharu(州晴) AKAHANE(赤羽根)
 
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」久仁朗 山本(旧姓 村上)
 
超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0正善 大島
 
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究harmonylab
 
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011なぜソフトウェアアーキテクトが必要なのか - デブサミ2011
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011Yusuke Suzuki
 
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション日本マイクロソフト株式会社
 
El slide chinzei
El slide chinzeiEl slide chinzei
El slide chinzeiRCCSRENKEI
 
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望についてKen Azuma
 
人工知能学会大会2020ーAI倫理とガバナンス
人工知能学会大会2020ーAI倫理とガバナンス人工知能学会大会2020ーAI倫理とガバナンス
人工知能学会大会2020ーAI倫理とガバナンスHiroshi Nakagawa
 
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリングMasanori Kaneko
 
チケットの利用による経験を活かした開発の可能性
チケットの利用による経験を活かした開発の可能性 チケットの利用による経験を活かした開発の可能性
チケットの利用による経験を活かした開発の可能性 Makoto SAKAI
 
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望についてKen Azuma
 
ソフトウェア工学2023 02 上流工程
ソフトウェア工学2023 02 上流工程ソフトウェア工学2023 02 上流工程
ソフトウェア工学2023 02 上流工程Toru Tamaki
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Hironori Washizaki
 
Base 20141011 1_for_slideshre
Base 20141011 1_for_slideshreBase 20141011 1_for_slideshre
Base 20141011 1_for_slideshre正善 大島
 
S qu bok特別講演2015年2月-開発領域
S qu bok特別講演2015年2月-開発領域S qu bok特別講演2015年2月-開発領域
S qu bok特別講演2015年2月-開発領域Hironori Washizaki
 
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」Hironori Washizaki
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方MLSE
 

Similar to 機械学習品質マネジメントプロジェクトのご紹介 (20)

スマートデバイスSIの落とし穴と適した開発手法とは?
スマートデバイスSIの落とし穴と適した開発手法とは?スマートデバイスSIの落とし穴と適した開発手法とは?
スマートデバイスSIの落とし穴と適した開発手法とは?
 
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan
アーキテクチャとアジャイルプロジェクトをまともに進めるための両輪について-DevLOVE関西 #DevKan
 
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証
「効率・品質・統制」の共通課題に着目した現場主導によるITS導入の効果検証
 
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」
「シン・テストエンジニアのキャリアについて~[序・破・急]の先に向けて~」
 
超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0超高速開発の基礎概念 20141119 0
超高速開発の基礎概念 20141119 0
 
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
ECサイトにおける商品紹介文の作成支援システムの開発と評価に関する研究
 
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011なぜソフトウェアアーキテクトが必要なのか - デブサミ2011
なぜソフトウェアアーキテクトが必要なのか - デブサミ2011
 
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
【de:code 2020】 Power Platform いまさら聞けないモデル駆動型アプリケーション
 
El slide chinzei
El slide chinzeiEl slide chinzei
El slide chinzei
 
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
 
人工知能学会大会2020ーAI倫理とガバナンス
人工知能学会大会2020ーAI倫理とガバナンス人工知能学会大会2020ーAI倫理とガバナンス
人工知能学会大会2020ーAI倫理とガバナンス
 
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
[3rd 長崎QDG] チームで、長期間で、たくさんのソフトウェアを快適に開発し、価値を生み続けるためのエンジニアリング
 
チケットの利用による経験を活かした開発の可能性
チケットの利用による経験を活かした開発の可能性 チケットの利用による経験を活かした開発の可能性
チケットの利用による経験を活かした開発の可能性
 
市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について市場動向並びに弊社製品の今後の展望について
市場動向並びに弊社製品の今後の展望について
 
ソフトウェア工学2023 02 上流工程
ソフトウェア工学2023 02 上流工程ソフトウェア工学2023 02 上流工程
ソフトウェア工学2023 02 上流工程
 
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善Qua s tom-メトリクスによるソフトウェアの品質把握と改善
Qua s tom-メトリクスによるソフトウェアの品質把握と改善
 
Base 20141011 1_for_slideshre
Base 20141011 1_for_slideshreBase 20141011 1_for_slideshre
Base 20141011 1_for_slideshre
 
S qu bok特別講演2015年2月-開発領域
S qu bok特別講演2015年2月-開発領域S qu bok特別講演2015年2月-開発領域
S qu bok特別講演2015年2月-開発領域
 
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」
SQuBOK特別講演2015年2月「SQuBOK V2設計開発領域について」
 
ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方ソフトウェア工学における問題提起と機械学習の新たなあり方
ソフトウェア工学における問題提起と機械学習の新たなあり方
 

Recently uploaded

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNetToru Tamaki
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)Hiroki Ichikura
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものですiPride Co., Ltd.
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdftaisei2219
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略Ryo Sasaki
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Danieldanielhu54
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムsugiuralab
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A surveyToru Tamaki
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Yuma Ohgami
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...Toru Tamaki
 

Recently uploaded (10)

論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet論文紹介:Automated Classification of Model Errors on ImageNet
論文紹介:Automated Classification of Model Errors on ImageNet
 
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
【早稲田AI研究会 講義資料】3DスキャンとTextTo3Dのツールを知ろう!(Vol.1)
 
SOPを理解する 2024/04/19 の勉強会で発表されたものです
SOPを理解する       2024/04/19 の勉強会で発表されたものですSOPを理解する       2024/04/19 の勉強会で発表されたものです
SOPを理解する 2024/04/19 の勉強会で発表されたものです
 
TSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdfTSAL operation mechanism and circuit diagram.pdf
TSAL operation mechanism and circuit diagram.pdf
 
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
[DevOpsDays Tokyo 2024] 〜デジタルとアナログのはざまに〜 スマートビルディング爆速開発を支える 自動化テスト戦略
 
Postman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By DanielPostman LT Fukuoka_Quick Prototype_By Daniel
Postman LT Fukuoka_Quick Prototype_By Daniel
 
スマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システムスマートフォンを用いた新生児あやし動作の教示システム
スマートフォンを用いた新生児あやし動作の教示システム
 
論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey論文紹介:Semantic segmentation using Vision Transformers: A survey
論文紹介:Semantic segmentation using Vision Transformers: A survey
 
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
Open Source UN-Conference 2024 Kawagoe - 独自OS「DaisyOS GB」の紹介
 
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
論文紹介:Content-Aware Token Sharing for Efficient Semantic Segmentation With Vis...
 

機械学習品質マネジメントプロジェクトのご紹介

  • 1. © All rights reserved. No reproduction without prior consent. 機械学習品質マネジメントプロジェクト のご紹介 産業技術総合研究所 デジタルアーキテクチャ研究センター 副研究センター長・機械学習品質マネジメントプロジェクトリーダー 大岩 寛 Rev. 2.8.0 (2022-09-08) 1
  • 2. © All rights reserved. No reproduction without prior consent. なぜ AI に品質が必要か? • ソフトウェアによる複雑な制御に 人命を預ける時代 – 航空機・鉄道車両 – 自動車 – 消費者機械 – インフラ(電力等) – 医療・ヘルスケア × • 機械学習AI等に依存するソフトウェア構築 – 人間でもルールを記述しきれない複雑な問題への対処 • 従来型ソフトウェアの構築手法にも限界 – 逐一変化する実世界への追従 2
  • 3. © All rights reserved. No reproduction without prior consent. 社会からみた AI への恐怖と要求 • 一方で、 AIの「得体の知れなさ」「社会的影響」への恐怖も顕在化 – 動作が説明できないブラックボックス的なシステム – 「人が作ったものでない」 ⇒ 規制や合意で制約を掛ける動きが起こる – 社会原則・Principles レベル – 法律・社会的ガイドライン レベル – 技術ガイドライン・技術標準レベル 3
  • 4. © All rights reserved. No reproduction without prior consent. 社会からみた AI への恐怖と要求 • 2019年頃から: AIに対する社会からの要求の明文化の動き • 人間中心のAI社会原則 (2019. 3 統合イノベーション戦略推進会議) – 人間中心の原則 – 教育・リテラシーの原則 – プライバシー確保の原則 – セキュリティ確保の原則 – 公正競争確保の原則 – 公平性・説明責任及び透明性の 原則 – イノベーションの原則 • OECD Principles on AI (2019. 5. 22) – 全ての人への普遍的利益 – 公平性と公正性の確保 – 透明性の確保と責任ある開示 – 堅牢・セキュア・安全性と リスクアセスメント – 開発運用者の責任
  • 5. © All rights reserved. No reproduction without prior consent. 社会からみた AI への恐怖と要求 • 2020年代: 法律・ガイド層の取り組み 5 米国 欧州 日本 NIST AIリスクマネジメント フレームワーク作成開始 (2021.7) 欧州委員会 AI法案を公表 (2021.4.21) 経産省 AIガバナンス・ ガイドラインを発表 (2021.7.9) 米国政府調達要件に入ると サプライチェーンに連なる 日本企業にも影響する恐れ 高リスクAI応用を特定 施行されると欧州市場向け ビジネスで必須に 法的拘束力はないが、共通 認識形成を通じて、各社の 自主的取り組みを促進
  • 6. © All rights reserved. No reproduction without prior consent. ビジネスから見た AI と品質 • 実世界の応用を阻む「品質の問題点」 1. 顧客に安心して買ってもらえない – 一定品質を保証できないので、PoCから先に進めない 2. 誤動作時に責任を取れない/逃れられない – 「無過失」を証明できないので、 想定外の結果に全責任を負う羽目になりかねない 3. 売買契約において不利になる – 「想定内の瑕疵」と「当初想定を超えた機能拡張」が 区別できない ⇒ 延々とメンテナンスする羽目になる – 安いデータでいい加減に作った手抜きのAIと、 きちんと慎重に作ったAIが区別できない ⇒ 競争に負ける
  • 7. © All rights reserved. No reproduction without prior consent. 機械学習ソフトウェアの特異性 • 機械学習AIはデータから統計的に構築 – リスク要因を学習させても、 常に正しく判断するとは限らない – 学習結果の構造が判らないので、 検査をしても網羅性を確保できない – 修正をすると、他の所に未知の影響が出る → 従来のソフトウェアのための品質管理技術をそのまま適用しても 十分な結果が保証されない = 既存の技術標準だけでは不足している • 機械学習AIに適合した 新たな「品質の作り込み」の枠組みを検討・提案 7
  • 8. © All rights reserved. No reproduction without prior consent. 機械学習品質マネジメントガイドライン 機械学習AIの品質を「作り込み」「確認し」「説明する」 ためのガイドライン • 主な想定読者: – 機械学習を利用して作られる製品やサービスの提供者 – 実際に製品・サービスをソフトウェアとして 実装するシステム開発者 • 2次的な想定読者: – サービス利用者:サービス選択する基準として – 第三者評価機関:品質評価・認証の基準として 8
  • 9. © All rights reserved. No reproduction without prior consent. ガイドラインの位置づけ • 技術的な側面から AIの社会適用を支える ガイドライン – 社会規範ガイドライン類の下位 • 「正しさ」の定義はしない • 実現する為に何が必要かを整理 – IEC 61508 などに相当 • 汎用性を持ったガイドライン • 業種特有の具体化は有り得る • 「自社ガイドライン」を 各企業が作るベース • どう実現するかには任意性がある 社会規範 人間中心のAI社会原則・ OECD Principle等 機械学習品質 マネジメント ガイドライン AIガバナンス ガイドライン 業種別品質 ガイドライン 各企業の 開発方針 社会性要求 社会規範・ 倫理性 工学・ 品質・ 工程管理 組織運営など 自動車・金融 工場・医療など cf. IEC 61508 cf. ISO 26262 etc. AI契約 ガイドライン データ契約など 9
  • 10. © All rights reserved. No reproduction without prior consent. 機械学習品質マネジメントガイドライン: 検討体制 – 「機械学習品質マネジメント検討委員会」 • 産総研 • 民間企業10社以上 – 製品ベンダ・大手ITベンダ・中堅ITベンダー • 国立情報学研究所・東京理科大学 • オブザーバ: IPA・NEDO・METI – 2018年9月より開催 + 週1回程度の詳細検討タスクフォース 10
  • 11. © All rights reserved. No reproduction without prior consent. 取り組みの狙い ① 社会全体でのAIの受容性向上・安全性向上 – 劣悪なAIの排除による利用者の安全性の向上 – 製造物責任の基準明確化による提供者のリスク軽減 ② AI構築のサプライチェーンの健全性・競争力強化 – AIのサプライチェーン全体での品質管理 – 受発注基準の明確化によるビジネスの障壁除去 – 製品価値のメトリクス提供による日本産AIの競争力の明確化 ⇒ 「安心を説明でき、納得して使えるAI」の実現を目指す
  • 12. © All rights reserved. No reproduction without prior consent. AI品質管理と サプライチェーンマネジメント • AI 品質を軸にしたサプライチェーン構築支援 – 品質に関するベストプラクティス・社会合意の整理 – ステークホルダー間の健全な情報共有・役割分担の形成 利用者・ 社会 製品 提供者 AI構築 ベンダ データ 構築・ 提供者 機械学習品質マネジメントガイドライン AI品質についての 社会合意形成・ ベストプラクティス提示 製品品質からみた 受発注基準の明確化 データ構築の役割 ・責任分担の明確化
  • 13. © All rights reserved. No reproduction without prior consent. ガイドライン:発行実績 • 日本語第1版: 2020年6月公開 • 日本語第3版: 2022年8月公開 • 英語第2版: 2022年2月公開 • 英語第3版 準備中 https://www.digiarc.aist.go.jp/publication/aiqm/
  • 14. © All rights reserved. No reproduction without prior consent. 品質管理の対象と考え方 • 着目する「品質」 – 利用時品質 • サービス利用者にとっての品質 – 安心・公平など – 外部品質 • システムに「求められる」性質 → 目標を設定 – 内部品質 • システムが「持つ」性質 → 達成を確認 それぞれ依存・実現の関係 15
  • 15. © All rights reserved. No reproduction without prior consent. 品質管理の対象と考え方 • 超基本的な流れ – 利用者に提供すべき利用時品質を考える – 製品の設計をして、 機械学習要素に必要な外部品質を考える – 外部品質の品質レベルを決定する – 外部品質レベルに対応した、 内部品質の要求事項をガイドラインで確認する – それぞれの内部品質の達成を確認する 16
  • 16. © All rights reserved. No reproduction without prior consent. ガイドラインの品質確保の構造 • 機械学習AIが「持つべき品質」の目標 ① リスク回避性(安全性) – 7レベルを設定 ② AIパフォーマンス(トータル性能) ③ 公平性 ④ プライバシー – 各3レベルを設定 ⑤ セキュリティ • 品質を向上させるために押さえるべき 技術的ポイントを9項目に整理 • 左の品質レベルごとに 要求事項を設定 品質目標: 5特性 × レベル (外部品質特性) 品質管理の9ポイント (内部品質特性)
  • 17. © All rights reserved. No reproduction without prior consent. 内部品質9項目 A-1. 問題領域分析の十分性 A-2. 問題に対する被覆性 B-1. データセットの網羅性 B-2. データセットの均一性 B-3. データの妥当性 C-1. 機械学習モデルの正確性 C-2. 機械学習モデルの安定性 D-1. プログラムの信頼性 E-1. 運用時品質の維持性
  • 18. © All rights reserved. No reproduction without prior consent. 内部品質9項目 基本的な考え方 A) 問題の分析に基づく あるべきデータセットの設計 B) 設計に合致する 良いデータセットの確保 C) 良いデータセットから得られる 良い機械学習モデル D) 信頼できるソフトウェア E) 品質を維持する運用 19
  • 19. © All rights reserved. No reproduction without prior consent. システムライフサイクルプロセス • 品質マネジメントの全体プロセスモデル – 企画段階から運用・利用終了までの 総合的な品質マネジメントを想定して整理 – AI 特有のPoCプロセスや、繰り返し型の開発工程と、 品質管理を整合 20
  • 20. © All rights reserved. No reproduction without prior consent. AI品質ガイドラインの社会展開 21 • 2022/8 日本語3版公開 • 2022/2 英語版2版 政府系での利用 • 経産省・消防庁・厚労省 プラント分野AI信頼性評価ガイドライン • OECD・EU 協調などでの日本側材料に 産業展開 民間企業による利用 • ガイドライン適用サポート事業 • 自社AIへの適用 国際標準化 • ISO/IEC TR 最新ドラフトに貢献 AIシステムの品質評価支援 テストベッド • 2020/11/18 公開 機械学習品質マネジメント ガイドライン
  • 21. © All rights reserved. No reproduction without prior consent. 国際標準化: TR 5469 (Functional Safety and AI systems) 担当: ISO/IEC JTC 1/SC 42/WG 3 Editor: 日本 IEC側 (IEC 61508-3) チームと (事実上合同で) 検討 Scope: 機能を実現するための安全性機能内部でのAIの利用 AIで制御される機器の安全性担保のための非AI機能の利用 AIシステムを用いた安全性関連機能の設計と開発 AIQMガイドラインの内部品質の整理などをインプット 投票中 22
  • 22. © All rights reserved. No reproduction without prior consent. プロジェクトの全体像 全産業共通の ガイドライン (品質目標の類別・レベル分け・測定指標) 事例毎の リファレンス 事例毎の リファレンス 事例毎の リファレンス 具体化 共通要素の抽出 フィードバック 具体化 具体化 ①要件の明確化と エコシステム開発 ⇒ 機械学習品質管理ガイドライン ⇒ 産業分野別リファレンスガイド 実際の製品開発プロセス 参照 利用 管理 機械学習品質管理テストベッド ②実際に品質を作り込む 道具立て ⇒品質管理テストベッド ⇒評価ツール ③ 具体的なAI評価技術の先端開発 対応 呼び出し 結果の集積管理 個別の品質評価技術
  • 23. © All rights reserved. No reproduction without prior consent. 品質評価テストベッドQunomon • 高品質AIを実現するための品質評価環境 – 機械学習品質ガイドラインに沿ったテスト管理 – 豊富な品質テストパッケージと、柔軟な拡張性 – 品質評価レポートの自動生成 2020.11 公開・随時更新中 発見可能性 入手可能性 相互適合性 再利用性 オープンテストベッド Qunomon AIテスト技術の流通を促進 AIテスト技術開発者 AI品質評価者 AIテスト技術を登録 AIテスト技術を利用して AI品質評価レポートを取得 https://aistairc.github.io/qunomon/ 24
  • 24. © All rights reserved. No reproduction without prior consent. 応用別のリファレンスガイド • ガイドラインを実際に製品に適用するために 「こうすればできる」を示す事例集 – 2022年3月に第1版を公開 • 民間企業の具体的事例を共有知に – 民間企業から出向して頂き、産総研で研究 25
  • 25. © All rights reserved. No reproduction without prior consent. 応用別のリファレンスガイド • 検討内容例 – データラベルの設計やラベル付けの精度・ツール支援 – コーナーケースの分析・モデルの安定性などの検証 26
  • 26. © All rights reserved. No reproduction without prior consent. 応用別のリファレンスガイド • 品質アセスメントシート – 製品全体の安全性管理と連結させるための チェックシート 27
  • 27. © All rights reserved. No reproduction without prior consent. まとめ • 機械学習AIの品質ガイドライン – 品質を「作り込み」「確認し」「説明する」 ためのガイドライン – サービス提供者とシステム開発者の活用を想定 – サプライチェーンの確立と利用者・提供者双方の安心感の醸成 – 品質の基準や認証の基盤としての活用を期待 28