FDSL
\研究者にきいてみた!/
画像認識の分野でよく使われてきた画像データセットと同等以上の認識精度を実現した「FDSL(Formula-Driven Supervised Learning)」(2022/6/13プレスリリース)。
従来手法とどう違い、どんなメリットがあるのでしょう?
開発担当の人工知能研究センター コンピュータビジョン研究チームの片岡 裕雄 上級主任研究員に聞きました!
ココがすごい①
画像データセット作成の手間が激減!
数百万枚におよぶ写真の用意と、1枚ずつ手作業での「教師ラベル」付け。画像データセットの用意には大変な労力が必要でした。
FDSLは、画像+ラベルの自動生成でこの問題を解消。数式等に権利がない限りは商業利用も可能なデータベースです。
ココがすごい②
「AIの公平性」観点でも安心!
ImageNetなどのオープンな画像データセットには、権利上問題のある画像が含まれていたり、不適切なラベル付けで性差・人種など倫理的に不公平な結果が出力される問題が。
自動生成のFDSLなら、少なくとも事前学習の文脈では権利・公平性の面で安心です。
Q. FDSLを思いついた経緯は?
A. 写実的なCGでデータセットを作る研究は以前から進んでいました。ただ、CGでは十分な精度が出ず、CGを作るのも大変…と課題も。
そんなとき、研究者との雑談で出たのが「植物や貝殻など自然物によく現れるフラクタルを使ってみては?」というアイデアだったんです。
Q. フラクタル画像をAIはどう「見てる」の?
A. フラクタル画像を見せるのは「事前学習」というステップ。物を識別するための「目の付け所」をAIに教える作業といえます。
初見でイヌとネコを識別するのは難しいので、まずはイヌネコに限らず「あらゆるモノを見分けるコツ」を教え込むわけです。
モノの見方を教えるだけなら、実物ではなくモノの特徴をもった図形でもよさそうな気がしますよね?こうして研究がスタートしました。
面白かったのは、この成果が脳科学研究者からも反応をいただいたこと。「モノの特徴」画像は、ヒトが物を識別するときのパターンに偶然似ているのかもしれません。
FDSLの研究成果が認められるまで、約5年。
その間、数多くの国際会議からReject(拒絶)、時にはStrong Rejectを受けることもあったそうです。
採択されるまでのストーリーを片岡主任研究員(当時)みずからまとめたNote記事を最後にご紹介。研究を志す方はぜひ読んでみてください。
https://note.com/cvpaperchallenge/n/na91cfc857b30