独立行政法人 産業技術総合研究所【理事長 吉川 弘之】(以下「産総研」という)のフェロー 大津 展之(東京大学 特任教授 兼任)は、防犯カメラなどで自動監視・認識するうえで、最も重要な鍵である「モニター映像から人およびその動作の認識を自動的に行う」新方式を開発した。これは、これまでに、2次元静止画像に対して開発した高次局所自己相関特徴抽出法(以下「HLAC」という)を用いた適応学習型認識方式を、さらに動画像に拡張し、立体HLAC(以下「CHLAC」という)に基づき、「対象の動作」の特徴を抽出する方法であり、非常に汎用的でかつ高速・高精度であることが特徴である(一部、兼任先の東京大学大学院 情報理工学系研究科での学生指導で実施)。
新方式CHLACはモニター動画像から個人を識別し、異常行動を直ちに検出することができる。本方式を、米国のHumanIDプログラムの一環として米国立標準技術研究所(NIST)が取り纏めている国際的なgait認識のコンペティションのためのテストデータ(HumanID Gait Challenge Dataset)に対して適用した結果、従来手法を大幅に上回る世界最高の認識性能であることが実証された。
新方式CHLACは、人の認識のみならず、異常行動の検出や、特定した人を追跡する移動体追跡にも適用できるため、ニーズの高い知的防犯カメラなど、セキュリティ分野における自動(無人)ビデオサーベイランスの研究開発を始め、ロボット視覚など、コンピュータビジョンの研究開発にも大きく貢献すると期待される。
今後は、文部科学省の「都市エリア産学官連携促進事業(高度ビデオサーベイランス)」、「科学技術振興調整費・重要課題解決型研究等の推進(交通事故対策技術)」、「21世紀COEプログラム(情報科学技術戦略コア(東京大学大学院情報理工学系研究科の採択テーマ))」に適用し、本方式の実用化に向けた研究開発や、対話システム、ロボットなどの「実世界情報システム」分野における視覚への応用を行っていく予定である。
なお、本研究成果の詳細については、MVA2005(IAPR Conference on Machine Vision Applications(2005年5月16~18日、茨城県つくば市))で発表された他、ICCV2005(Tenth IEEE International Conference on Computer Vision(2005年10月15~21日、中国北京))において発表される予定である。
|
図 人の異常行動の検出例(ここでは歩くことが正常、転ぶが異常)
|
犯罪やテロの増加に伴い、監視カメラによるビデオサーベイランスの研究が盛んである。特に、監視カメラの知能化のためには、映像中の人および動作の認識や異常行動の検出を自動的に行う技術が重要であり、実用化のニーズは極めて高い。しかしながら、従来の手法では実用に足る認識性能が得られていなかった。
従来手法の殆どは、まず動画から個々の動く物体を切り出し、あらかじめ用意したモデルに照らして対象とする人の認識や動作特徴の抽出を行う手法であり、精度に限界があって計算量も膨大である。また、人の動作の特徴抽出手法としてはオプティカルフロー方式が主流であるが、前提条件の成立が厳しく、しかもノイズに弱い等の理由から実用化には至っていない。
これに対して大津らは、これまでに、「統計的特徴抽出」の理論的な視点から、2次元静止画像に対して非常に汎用的な高次局所自己相関特徴抽出法(HLAC)を適用して、学習適応能力を有する画像認識方式の開発を行っており、これは平成3年に科学技術庁より第50回注目発明に選定されている。
今回、これをさらに動画像に拡張した立体HLACに基づく汎用的で高速・高精度な「対象の動作」の特徴を抽出する技術(CHLAC)の開発に成功した(特許出願済み)。
動画像は、2次元静止画像が時間に沿って並んだ3次元(立体)の数値データである。これらのデータから、特定の対象、例えば歩く人を認識し計測するためには、歩く人の空間における位置情報に依存しない特徴抽出が望ましい。これを位置不変性という。立体内に複数個の対象がある場合、全体の特徴値がそれぞれ個別対象の特徴値の和になる加法性を持つと、以後の処理が容易となり、認識精度が向上する。さらに特徴抽出方法としては計算量が少なくリアルタイム処理が可能であることが望ましい。
HLACおよびCHLACによる特徴抽出方式は、正にこれらの要請を全て満たす基本的で汎用的な特徴抽出方式となっており、この抽出データと統計的な情報統合手法を組み合わせることにより、動画像からの適応学習型汎用物体認識方式が得られるようになった。
このCHLACによる認識性能は、米国のHumanIDプログラムの一環として、米国立標準技術研究所(NIST)が取り纏めているgait認識の国際的なコンペティションのためのテストデータ(HumanID Gait Challenge Dataset:gaitから71人を識別する)に対して、従来手法を大幅に上回る世界最高性能であることが実証された。【図1】を見ると産総研のCHLACは、特に難しい問題に対して従来手法よりも抜群の認識率をあげていることが分かる。
|
図1 国際コンペティションGait認識テストデータにおける従来手法との比較
産総研のCHLACは特に難しい問題に対して抜群の認識率をあげていることが分かる。
|
今回開発した方式では、動画像から異常行動を直ちに検出することができる。本方式では、画像中に複数の対象が有る場合、それぞれの対象の特徴の和が、全体の特徴となる加法性を持つので、通常(正常)動作の特徴ベクトルは、特徴空間(251次元)のある部分空間(通常動作部分空間)に分布することになる。従って、異常行動は、常時、通常動作の学習によって得られる「通常動作部分空間」からの逸脱(その距離を数値化すると、その値)として、直ちに高速かつ高精度に検出・認識される(複数人の場合でも、異常値検出力は同じ)【図2参照】。
ここでも、あらかじめ準備しておく対象のモデルや知識は一切不要であり、計算量も一定で少ないためリアルタイム処理が可能であり、自動(無人)ビデオサーベイランスでの異常検出の様々な課題に応用できる。
|
図2 異常検出の応用例(ここでは、歩くが正常、転ぶが異常)
|
さらに、今回開発した認識技術は、画面を分割しHLACの特徴である加法性を利用することにより、移動体の自動追跡も可能である。追跡には、対象の形情報に加えて色情報も重要な要素となるので、HLAC特徴をカラー画像に対応できるように拡張してある。従来手法の殆どが画像レベルでの照合(テンプレートマッチング)であるため、対象の切り出し誤差(位置ずれを含む)や対象の動作の変化などによって、誤った追跡となりがちであった。また、対象が一度物陰に隠れる、あるいは他の対象と交差する場合、追跡ができなくなるなどの問題点があった。これに対して、本方式は移動対象の「特徴レベル」での同定・認識に基づく非常に頑健(robust)で安定な追跡法であり、移動体の切り出しも不要で計算量も少なく、リアルタイムでの追跡が可能になった【図3参照】。
今後は、文部科学省の「都市エリア産学官連携促進事業(情報通信:安全・安心な都市生活のためのユビキタス映像情報サーベイランス)」、「科学技術振興調整費(重要課題解決型研究等の推進/交通事故対策技術の研究開発/状況・意図理解によるリスクの発見と回避)」に適用し、本法式の実用化に向けた研究開発を行う予定である。さらに、同省の「21世紀COEプログラム(情報科学技術戦略コア(東京大学大学院情報理工学系研究科の採択テーマ))」において、対話システムやロボットなどの「実世界情報システム」分野における視覚の研究開発にも本方式を応用する予定である。
本方式は、高性能かつ汎用的であるので、セキュリティや防災などのビデオサーベイランスに関わる応用分野(監視カメラシステム、警備システム、防災監視システムなど)を始め、ビデオの自動インデクシング(インデックスを作ること、シーンの変わり目の自動検出・編集)、医療福祉やスポーツ分野(リハビリテーション、動作の矯正、トレーニングシステムなど)、さらには、対話システムやロボットの視覚など、広くコンピュータビジョンに関係する分野での応用が期待される。