独立行政法人 産業技術総合研究所【理事長 吉川 弘之】(以下「産総研」という)情報技術研究部門【部門長 坂上 勝彦】は、特定非営利活動法人 研究開発型NPO振興機構【理事長 北城 恪太郎】(以下「ISERD」という)と共同で、産総研が開発した「研究者ネットワーク検索エンジンPOLYPHONET(ポリフォネット)」ロボット分野版の実用化試験を、4月18日より、次世代ロボット産業創出拠点として、2004年に大阪市経済局が開設し、財団法人 大阪市都市型産業振興センター【理事長 川上 哲郎】が運営する大阪産業創造館 ロボットラボラトリー【ラボラトリーリーダー 石黒 周】(以下「ロボットラボラトリー」という)で開始する。
近年、ロボットやナノテクなど融合分野における研究者の連携や、大学・研究機関の研究者と行政、企業等の産学官連携が必要とされている。しかし、このような連携はこれまで、個人的な知り合い関係や紹介によって行われることが多く、必ずしも効率的な連携が行われていないのが現状である。このような連携のためには、情報技術(IT)を用いた検索サービス等の支援が有効である。これまでにも、論文データベースや学会等への研究者の登録情報などを用いる研究者検索システムは存在するが、論文は研究が終わってから発表されることが多く、最新の情報ではない場合がある。また、効率的な連携体制の支援には、研究者の詳細な専門分野の特定・専門分野内の位置づけなどの要件も考慮して研究者を探索できることが重要であるが、これまでの研究者検索システムは、これらを満たす機能を備えてはいない。
産総研 情報技術研究部門の 松尾 豊 研究員を中心に2004年から開発を進めてきたポリフォネットは、全てのWeb上にある研究者に関する研究活動上の公開情報を収集し、研究者間の関係を抽出することで、研究者ネットワークを表示し、さらには研究者を検索することが可能なシステムである。ポリフォネットは、Webマイニングという技術を用いて、Web上に現れる研究活動による研究者氏名の出現頻度や出現パターンの解析処理を行い、研究者間の関係の強さを推測する。研究室が同じという関係やプロジェクトの共同参加関係、学会によく同席する関係など、研究者間の研究活動上の多様な関係を抽出する。また、研究者の関係に基づいて研究者の検索を行うことが可能である。これにより、異分野の研究者や企業、行政等が目的とする研究者を探し出し、効果的な連携を進めることの支援が可能となる。
今回、産総研とISERDは、大阪市がロボットテクノロジー(RT)産業創出のために、2004年11月に開設したロボットラボラトリーにおいて、ポリフォネットロボット分野版を実験的に導入し、ロボットラボラトリーの会員を対象に実用化試験を開始する。ポリフォネットを利用することで効果的な連携体制を作るきっかけとなるかの検証や、個人情報保護の観点から研究者の権利を侵害しないか等のヒアリング調査を実施する。これは、Web上にある研究者の研究活動上の公開情報から研究者間のつながりを抽出するシステムとしては、国内で初めての本格的な実験運用となる。
大阪市は今後の重点産業化分野のひとつとしてロボットラボラトリーを中核とした次世代ロボット産業の集積化を推進中である。ロボットラボラトリーでは、ロボットに関する研究・技術シーズを関西圏のみならず、全国のロボット研究者の中から発掘し、事業化につなげていく計画である。
産総研では、このポリフォネットの最初の展開分野をロボット分野とし、システムの開発、試験運用を目的に、国内3,600名にのぼる研究者の研究上の公開情報をポリフォネットに組み込み、実用化試験の結果をシステムの改良に反映していく。今後、研究者のネットワークづくりを支援するISERDと共同でバイオインフォマティクスやナノテク等、他の研究分野への展開を図る予定である。
近年、研究者に関するさまざまな研究活動上の情報がWeb上に公開されるようになっている。例えば、研究者個人のホームページ、業績リスト、学会や研究会のプログラム、助成金の採択情報など、研究に関する情報がいち早くWebに載ることも珍しいことではない。一方、ロボットやナノテク、バイオインフォマティクス、防災といった専門分野の異なる研究者の連携が必要な融合領域での研究が最近重要となっている。また、企業や地域・行政を巻き込んだ産学官連携の体制は、研究成果による社会への貢献を図る上で重要である。
このような状況では、異なる専門分野の研究者間でチームを組んだり、企業や地域・行政が研究者と協力する必要がある。例えば、ロボットの開発ではデバイス、ソフトウェア、言語処理、通信などの専門家が協調する必要があるし、防災では地域や行政、研究者の連携が不可欠である。これまで、こういった異分野の研究者との連携、産学官の連携は、個人的な知り合い関係や紹介によって行われるのが一般的であり、システマティックに効率的な連携が行われていないのが現状である。
昨今では技術分野の専門化、多様化が進み、また技術進歩も目まぐるしいため、効果的な連携体制を作るためには、検索ツール・情報サービス等、情報技術(IT)による支援が不可欠である。このような情報支援を行うためには、どのような研究者がどのような研究をしているのかという研究の内容に関する情報だけでなく、どういった研究グループがあるのか、その分野ではどういう位置づけの研究グループなのか、どの研究者が中心的な役割を果たしているか、どこが競合しているのかといった研究者の研究活動上の人的な関係に関する情報が極めて重要である。個人的な知り合い関係だけに頼ってしまうと、中心的な研究者を見過ごすことになったり、競合する他の研究グループを見落とすことになり兼ねない。
これまでに、論文データベースや研究者の学会等への登録情報などを用いて研究者を検索するシステムは存在するが、研究が論文として公刊されるのは実際の活動より数年遅れである場合が多く、新しい技術分野は既存のカテゴリに収まらない形で現れてくる。これまでの研究者を検索するシステムでは、これらには対応できず、したがって、研究者および産業のダイナミックな変化に対応でき、詳細な専門分野を特定した上で研究者を探すことが可能な、しかも研究者の専門分野内における立場や役割なども考慮できるといった要件を供えた情報支援が必要とされている。
産総研 情報技術研究部門では、ユビキタス情報環境において、ユーザの位置に基づく情報支援の研究を行っている。この研究の一環として、学会会場を対象とした参加者への情報支援サービスを行うプロジェクト(イベント空間情報支援プロジェクト)を2003年から行っており、2003年、2004年の人工知能学会の学会会場で、センサを会場内に設置し、参加者の現在位置を示すサービスを行った。その際に、Web上の研究活動上の公開情報から研究者ネットワーク抽出技術を用い、研究者のネットワークを表示するサービスも併せて行われ、参加者は会場に設置されたkiosk端末(街頭などに置かれる情報端末)やWebページ上で参加者同士のネットワークを閲覧することができた。これは、2005年の人工知能学会でも提供される予定である。ポリフォネットは、この研究者ネットワーク抽出の技術を用い、研究者の検索を行えるようにしたシステムであり、2004年7月から開発を行っている。ポリフォネット(POLYPHONET)とは、polyphony(多声音楽)とnetworkを組み合わせたもので、「研究者や企業・地域の人材等がネットワークでつながり、それぞれの長所を生かしながら、より良い音楽を奏でるように連携を行う。」という意味でネーミングを行った。ポリフォネット開発にあたっては、新たに、研究者の研究に関するキーワードを自動的に抽出する技術、研究者の研究カテゴリを自動的に判別する技術、多人数の研究者のネットワークを抽出する技術などの開発を行った。
産総研 情報技術研究部門は、研究者ネットワーク抽出の技術を、産学官連携や融合分野の研究交流に活用することを目的として、2004年12月からISERDと研究者ネットワーク検索エンジンの運用と改良に関する共同研究を実施している。ロボットラボラトリーは、研究者と産業界の交流を主要な活動目的のひとつにあげており、この3者により、2004年11月にオープンしたロボットラボラトリーにおいて、研究者ネットワーク検索エンジン ポリフォネットを実験的に導入し、研究者や企業、地域の交流のための実験運用を行うこととなった。
ポリフォネットは、全てのWeb上にある研究者の研究活動上の公開情報を収集し、収集した研究者の研究活動上の公開データをデータベースに整理、蓄積する。その情報から研究者間の関係を抽出することで、研究者ネットワークの表示ができ【図1参照】、さらには研究者を検索することが可能なシステムである。ポリフォネットは、次のような点を特徴としている。まず、「研究者の検索」機能により、氏名や所属、研究キーワードや研究分野を検索条件として、研究者の検索を行うことができる【図2参照】。研究キーワードや研究分野は、Web上で研究者の名前が、どういった専門用語と一緒によく出てくるかという情報を元に、Webから自動的に抽出される。そして、検索した研究者がどういった研究者とつながりが深いのか、共著や同研究室関係にある研究者は誰なのかを閲覧することができる。この研究者のつながりを順次、たどっていくことで、対象分野全体の研究者のつながりやグループ構成を概観することができる【図3参照】。
|
図1.「研究者ネットワーク検索エンジンPOLYPHONET」による研究者ネットワーク表示
|
|
図2.「研究者の検索」機能により検索した研究者の詳細情報の表示
|
|
図3.検索した研究者とつながりの強い研究者を一覧表示
|
また、「つながり検索」という機能を用いると、ある研究者から別の研究者へのパスを検索することができる。例えば、自分からある研究者へどのようなパスで到達できるのかといったことを調べることができる【図4参照】。目的地や出発地を複数設定することで、例えば「大阪大学の研究者で自分から一番近い人を検索したい」「自動要約の研究者で自分から一番近い人を検索したい」などのように、さまざまな研究者探しの場面で用いることができる。また、場合によっては探したい研究者がデータベースに含まれていないこともあり得るため、新たに研究者をデータベースに追加登録する機能も備えている。
|
図4.「つながり検索」機能により研究者から別の研究者への経路を表示
|
ポリフォネットは、WebマイニングとよばれるWebに関する情報(Webページのテキストやリンク構造、アクセスパターン)に対して、パターンの抽出処理や解析処理を行うことで、明示的に書かれていない有用な知識を見つけ出す技術を用いている。あらかじめ、対象分野の研究者のリストにより、全てのWeb上から該当研究者の研究活動上の公開情報を抽出し、検索エンジンを用いて研究者間の関係の強さおよび関係の種類を同定していく。例えば、「松尾豊」と「田中一郎」の関係を調べるときには、検索エンジンに“松尾豊 AND 田中一郎”と入力する。「松尾豊 AND 田中一郎」の場合には150件のヒットがあり、「松尾豊 AND 佐藤次郎」の場合には5件のヒットしかなかったとすると、松尾豊は田中一郎とより強い関係にあることが推測できる。このように、2人の研究者の名前を並べて検索エンジンに入力し、そのヒット件数を統計的に処理することで、2人の関係の強さを推測する。また、2つの名前を入力してヒットしたページの内容に対して、言語的な処理を行うことで2人の間の関係を同定する。研究室が同じ関係、共著関係、プロジェクトが同じ関係、同じ学会で発表した関係という4種類を識別することができる。これは、ヒットしたページからの属性を抽出し、機械学習(こういったページは同研究室関係を表しているなどと、あらかじめ例となるページと正解を与えておき、そこから自動的に分類を学習するという手法)で得られた判別ルールを適用することで、自動的に研究者の関係を判別するものである。
さらに、Web上で研究者の名前が、どういった専門用語と一緒によく出てくるかという情報を調べ、その研究者の研究キーワードや研究分野を同定する。例えば、「画像処理」という専門用語と一緒によく出てくる研究者は、画像処理の研究を行っている可能性が高い。このようなWeb上に専門用語と研究者名が一緒によく出てくるという関係を統計的に処理することで、専門の研究分野や、研究キーワードを抽出する。
このような特徴を持つポリフォネットによって、分野外の人間が、例えばキーパーソンの検索、あるテーマの研究を行っている研究者のリストアップなどを簡単に行えるようになるため、融合領域での研究や産学官の効果的な連携にとって有効なツールとなると考えられる。
今回、産総研とISERDは、大阪市がロボットテクノロジー(RT)産業創出のために、2004年11月に開設したロボットラボラトリーにおいて、ポリフォネットロボット分野版を実験的に導入し、ロボットラボラトリーの会員を対象に実用化試験を開始する。ポリフォネットを利用することで効果的な連携体制を作るきっかけとなるかの検証や、個人情報保護の観点から研究者の権利を侵害しないか等のヒアリング調査を実施する。これは、Web上にある研究者の研究活動上の公開情報から研究者間のつながりを抽出するシステムとしては、国内で初めての本格的な実験運用となる。
大阪市は今後の重点産業化分野のひとつとしてロボットラボラトリーを中核とした次世代ロボット産業の集積化を推進中である。ロボットラボラトリーでは、ロボットに関する研究・技術シーズを関西圏のみならず、全国のロボット研究者の中から発掘し、事業化につなげていく計画で、今回の実用化試験を経て改良されたポリフォネットロボット分野版を用いた、研究シーズや研究者の探索、産業界と研究者間の橋渡しなどのサービスを大阪市で次世代ロボット事業に関わる企業や起業を計画しているロボットラボラトリーの会員向けのサービスにつなげていく予定である。
産総研では、このポリフォネットの最初の展開分野をロボット分野とし、今回のロボットラボラトリーにおける実用化試験のために国内3,600名にのぼる研究者データをポリフォネットに組み込み、実用化試験の結果をシステムの改良に反映していく。また、このポリフォネットのロボット以外の分野への展開も検討中で、バイオインフォマティクスやナノテクの他、防災・災害救助技術などの分野が考えられている。さらに、海外の研究者ネットワークの抽出、異分野間における研究者ネットワークの分析、時系列の変化の分析などを行っていく予定である。