株式会社シンクパワー【代表取締役社長 冨田 雅和】(以下「シンクパワー」という)と、国立研究開発法人 産業技術総合研究所【理事長 中鉢 良治】(以下「産総研」という)情報技術研究部門【研究部門長 田中 良夫】後藤 真孝 首席研究員、メディアインタラクション研究グループ 佃 洸摂 研究員、石田 啓介 テクニカルスタッフらは共同で、歌詞のトピックを可視化して、膨大な曲の歌詞の中から興味のある歌詞を見つけることができる歌詞探索ツール「Lyric Jumper(リリック ジャンパー)」を開発した。シンクパワーが運営する歌詞配信サービス「プチリリ」内で、無料で利用できるツールとして、2017年2月21日に一般に公開する。
「Lyric Jumper」は、「プチリリ」が配信する歌詞データの一部(開始時は約15万曲)を、産総研が開発した歌詞トピック解析技術を用いて自動解析し、歌詞に出てくる単語の出現の仕方から、楽曲ごとのトピックを自動推定することで実現した歌詞探索ツールである。自動推定された各トピックには、単語の出現傾向から、「大人の恋愛(男性編)」「大人の恋愛(女性編)」「夢と未来」「硬派」「センチメンタル」といった名称がラベル付けされており、利用者はトピックを手掛かりにさまざまな探索を行える。
アーティストによって歌詞のトピックの傾向には違いがあり、また同じアーティストでも楽曲によって異なるトピックがラベル付けされる。「Lyric Jumper」は、こうした傾向や違いを可視化して、利用者がトピックに基づいて新たなアーティストや歌詞を次々と探索できるユーザインタフェースをウェブ上で提供する。これにより、従来の単純な曲名選択や歌詞フレーズ検索では不可能だった、下記の五つの機能のような新たな切り口による歌詞との出会いや発見を実現できた。利用者は、パソコンかスマートフォンのウェブブラウザで「Lyric Jumper」にアクセスして無料で利用できる。それぞれの図の左側がパソコンでの画面表示例、右側がスマートフォンでの画面表示例を示し、図の下の説明ではパソコン上での操作を紹介する。
アーティストの持ち歌にはいろいろな歌詞がある。「Lyric Jumper」は、それぞれの歌詞を20個の代表的なトピックのいずれかに分類し、アーティストの持ち歌の歌詞の傾向をトピックの比率として可視化する機能を実現した。たとえば「夢と未来」のトピックの歌詞が持ち歌に多ければ、それが大きく表示される。さらに、トピックの比率が似ている、つまり歌詞の傾向が似ている他のアーティスト名も同じ画面に表示させることができる。この機能により、利用者がアーティストごとの歌詞の特徴を把握しやすくなるとともに、歌詞の傾向が似た別のアーティストを発見することができる。
|
(a)「大人の恋愛(男性編)」のトピックの歌詞が多いアーティストの表示例 |
|
(b)「夢と未来」のトピックの歌詞が多いアーティストの表示例 |
図1:アーティストごとに歌詞のトピックの傾向を可視化する機能 |
中央のアーティスト名を囲む円周上の比率が、そのアーティストの持ち歌におけるトピックの比率を表している。右上には、そのトピックの名称とトピックごとの代表的な単語群が表示されている。 |
利用者が興味のあるトピックを選択すると、そのトピックに分類された持ち歌の比率の高さと数の多さに基づいてアーティスト名がリストアップされる機能を実現した。これにより利用者は、自身が関心をもつトピックの曲を歌うアーティストを知ることができ、さらに、意外なアーティストがそのトピックの曲を歌っていたことも発見できる。
|
図2:トピック別アーティストのリストアップ機能 |
左側からトピックを選ぶとその右にアーティスト名一覧が表示されて選択できる。 |
アーティストの持ち歌を、利用者が選択したトピックに絞りこんでその曲名一覧を表示する機能を実現した。これにより利用者は、そのトピックに分類された曲を容易に選択してその歌詞を見ることができる。
|
図3:歌詞のトピックによる絞り込み機能 |
中央のアーティスト名を囲む円周上に表示されたトピックを一つ選ぶと、右側の曲名一覧がそのトピックに分類された曲だけに絞り込まれ、曲名の選択がしやすくなる。 |
トピックを参考に曲名を選択すると、その歌詞を表示する際に、そのトピックに特に関連深いフレーズ(行)が目立つように文字サイズと色を変えて強調表示する機能を実現した。これにより利用者は、一目で歌詞の特徴をつかむことができる。
|
図4:トピックと関連が深いフレーズがすぐわかる歌詞表示機能 |
曲名を選択するとその歌詞が表示される。歌詞のトピックと関連が深いフレーズがそのトピックに対応する色に着色されて大きく表示される。 |
フレーズ発掘ボタンを押すと、中央に表示されたアーティストのさまざまな歌詞の中から、トピックと関連が深いフレーズが抜き出されて、次々と表示される機能を実現した。これにより利用者は、従来の曲名検索とは異なる方法で歌詞を発見して楽しむことができる。
|
図5:フレーズ発掘ボタン機能 |
アーティスト名の画面で「フレーズ」や「PUSH!」と表示されたフレーズ発掘ボタンを繰り返し押すと、そのアーティストの代表的なトピックに関連づけられる歌詞の1行が次々と現れる。利用者は興味持った歌詞が出たら、その歌詞全体を見て楽しめる。 |
「Lyric Jumper」は、従来は困難だったトピックに基づく多様で柔軟な歌詞探索を実現し、下記の三つの利点が得られた。
-
発見:トピックのつながりをたどることで、未知のアーティストや歌詞に興味を持てる。
-
俯瞰:アーティストごとの歌詞の傾向や意外さを俯瞰しながら音楽を楽しめる。
-
理解:同じトピックを伝える歌詞表現の多様さに気づくことができる。
シンクパワーと産総研は、今後も引き続き両者で共同開発を進め、「Lyric Jumper」の機能を向上させるとともに、シンクパワーが保有する大規模な歌詞データを活用して研究開発を進めている「歌詞のレコメンドエンジン」の実用化に取り組んでいく予定である。「Lyric Jumper」のツールと歌詞トピック解析技術は、国立研究開発法人 科学技術振興機構(JST) 戦略的創造研究推進事業 ACCELの研究開発課題「次世代メディアコンテンツ生態系技術の基盤構築と応用展開(研究代表者:後藤 真孝(産総研 情報技術研究部門 首席研究員)、プログラムマネージャー:伊藤 博之(JST))」の一環として、産総研が技術開発した。
プチリリについて
「プチリリ®」は、シンクパワーが運営する歌詞配信サービスであり、シンクパワーの登録商標である。再生音楽にあわせてカラオケのように流れる同期歌詞を含めた、約240万曲もの歌詞データを提供している。「Lyric Jumper」は、プチリリが2016年12月末の時点で配信していた日本語歌詞の歌詞データの一部(約15万曲)を利用できるが、今後、利用できる歌詞データを増やしていく。プチリリでは、「Lyric Jumper」の利用レポートも公開中である。
歌詞トピック解析技術について
産総研が研究開発した歌詞トピック解析技術は、大規模な歌詞データを与えるだけで、アーティスト、歌詞、単語という3階層の構造を考慮しながら、歌詞でのさまざまな単語の出現の仕方からトピックを解析して、事前に決めた個数のトピック群を自動的に推定できる。トピック数は解析時に自由に設定でき、「Lyric Jumper」では20個に設定した。各トピックは、歌詞に使われる単語の偏りを表す確率分布として定義される。そして、与えられた歌詞データ全体の傾向を考慮しながらその傾向の差異が端的に表現されるようにトピック群が自動決定された後に、その中の1つのトピックを各歌詞データに割り当てる。この技術による解析結果を「Lyric Jumper」で用いる際には、トピックの名称を手動でラベル付けして簡潔に表示しており、たとえば、「私」「あなた」「涙」「約束」という単語の出現確率が高いトピックに対しては「大人の恋愛(女性編)」という名称を、「夢」「明日」「未来」「笑顔」という単語の出現確率が高いトピックに対しては「夢と未来」という名称を表示している。