助教の柴田です。
田胡・柴田研究室では、主にクラウドのシステムなどの研究開発を行っているのですが、今回撮影に協力してくれた加藤君の研究は、一風かわった対話システムの開発です。いわゆる「人工無能」といえばわかりやすいでしょうか。
加藤さんは、成績優秀かつ頭脳明晰で、その能力+情熱で、卒業研究として、対話の内容に目的はないけれども気軽に話をして楽しんだり安心したりできるような雰囲気の対話を行うことができるようになる対話システムの作成を目指してがんばっています。
どのような内容なのか、少し専門的なことになりますが説明したいと思います。
大枠では、webから収集した規模の大きい会話文のデータをもとに、入力された文に対して、それらしい返答文を生成することが目的となります。今回の研究では、データの全ての文に対して、あらかじめ、話題となるような単語や固有名詞を抜き出して、空欄にし、テンプレートとして保存しておきます。
そして、入力文が入力されると、その文から、話題となる単語の抽出(例:チョコレート)や、話題となっているカテゴリーの決定(例:食べ物)や、感情値の抽出(例:驚き)など、高度なレベルの情報抽出を行います。
その後、それらの情報を使って、適切な返答文が作れるよう、単語とテンプレートを選択して、穴埋め方式で返答文を作成します。
特に、加藤さんは、研究における独自の視点として、「感情」を考慮した文生成を行うことに注力しています。
例えば、楽しい気分にさせるような文を入力したときには、システムは「楽しい気分」となり、楽しんでみせたり、怒らせるような文を入力したときには、システムは「腹立たしい気分」となり、怒ってみせたり、そういったことを目的としています。
実は、技術面からいうと、このようなことを実現するためには、沢山の越えるべきハードルがあります。
①日本語の解析(文を解析して、名詞などにわける)
②単語のカテゴリーわけ(たとえば「人名」などの固有名詞や、「乗り物」などのジャンル分け)
③入力文からの感情の抽出
④返答文作成のための、話題単語やテンプレートの適切な選択
とくに、 ②や③などは高度な意味情報の抽出となり、コンピュータに実行させるのはこれらは最近の人工知能の目覚ましい発展により、徐々に可能になってきています。
また、そのためのツールが開発され、大学や研究機関の研究者により公開されています。
本研究では、①、②にはJUMANやKNPとよばれるツールを、③には、ML-askと呼ばれるツールを利用しました。
また、④では、単語間の類似度をデータから学習することができる、Word2Vecとよばれる
ツールを使用しました。
これらのツールは非常に有用で、10年前ではとてもこのようなことはできなかったと思えるようなことを成し遂げさせてくれます。
もし興味があれば、上記のツールの名前で検索してみて下さいね。
以下、加藤さんからのコメントです。
****************************************************************************
普段できない経験だったので、撮影はとても楽しかったです!
この動画を見た人が、少しでも本学や人工無脳に興味を持っていただければ幸いです。
私は3月で卒業してしまいますが、まだまだ私の人工無脳には試したいことや改善したいことがたくさんあります。
今後、私の後輩やこの動画を見てくれた人たちが、人工無脳をさらに進化させていってくれることを期待したいと思います。
****************************************************************************
撮影前の打ち合わせの様子。
緊張感漂います。でも加藤君はカメラに対しては全然緊張しなかったとか。
(実はインタビューアはCS学部の1年生なのですが、とても綺麗な方で、その方と話すことのほうが緊張したとか(笑))
インタビューに答えている様子です。
この後ディスプレイで実演しながらプログラムの説明をします。
実際に使われる時間は1分ぐらいなのですが、何度も取り直しを行い、かなり時間がかかっていました。
研究の内容を専門家ではなくてもわかるよう要約する、というのは本当に難しいことですね。
加藤さん、本当におつかれさまです。
私も少しだけ友情出演させて頂けました。