情報工学と心理学のコラボ

投稿日:2019年06月20日 |カテゴリー:研究

みなさま、こんにちは。おくむら(@nori_broccoli)です。

たまには真面目なことも書いてみます。おくむらの研究分野は知識工学とか知識情報処理みたいな言われ方をすることの多い分野で、言語処理学会によく出没しますが、おくむら自身は言語処理はツールとして使わせていただいている立場です。主の研究内容は「語の連想」です。

語の連想というと、最近はWord2Vecが出てきてから「王様ー男+女=女王」みたいな計算ができるとかできないとかがもてはやされたりしていますが、基本的にはある次元に圧縮されたベクトル空間での演算に基づくものであることは周知の事実かと思います。以前、指導学生が検証してくれた実験で面白い結果が出ていたのですが、類似性を高く判断しそうなWord2Vecのベクトル空間の方が、おくむらが長年精錬を続けている概念ベースと比べて、より連想度(適切な表現かは不明)が高いという、想定と逆の結果が得られたという事実があります(KES2016で学生が発表してくれています)

おくむらが作りたい、成し遂げたいと思う連想用概念ベースの在り方は、類似性とかはともかく、例えば、「赤ちゃんとオモチャ」のような共出現する単語のペアのようなものを多く取り扱えることなのですが、窓幅を決めて共起語から学習させるWord2Vecの方が思いの外連想語をたくさん拾ってきていて驚いているところです。ただ、次元圧縮することで起きる弊害として、微細なニュアンスの欠落というのもあります。頻度が低い、関連が低いとなると切り捨てられてしまうような情報ですね。そのあたりを残そうとすると、次元の呪いとの真っ正面からの戦いになります。

縁あって文系の大学で情報工学を教えるという不思議な状況に身を置いているので、同僚の先生方、特に心理学の先生方にいろいろコメントをもらうようになり、連想知識の作り方にも新しい切り口が見つかって、大変面白くなってきています。学生研究としてやらせるには時間のかかりすぎるテーマであるので、じっくり3年4年と時間を掛けてやっていかないといけませんが、これまであまり考えてもいなかった方向からのアドバイスを得られるようになり、重み付け一つとっても今までとは全く違うアプローチで実施できそうな気配です。

連想語概念ベースがどこまで言語処理で活用できるデータになるのか、どこまで求められるのか、全く分からないところもあります。ただ、対話システムなど人間とのインタフェースに近い研究となってくると、人間らしい連想機能というのは少なからず必要になるものかと思います。残念なことに、私の在籍していた研究室では私が在学中に実験していた内容そのままといった発表がいくつか見られたり、少し手詰まり感を醸し出している状況です。おくむらは親不孝者なので、あまり出身研究室とは博士号取得以来交流していないのですが、残念な気持ちはあります。

地元に戻って仕事をしていますし、たまには母校に顔を出して共同研究的なことをやってみるのも良いかもしれません。もっとも、共同研究になるほどの交流ができるかは分かりませんが、打破しなければいけない問題は同じはずですから、情報交換だけでも有意義ですよね。

こちらは、比較的文系寄りのアプローチでこれから開発を進めていくことになります。論文を書くというところまでしばらく時間がかかりそうですが、毎日のように意見交換できる環境に居るので、楽しく少しずつ進められたら良いなと思っているところです。とりあえずは、JungのWord Association Testあたりまで戻って、今一度連想について考え直していこうかなと思っています。

人間の連想に関して興味のある方がいらっしゃれば、是非お声かけいただければ幸いです。