Natural Language
Processing

Natural Language Processing

強化学習・深層学習が実現する自然言語処理の未来

強化学習・深層学習が実現する 自然言語処理の未来

Interview : YOTARO KATAYAMA

Share :

BEDORE 経営者として、アルゴリズム開発から企業経営まで広く従事

── これまでに関わったプロジェクトについて教えてください。

自然言語処理技術の研究開発およびソリューションを提供する株式会社 BEDORE(PKSHA Technology よりスピンアウト)にて、取締役として会社全体を見つつ、アルゴリズムエンジニアとしても手を動かして複数の R&D をおこなっています。

IT、製造、金融をはじめとした様々な産業領域の大手企業様や官公庁とのプロジェクトに関わり、案件ごとに固有の問題解決をおこなうためのデータ分析や、対話型エージェントを動作させるアルゴリズムモジュール開発をしてきました。

エンタープライズ領域のドキュメント検索アルゴリズムが、NEDO の研究テーマに採択

── プロジェクトの幅がかなり広いですね。直近ではどのようなものがありましたか?

対話型エージェントに関連する仕事として、株式会社クレディセゾン(以下、クレディセゾン社)の社内ドキュメント検索アルゴリズムを開発しています。これは、国立研究開発法人 新エネルギー・産業技術総合開発機構(NEDO)の次世代人工知能・ロボット中核技術開発プロジェクトに採択された研究テーマです。

そもそも対話型エージェントは大別して「タスク型」「非タスク型」に分類できるのですが、前者は質問に答える、商品を検索するといった特定の目的を達成するもので、クレディセゾン社の例もこちらに該当します。後者は会話自体が目的となるもので、雑談や会話型ゲームなどが含まれます。

ドキュメントや単語検索の例としていちばん身近なものは、おそらく Google 検索ですよね。例えば「日本 首都」と検索ボックスに入力すると「東京都」という単語が地図付きでブラウザに表示されるように、回答そのものを返してくれる機能があります。さらに最近では、検索クエリの回答そのものとなりそうな場所をウェブページから探してきて,検索結果の画面に直接掲載していたりします。これで解決してしまって、実際にページを開かないなんてこともあると思います。

コンシューマ領域ではこういったことがすでに実現できているのですが、エンタープライズ領域、つまり企業内データに対して同程度のユーザビリティを持った仕組みはまだまだ実現されていないのが現状です。

クレディセゾン社のケースでは、コールセンターでの問い合わせ対応をするためのマニュアル検索を効率化することが課題でした。従来は、コールセンターのオペレータ(電話担当者)自身が適切な文書を検索し、内容をその都度読解して回答する必要がありました。

── 技術的には、どのような内容になるイメージでしょうか。

今回は、検索語の適切な意味理解と文書構造の解析に深層学習を使うことで、マニュアルの該当部分から直接回答を返すアルゴリズムを目指しています。例えば、クレジットカード不正利用の調査を電話口で依頼された場合、「不正利用」「受付」「期間」といった単語で検索すれば「カード利用日から120日以内」という回答を返すことができるようになるというイメージです。

潤沢なデータが得られるインターネットとは違って、社内文書は分量に限りがあるので、文章の意味を一層的確に理解するための抽象化能力を持ったアルゴリズムの開発が必須となります。汎用的なモジュールですので、他業界への展開も目指していきたいと考えています。

深層強化学習により、非タスク型エージェントのKPIを最適化

── 非タスク型の対話システムにも関わっているそうですね。

はい。「タスク型」と比較すると、「非タスク型」の対話は自由度が相対的に大きくなるため、対話シナリオ・ルールが膨大になりがちな特徴があります。また過去に実際のサービスとしてローンチされた例を見てみると、ユーザから不適切な会話を学んでしまったがために、攻撃的で問題のある発言を繰り返すようになったものもあり、安直に end to end の学習をさせることのハイリスクさが障壁となる感もあります。エージェントを没個性的にしないための方法論を確立する必要もありますし、今後より注力していく R&D 対象の一つとして捉えています。

自社プロダクトではなく、クライアントである大手IT企業が運営する雑談用チャットボットのパフォーマンス改善をした事例もあります。

そのチャットボットの場合は,ユーザ数は順調に拡大したものの、チャット内容(ボットの応答)に飽きが生まれ始めている状態を解消することが課題でした。そこで、会話のパーソナライズを目指して、まずユーザごとに刺さるコンテンツを把握することにしました。

その際に有効だったものの一つは LDA (Latent Dirichlet Allocation) などの「トピックモデル」と呼ばれる手法ですね。ユーザーの過去の会話内容をトピック分析することで会話内容をユーザごとにカスタマイズし、KPI を数十倍レベルで改善できました。

また別のアプローチとして、深層強化学習により会話の KPI を最適化する手法も試しており、これも実際にデプロイされていました。

実現したいのは、一過性でない、本質的な価値提供

── 堅山さんは BEDORE の取締役でもありますが、経営者としてはどういった視点を持っていますか。

BEDORE のクライアントはほとんどがいわゆるナショナルクライアントで、対面となるのも意思決定層であることが多いです。そのため、国内大手企業が共通して抱える課題、もしくは新興技術に対する期待感や要望がある程度理解できている感覚があります。一方で技術的なトレンドを見てみると、深層学習を中心とした人工知能領域の技術は一部で成熟し始めており、いよいよ社会実装フェーズを迎えていると考えています。

そのため BEDORE としては、特に大きなご期待をいただく深層学習を当然活用しつつも、その利用自体を目的とするというよりは、必要不可欠と言っていただける水準でのサービス提供、価値提供をすることにコミットしていきます。実際、このスタンスで目に見える成果が複数出始めており、今後も継続・発展させていくための努力をし続けていきたいと思います。

堅山 耀太郎

東京大学大学院工学系研究科修了。総務省SCOPE異能vationプログラム(技術課題名:生物に着想を得た分散アルゴリズムの構築と実装)、ゴールドマン・サックス証券を経てPKSHA Technology参画。現在、株式会社BEDOREにて取締役を務める。

応募する