多言語で正確なテキスト分類を実現 -WEBフィルタにおけるQA ENGINEの利用例-

QA ENGINEとは

QA ENGINEは学習データを用いた精度の高い自動応答・テキスト分類のSaaSです。分類項目を設定し、各分類項目ごとに分類をしたいテキスト例を学習データとして登録します。すると学習データから、未知のテキストに対して適切に分類をすることが可能となります。現在英語、日本語、中国語をはじめ16言語で利用をすることができます。

 

WEBフィルタとは

インターネットにどこからでもアクセスができるようになっている今、WEBフィルタのニーズが高まっています。子供のWEB閲覧内容を管理する親向けのサービスや、端末からのアクセスできるサイトを制御する学校向けや会社向けサービスがあります。暴力を含むもの、政治的な発言を含むものなどを必要に応じて閲覧できないようにすることができます。

WEBフィルタを提供する会社はそれぞれ独自の分類項目を持っており、ユーザーのアクセス歴がある何億というサイトを分類しています。しかし、常に新しいサイトは誕生し、内容は更新されます。ユーザーから分類に対する指摘があることもあります。そこでサイトの分類結果を定期的に更新する必要があります。

WEBコンテンツの分類にあたっては、ドメイン情報や掲載されている画像、そしてテキスト内容などの複数の情報を勘案して総合的に判断します。

今回はテキスト内容の分類にQA ENGINEが利用された例をご紹介します。

 

QA ENGINEが導入された背景

WEBフィルタの多くは、きめ細かなアクセス把握と制御が可能となっています。これを実現するために分類項目が多く(数百項目)設定され、それに対して正確に分類をすることが求められます。また、必要な時に随時コンテンツを分類でき、多様な言語に対応することも求められます。

 

小規模なトライアルで検証をしたところ、過去の分類結果を学習データとして登録をした結果少ない学習データで高い分類精度を創出することができました。1項目当たりの学習データを抑えることは、メンテナンスコストに直結します。現状、1項目50程度で一定の検索精度を実現できています。

また、多言語対応ができる点も評価を受け、QA ENGINEが採用されました。

 

導入の効果

QA ENGINEを小回りが利くテキスト分類機として活用することで、分類結果のUpdateがしやすくなったと評価をいただきました。また、導入言語も現在3言語となっています。WEBページの再分類ニーズが発生した時に対応がしやすくなり、結果的に顧客満足度向上につながっています。

その評価もあり、3年以上の継続利用につながりました。

 

まとめ

テキストを独自の分類項目に対して高精度で分類するタスクにQA ENGINEは非常に有効です。過去の分類結果を学習データとして活用することで導入コストも削減できますので、テキスト分類タスクで業務効率化を図りたい場合はお気軽にご相談ください。

資料請求
アイコン アイコン