2. テキストマイニングの基本技術

カテゴライズ機能(分類ルールの設定)

ここで、また問題が浮かび上がりました。クラスタマップは非常に良い機能ですが、これだけでは定期的な分類が出来ないという問題です。当時のお客様から、月40万件のデータを毎月同じルールで分類を行いたいとの要望を頂き、カテゴライズ機能を開発しました。この機能は、クラスタマップの結果をベースに、各々の分類ルールを設定ファイルとして定義を行うもので、「森を見る技術」と「木を見る技術」を融合した機能です。これによって、定期的に一定の分類条件での自動分類が可能となりました。

分類体系の構築例:国交省「自動車不具合情報」