テキストマイニング初心者視点でテキスト分析の失敗しやすい注意点や意識すべきコツを解説(全体像の把握「クラスタリング」編)

顧客満足度の向上、顧客の新たなニーズの発見、商品やサービスの改善などには、VOC(=お客様の声)を分析することが有効です。自由記述型のアンケートやコールセンターに寄せられた問い合わせ・苦情、SNS上での反響などから集まったVOCを分析するために、テキストマイニング・テキスト分析のツール導入を考えている、もしくはツールの導入を始めたという企業も多いのではないでしょうか?

本稿では、テキスト分析においてはじめのステップとなる、データの全体像を可視化する工程「クラスタリング」について、テキストマイニング初心者の視点から失敗しやすい注意点や意識すべきコツといった気づきをご紹介します。

こちらの記事もぜひチェック!「テキストマイニング初心者が失敗する3つのポイント」

データの全体像を可視化する「クラスタリング」とは

VOCを分析する大きな目的の1つに、どのような問い合わせ・要望・苦情がどのくらいの件数あるのかというデータの全体像の把握が挙げられます。その目的に対応する機能が「クラスタリング」です。
ベクストが提供するテキストマイニングツール「VextMiner」 では、抽出する主要話題の数(=クラスタ数)や同じ話題と判定し、その話題群に振り分ける関連度の足切りライン(=Threshold)を指定するだけで、ワンクリックで主要話題を自動分類し、データの全体像を整理することができます。
クラスタリングは、話題の体系化に加え、分析の切り口の発見にも役立ちます。分類体系は自由に複数構築することも可能なため、部署ごとに分析の目的に合わせてクラスタリング結果をまとめることもできます。

クラスタリングで初心者が陥りやすい失敗とは?成功するためのコツもご紹介!

クラスタ数、Thresholdの設定

先ほど、クラスタリングでは「抽出する主要話題の数(=クラスタ数)や同じ話題と判定し、その話題群に振り分ける関連度の足切りライン(=Threshold)」を指定すると説明しましたが、「VextMiner」 のデフォルトは、クラスタ数40個、Threshold 60%で設定されています。
テキストマイニングを始めたばかりの初心者の方は、デフォルト値から分析を始めるのが良いでしょう。「VextMiner」 の操作に慣れ、さらに細かく話題を拾いたくなった場合は、クラスタ数60個~100個、Threshold 70%~80%の設定に調整してみてください。
前述の通り、クラスタリングの目的は主要話題を抽出して、大まかに全体像を捉えることです。クラスタリングの段階で、少数話題までを網羅した全ての話題を拾う必要はありませんので、100個を超えた多すぎるクラスタ数や85%以上の高すぎるThresholdの設定は行わないようにしましょう。

クラスタ名の付け方

クラスタリングにより自動分類された各話題(=クラスタ)には、そのクラスタがどのような話題の集まりなのかを簡潔に示す名前を付けましょう。それにより、分析担当者以外がクラスタリング結果を見た場合でも、改めてデータの原文を見ることなく、素早く話題の内容を把握することができます。

クラスタ名を付ける際に注意すべきポイントとしては、日にちが空いてからそのクラスタ名を見ても原文の内容が思い出せるような名前を付けることです。例えば、「発売している小型扇風機のカラーバリエーションを増やしてほしい」という主旨の話題群に対して、「小型扇風機」と単語のみで名前を付けると、「色違いの小型扇風機が欲しい」なのか「小型扇風機に故障が頻発している」なのか、それとも「小型扇風機を充電でも使えるようにしてほしい」なのかが分析に時間が空くと分からなくなり、再度、クラスタ内の原文を読み直すことになってしまいます。そのため、VOC分析を目的にする場合は「小型扇風機の色違いが欲しい」といった名前の付け方がおすすめです。
分析は一日で完結するものではないことが多く、分析担当者が変わることもある点を考慮した名前付けが良さそうです。ただし、分析の目的や展開先、自社の分類定義などによって適切とされる名称ルールが変わるため、ご紹介したおすすめの名前の付け方を参考にして「今回の分析目的としてはどう名付けるべきか」をご検討ください。

また、クラスタの名前付けに時間をかけすぎないことにも気を付けましょう。分類体系の整理や精緻化は、クラスタリングの後の工程で可能なため、同じ群に振り分けられた話題の全てを取りこぼさないような厳密な名前付けは必要ありませんし、それには膨大な時間がかかってしまいます。その話題群を代表する5~10個の原文から名前付けを行えば充分です。
参照する原文が長い場合には、クラウドLLMが高精度な要約を行ってくれる、「VextMiner」 の標準機能「VextInsight」 の活用もおすすめです。

(参考)「VextInsight powered by ChatGPTの最新機能 原文の素早い内容把握を実現する「ポイントサマリー」のご紹介」

分類体系の構築

各クラスタに名前付けができたら、いよいよ分類体系を構築していきます。分類体系を整理していく際には、この分析結果を用いて「誰が何をしたいのか」という目的を明確にしておきましょう。例えば、分析結果の展開先がマーケティングの部門なのか、カスタマーサクセスの部門によっても分類の軸は変わってきます。
「VextMiner」 でのクラスタリングでは、クラスタを「大分類」「中分類」「詳細分類」と3階層で整理することができます。例えば、「ご要望(大分類)」>「商品(中分類)」>「小型扇風機の色違いが欲しい(詳細分類)」や「ご要望(大分類)」>「店内環境(中分類)」>「小さい買い物かごも用意してほしい(詳細分類)」といったようにです。この3階層構造を利用して、分かりやすく話題を体系化していきましょう。その際には、各階層同士の粒度を揃えることも意識すると良いです。
また、苦情・クレームやお叱りの内容は別にまとめておくと、その話題に絞ってさらに内容を深く分析していくことに役立ちます。

(参考)「分析目的を定めてテキスト分析作業を効率的にこなす」

以上が、テキストマイニング初心者視点からのテキスト分析で失敗しやすい注意点や意識すべきコツのご紹介でした。効果的なテキストマイニングに最も必要なのは経験です!上記のポイントを抑えながら、ぜひ「VextMiner」 をたくさん触ってみてください。


より詳細な情報や事例について知りたい方は、お問合せフォーム よりぜひお気軽にお問合せください。テキストマイニングに興味をお持ちの方は、無料のセミナー もございますので、お気軽にご参加ください。また、ベクスト各種製品のお役立ち資料 もご用意しております。

関連製品:VextMinerVextInsight
関連キーワード:初心者、テキストマイニング、テキスト分析、VOC