テキスト類似度チェッカーの使い方
2つのテキストボックスに比較したい内容を入力すると、ジャカード(Jaccard)類似度アルゴリズムで共通単語の割合を計算して%で表示します。盗用チェック、バージョン比較、翻訳品質確認などに活用できます。
類似度スコアの目安
| スコア範囲 | 意味 |
|---|---|
| 80%以上 | 非常に高い類似度(ほぼ同じ内容) |
| 50〜79% | 中程度の類似度(かなりの重複) |
| 50%未満 | 低い類似度(異なる内容) |
よくある質問
類似度の計算方法は何ですか?
ジャカード類似度を使用します。2つのテキストの単語集合の積集合÷和集合の比率を%で表示します。
大文字・小文字は区別されますか?
区別されません。記号は単語区切りとして処理され、純粋な単語のみが比較に使われます。
100%になるのはどんな場合ですか?
2つのテキストで使われている単語の集合が完全に一致するとき100%になります。単語の順序や出現回数は影響しません。