不可視文字とは
不可視文字は、画面上では表示されませんがテキストデータ内に実際に存在するUnicode文字です。代表的なものにゼロ幅スペース(U+200B)、BOM(U+FEFF)、ソフトハイフン(U+00AD)、方向制御文字などがあります。ウェブページやPDFからテキストをコピー・貼り付けする際や、特定のアプリで編集する際に意図せず混入します。
これらの文字はコードでの文字列比較エラー、検索機能の誤動作、データベース保存時の予期しない結果など、多くの問題を引き起こします。開発者、ライター、データアナリストがよく経験するトラブルです。たとえば「hello」という単語にゼロ幅スペースが混入すると、見た目は同じでも検索で見つかりません。
このツールは既知の不可視文字をすべて検出して種類と個数を表示し、それらを除去したクリーニング済みテキストを提供します。通常のスペース、タブ、改行には一切影響しません。
よくある質問
なぜコピー時に不可視文字が混入するのですか?
一部のウェブサイトやアプリは、単語分割やテキスト方向制御のために不可視文字を挿入しています。コピーするとそれらも一緒についてきます。
元のテキストは変更されますか?
いいえ。入力テキストはそのまま保持され、クリーニング済みテキストは別途表示されます。必要な方だけコピーしてご使用ください。