テキスト整形ツール
テキストの改行・スペース・全角半角を一括変換して、自動整形します。
改行コード(CRLF/LF)の変換、連続スペースの削除、全角⇄半角カナの相互変換、行の重複削除など、テキスト処理に必要な多彩な機能を備えています。ブラウザ内で完全に処理されるため、あなたのデータはサーバーに送信されません。
改行変換、スペース削除、全角半角変換などのテキスト整形を一括処理できます。
📝 テキスト入力
⚙️ 整形オプション
✨ 整形結果
💼 こんな時に便利
- コピペしたテキストの整形に - Webや文書から取得したテキストの体裁を整える
- 全角・半角の統一に - データ入力の前処理として文字種を統一
- リスト作成の下準備に - 行頭に記号を一括追加してリスト化
- 大文字・小文字の一括変換に - 英文の表記を統一したい時に便利
- 重複行の削除に - データクリーニングや整理作業に最適
使い方
📌 基本的な使い方
テキストを入力し、適用したい整形オプションのボタンをクリックするだけで、整形されたテキストが結果欄に表示されます。
💡 改行コード変換
- CRLF → LF: Windows形式(\r\n)をUnix/Mac形式(\n)に変換
- LF → CRLF: Unix/Mac形式(\n)をWindows形式(\r\n)に変換
⚙️ スペース処理
- すべてのスペース削除: すべての半角・全角スペースを削除
- 前後の空白削除: 各行の先頭と末尾の空白を削除
- 連続スペースを1つに: 連続する空白を1つにまとめる
- 空行削除: 空の行をすべて削除
🔤 全角⇄半角変換
- 半角 → 全角: 英数字記号を全角に変換
- 全角 → 半角: 英数字記号を半角に変換
- 半角カナ → 全角カナ: 半角カタカナを全角カタカナに変換
- 全角カナ → 半角カナ: 全角カタカナを半角カタカナに変換
📋 その他の機能
- 小文字/大文字変換: アルファベットを一括変換
- 行をソート: 行を昇順にソート
- 行を逆順: 行の順序を逆転
- 重複行削除: 同じ内容の行を1つにまとめる
💼 活用シーン
- 異なるOS間でのテキストファイル変換
- コピー&ペーストしたテキストの整形
- データクレンジング・前処理
- CSVファイルの整形
- プログラミング用テキストの整形
📚 テキスト整形の技術と仕組み
全角・半角変換の文字コード仕組み
全角・半角文字の変換は、Unicode文字コード値の相対位置を利用しています。半角英数字(ASCII: 0x0021~0x007E)と全角英数字(Unicode: 0xFF01~0xFF5E)の間には、固定のオフセット値(0xFEE0)が存在します。
- 半角→全角の計算式: 全角コード = 半角コード + 0xFEE0
- 全角→半角の計算式: 半角コード = 全角コード - 0xFEE0
- カタカナ変換の複雑性: 半角カナは濁点・半濁点が独立した文字であり、全角カナの1文字に対応するため、マッピングテーブルが必要
改行コードの標準と互換性
異なるオペレーティングシステムでは改行コードの表現が異なります。これはファイルの移行やシステム連携時に問題となるため、適切な変換が重要です。
- CRLF(キャリッジリターン + ラインフィード): Windows(\r\n)。行末を明確に示すため、レガシーシステムでの互換性が高い
- LF(ラインフィード): Unix/Linux/macOS(\n)。シンプルで効率的、現代的なシステムの標準
- CR(キャリッジリターン): Classic Mac OS(\r)。現在はほぼ使用されない
正規表現パターンとその活用
テキスト整形では、正規表現(Regular Expression)が強力なツールとなります。このツールで使用している主要なパターンを紹介します。
- /\r\n/g: 全てのCRLFを検出。グローバルフラグ(g)により全マッチを対象
- /[\s ]+/g: 連続する半角スペース・全角スペース・タブ・改行を検出
- /[!-~]/g: 半角英数字・記号を検出(ASCII 0x21~0x7E範囲)
- /[!-~]/g: 全角英数字・記号を検出(Unicode全角範囲)
テキスト整形の実践的ユースケース
このツールが活躍する場面は多岐にわたります。具体的な例を通じて、その価値を理解できます。
- データインポート前処理: データベースやスプレッドシートへのインポート前に、文字コード・スペース・改行を統一して、データ品質を確保
- クロスプラットフォーム対応: Windowsで作成したテキストファイルをMac/Linuxで使用する場合、改行コードをLFに変換
- Web APIレスポンス処理: 外部APIから取得したテキストが、想定外の文字コード・スペースを含む場合の正規化
- ユーザー入力値のクリーニング: HTMLフォームから送信されたテキストの前後の空白・重複行を削除し、正規化
- ログファイル解析: 複数行ログの重複を削除し、必要なデータのみを抽出
- 自然言語処理前処理: 形態素解析やテキストマイニングの前に、テキストを統一フォーマットに正規化