📝 テキスト入力

文字数: 0 行数: 0

⚙️ 整形オプション

改行コード変換

スペース処理

全角⇄半角変換

その他

✨ 整形結果

文字数: 0 行数: 0

💼 こんな時に便利

  • コピペしたテキストの整形に - Webや文書から取得したテキストの体裁を整える
  • 全角・半角の統一に - データ入力の前処理として文字種を統一
  • リスト作成の下準備に - 行頭に記号を一括追加してリスト化
  • 大文字・小文字の一括変換に - 英文の表記を統一したい時に便利
  • 重複行の削除に - データクリーニングや整理作業に最適

使い方

📌 基本的な使い方

テキストを入力し、適用したい整形オプションのボタンをクリックするだけで、整形されたテキストが結果欄に表示されます。

💡 改行コード変換

  • CRLF → LF: Windows形式(\r\n)をUnix/Mac形式(\n)に変換
  • LF → CRLF: Unix/Mac形式(\n)をWindows形式(\r\n)に変換

⚙️ スペース処理

  • すべてのスペース削除: すべての半角・全角スペースを削除
  • 前後の空白削除: 各行の先頭と末尾の空白を削除
  • 連続スペースを1つに: 連続する空白を1つにまとめる
  • 空行削除: 空の行をすべて削除

🔤 全角⇄半角変換

  • 半角 → 全角: 英数字記号を全角に変換
  • 全角 → 半角: 英数字記号を半角に変換
  • 半角カナ → 全角カナ: 半角カタカナを全角カタカナに変換
  • 全角カナ → 半角カナ: 全角カタカナを半角カタカナに変換

📋 その他の機能

  • 小文字/大文字変換: アルファベットを一括変換
  • 行をソート: 行を昇順にソート
  • 行を逆順: 行の順序を逆転
  • 重複行削除: 同じ内容の行を1つにまとめる

💼 活用シーン

  • 異なるOS間でのテキストファイル変換
  • コピー&ペーストしたテキストの整形
  • データクレンジング・前処理
  • CSVファイルの整形
  • プログラミング用テキストの整形

📚 テキスト整形の技術と仕組み

全角・半角変換の文字コード仕組み

全角・半角文字の変換は、Unicode文字コード値の相対位置を利用しています。半角英数字(ASCII: 0x0021~0x007E)と全角英数字(Unicode: 0xFF01~0xFF5E)の間には、固定のオフセット値(0xFEE0)が存在します。

  • 半角→全角の計算式: 全角コード = 半角コード + 0xFEE0
  • 全角→半角の計算式: 半角コード = 全角コード - 0xFEE0
  • カタカナ変換の複雑性: 半角カナは濁点・半濁点が独立した文字であり、全角カナの1文字に対応するため、マッピングテーブルが必要

改行コードの標準と互換性

異なるオペレーティングシステムでは改行コードの表現が異なります。これはファイルの移行やシステム連携時に問題となるため、適切な変換が重要です。

  • CRLF(キャリッジリターン + ラインフィード): Windows(\r\n)。行末を明確に示すため、レガシーシステムでの互換性が高い
  • LF(ラインフィード): Unix/Linux/macOS(\n)。シンプルで効率的、現代的なシステムの標準
  • CR(キャリッジリターン): Classic Mac OS(\r)。現在はほぼ使用されない

正規表現パターンとその活用

テキスト整形では、正規表現(Regular Expression)が強力なツールとなります。このツールで使用している主要なパターンを紹介します。

  • /\r\n/g: 全てのCRLFを検出。グローバルフラグ(g)により全マッチを対象
  • /[\s ]+/g: 連続する半角スペース・全角スペース・タブ・改行を検出
  • /[!-~]/g: 半角英数字・記号を検出(ASCII 0x21~0x7E範囲)
  • /[!-~]/g: 全角英数字・記号を検出(Unicode全角範囲)

テキスト整形の実践的ユースケース

このツールが活躍する場面は多岐にわたります。具体的な例を通じて、その価値を理解できます。

  • データインポート前処理: データベースやスプレッドシートへのインポート前に、文字コード・スペース・改行を統一して、データ品質を確保
  • クロスプラットフォーム対応: Windowsで作成したテキストファイルをMac/Linuxで使用する場合、改行コードをLFに変換
  • Web APIレスポンス処理: 外部APIから取得したテキストが、想定外の文字コード・スペースを含む場合の正規化
  • ユーザー入力値のクリーニング: HTMLフォームから送信されたテキストの前後の空白・重複行を削除し、正規化
  • ログファイル解析: 複数行ログの重複を削除し、必要なデータのみを抽出
  • 自然言語処理前処理: 形態素解析やテキストマイニングの前に、テキストを統一フォーマットに正規化

📅 最終更新: 2025年12月9日 | 🏢 運営: ToolMarche | 💬 フィードバック: ご意見・ご要望