改行コードまとめ

 改行コードとは、改行を意味する特殊な文字コードのことです。
 OSおよびアプリケーションは文章内でこの改行コードが存在すると、ここで改行されていると認識します。
 その改行コードは、
・Windowsなどでは「CRLF」
・UNIX系では「LF」
・MacOSでは「CR」
だったのですが、現在状況が変わっています。

 以下、改行コードについてまとめます。

1.改行コードまとめ


OS 改行コード 文字リテラル Unicode
Windows CRLF(2文字) \r\n U+000A U+000D
UNIX系、macOS、IOS、Android LF(1文字) \n U+000D

 AppleについてMacOS 9(Classic Mac OS)までは、改行コードが「CR」でしたが、macOS(Mac OS X以降)からはUnixベースのOSを採用したことにより「LF」です。
 尚、MacbookやiMacはmacOSですが、iPad、iPhoneはIOSです。改行コードについては同じく「LF」です。
 このことから、改行コードに「CR」を使用するメジャーなOSは存在しなくなりました。


 ちなみにCRはキャリッジリターン(復帰)、LFはラインフィード(改行)と呼ばれます。
 タイプライターの時代、行を変える際、先頭に戻して(復帰して)改行するという一連の動作をしていましたが、その各々に文字コードが割り当てられました。
 Microsoftはコンピューターの改行を表すコードとしてタイプライター時代の一連の作業を踏襲し、「CRLF」の2文字で表すのに対して、Unix系は「LF」1文字で改行を表します。


2.EXCELのセル内改行

 Windowsは「CRLF」ですが、EXCELのセル内改行の場合は「LF」となるため注意が必要です。

 特に、EXCELファイルをデータベースに取り込む際、例え一旦CSVに出力したとしても、セル内改行は「LF」のままですので、不正な取込結果になることがあります。

おすすめの関連記事

エスケープシーケンスと文字実体参照
文字を扱う際に注意すべき2つの対応方法をまとめました。