SlideShare a Scribd company logo
東京Node学園#6 文字コードと Node
06/25 (UTC) リリース
東京Node学園#6 文字コードと Node
符号化文字集合



エンコーディング方式
ASCII

ISO-8859-1

JIS X 0201

JIS X 0208

JIS X 0213
Shift_JIS


EUC-JP


ISO-2022-JP
世界中の文字を集めた符号化文字集合



2バイトの符号


日本語・中国語・韓国語の漢字は統合
世界中の文字を集めた符号化文字集合

4バイトの符号


Unicodeに先行していたが支持されず
東京Node学園#6 文字コードと Node
Unicodeのエンコーディング方式


バイト単位で可変長のエンコーディング
東京Node学園#6 文字コードと Node
2byte (16bit) では足りない




BMP (基本多言語面)
2バイト単位のエンコーディング方式



サロゲートペア
東京Node学園#6 文字コードと Node
UTF-8ではサロゲートペアは不要


3バイト長までしかサポートしていない環境もある


非BMPを3バイトのペア(計6バイト)でエンコーディング
エンコーディング方式が揃う


 UTF-16

 UTF-32



Unicode 3.2 ('02)
emojiが追加 (非BMP)
ECMA262



string型
~v3.8



v3.9~
Node v0.6



Node v0.8
Buffer



ストリーム (string_decoder)
Node v0.6



Node v0.8
Node v0.6




Node v0.8
他のエンコーディング
node-iconv


ストリームでの利用は注意
東京Node学園#6 文字コードと Node

More Related Content

PPTX
マスタリング バベル
PPTX
文字コードのお話
PPTX
文字コード勉強会
PDF
文字コード略歴
PDF
文字コード概説
PPTX
A Reintroduction To Ruby M17 N
PDF
アドテク勉強会
PDF
An Introduction to Guarded Horn Clauses
マスタリング バベル
文字コードのお話
文字コード勉強会
文字コード略歴
文字コード概説
A Reintroduction To Ruby M17 N
アドテク勉強会
An Introduction to Guarded Horn Clauses

More from koichik (6)

PDF
東京Node学園#8 Let It Crash!?
PDF
東京Node学園#3 Domains & Isolates
PDF
node-handlersocket
PDF
2008/02 STMの紹介
PDF
東京Node学園#1「非同期プログラミングの改善」のエッセンス
PPT
2007/02 ClearCase & UCM の紹介
東京Node学園#8 Let It Crash!?
東京Node学園#3 Domains & Isolates
node-handlersocket
2008/02 STMの紹介
東京Node学園#1「非同期プログラミングの改善」のエッセンス
2007/02 ClearCase & UCM の紹介
Ad