Submit Search
文字数はおいくら?(Ruby版)
1 like
873 views
tsudaa
サロゲート文字とか合字とか異体字とかの文字数を取得してみました。
Software
Read more
1 of 13
Download now
Download to read offline
1
2
3
4
5
6
7
8
9
10
11
12
13
More Related Content
PDF
実信号マザーウェーブレットを用いたスネア音の検出
toru tom
PDF
Acl yomikai, 1016, 20110903
Yo Ehara
PDF
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
PPT
Tese
oldimar
PPTX
Didática geral tendências pedagógicas
Fernanda Câmara
PDF
DidáTica Volume 1 2 e 3
Albérico Henrique
PPT
Didática De 1549 Ate Atualidade
Julio Siqueira
PPTX
O papel da didática na formação do professor
na educação
実信号マザーウェーブレットを用いたスネア音の検出
toru tom
Acl yomikai, 1016, 20110903
Yo Ehara
大規模常識知識ベース構築のための常識表現の自動獲得
長岡技術科学大学 自然言語処理研究室
Tese
oldimar
Didática geral tendências pedagógicas
Fernanda Câmara
DidáTica Volume 1 2 e 3
Albérico Henrique
Didática De 1549 Ate Atualidade
Julio Siqueira
O papel da didática na formação do professor
na educação
More from tsudaa
(18)
PDF
Json型の使い方
tsudaa
PDF
ぬぎんくす問題
tsudaa
PDF
Windows でも時刻合わせがしたい!
tsudaa
PDF
Python と私の事情
tsudaa
PDF
真理とは何か
tsudaa
PDF
Excelのどうでもよいtipsの紹介
tsudaa
PDF
MySQL のユーザー定義変数と RDB のココロ
tsudaa
PDF
HiroshimaJUG の「Java8 Lambda ハンズオン with すごい広島」を5分で振り返る
tsudaa
PDF
ドメイン名の話 (データベース/SQL)
tsudaa
PDF
スターマークの話
tsudaa
PDF
Powershell のセキュリティ (大都会ver)
tsudaa
PDF
昼の12時は午○何時?
tsudaa
PDF
PowerShell 紹介
tsudaa
PDF
全角チルダ問題
tsudaa
PPTX
資格は役に立つか
tsudaa
PDF
○○型言語と呼ばれるために備えるべき最低限の条件についての検討
tsudaa
PDF
法律の読み方とか
tsudaa
PDF
C++入門?
tsudaa
Json型の使い方
tsudaa
ぬぎんくす問題
tsudaa
Windows でも時刻合わせがしたい!
tsudaa
Python と私の事情
tsudaa
真理とは何か
tsudaa
Excelのどうでもよいtipsの紹介
tsudaa
MySQL のユーザー定義変数と RDB のココロ
tsudaa
HiroshimaJUG の「Java8 Lambda ハンズオン with すごい広島」を5分で振り返る
tsudaa
ドメイン名の話 (データベース/SQL)
tsudaa
スターマークの話
tsudaa
Powershell のセキュリティ (大都会ver)
tsudaa
昼の12時は午○何時?
tsudaa
PowerShell 紹介
tsudaa
全角チルダ問題
tsudaa
資格は役に立つか
tsudaa
○○型言語と呼ばれるために備えるべき最低限の条件についての検討
tsudaa
法律の読み方とか
tsudaa
C++入門?
tsudaa
Ad
文字数はおいくら?(Ruby版)
1.
文字数はおいくら? (Ruby版) @tsuda_ahr 2014/4/5 LTDD広島
#2
2.
1.サロゲート文字の場合 puts "𩹉".length ※サロゲート文字とは、文字コードが U+10000 以上の文字をいいます。(かなり嘘かも)
3.
1.サロゲート文字の場合 こたえ 1
4.
1.サロゲート文字の場合 サロゲート文字でも、 正しく文字数を答える模様。
5.
2.合字の場合 puts "を゙".length puts "が".length puts
"が".length
6.
2.合字の場合 こたえ 2 2 1
7.
2.合字の場合 合字の構成要素数が文字数として戻る。
8.
3.異体字の場合 puts "辻".length puts "辻󠄀".length
9.
3.異体字の場合 こたえ 1 2
10.
4.C#だとこんな感じ Ruby C# サロゲート 𩹉 (U+29E49) 1
2 合字 を゙ (U+3092 U+3099) 2 2 が (U+304B U+3099) 2 2 が (U+304C) 1 1 異体字 辻 (U+8FBB) 1 1 辻󠄀 (U+8FBB U+E0100) 2 3 内部がUTF-16なので、 サロゲート領域(U+10000以上) の文字は 2 でカウントされる。
11.
5.結論 Ruby 結構優秀! (割と素直) (というか内部が多分UTF-8)
12.
蛇足) 気にしてほしいこと String.Length
は処理系によって値が異なることがある。 内部はどういうデータで保持しているかを想像してほしい。 入力するユーザー(一般の人)は無慈悲だ。 # システムの都合は察してくれない
13.
おわり ありがとうございました
Download