備忘録

禁則処理…文字コード一覧

2013年3月5日

wikipediaの禁則処理の文字列の文字コードを調べてみました。
参考にどうぞ。

行頭文字

終わり括弧類

カッコ文字が行の最初に表示したらダメですよってことですね。

文字SJISEUCJISUnicodeUTF-8
, 0x2C 0x2C 0x2C 0x002C 0x2C
) 0x29 0x29 0x29 0x0029 0x29
] 0x5D 0x5D 0x5D 0x005D 0x5D
 0x8170 0xA1D1 0x2151 0xFF5D 0xEFBD9D
 0x8141 0xA1A2 0x2122 0x3001 0xE38081
 0x816C 0xA1CD 0x214D 0x3015 0xE38095
 0x8172 0xA1D3 0x2153 0x3009 0xE38089
 0x8174 0xA1D5 0x2155 0x300B 0xE3808B
 0x8176 0xA1D7 0x2157 0x300D 0xE3808D
 0x8178 0xA1D9 0x2159 0x300F 0xE3808F
 0x817A 0xA1DB 0x215B 0x3011 0xE38091
 ---- ---- ---- 0x3019 0xE38099
 ---- ---- ---- 0x3017 0xE38097
 0x8781 0xADE1 0x2D61 0x301F 0xE3809F
' 0x8166 0xA1C7 0x2147 0x2019 0xE28099
" 0x8168 0xA1C9 0x2149 0x201D 0xE2809D
 ---- ---- ---- 0xFF60 0xEFBDA0
» ---- ---- ---- 0x00BB 0xC2BB
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 , 0x8143 0xA1A4 0x2124 0xFF0c 0xEFBC8C
 ) 0x816A 0xA1CB 0x214B 0xFF09 0xEFBC89
 ] 0x816E 0xA1CF 0x214F 0xFF3D 0xEFBCBD
終わり括弧類

行頭禁則和字

表示だけだとわかりにくいですが、主に小さい文字(「ちゃ」の「ゃ」等)が行の最初に表示したらダメですよってことです。
Unicodeになるとㇰとかㇲもあるんですね……知りませんでした。

文字SJISEUCJISUnicodeUTF-8
 ヽ 0x8152 0xA1B3 0x2133 0x30FD 0xE383BD
 ヾ 0x8153 0xA1B4 0x2134 0x30FE 0xE383BE
 ー 0x815B 0xA1BC 0x213C 0x30FC 0xE383BC
 ァ 0x8340 0xA5A1 0x2521 0x30A1 0xE382A1
 ィ 0x8342 0xA5A3 0x2523 0x30A3 0xE382A3
 ゥ 0x8344 0XA5A5 0x2525 0x30A5 0xE382A5
 ェ 0x8346 0xA5A7 0x2527 0x30A7 0xE382A7
 ォ 0x8348 0xA5A9 0x2529 0x30A9 0xE382A9
 ッ 0x8362 0xA5C3 0x2543 0x30C3 0xE38383
 ャ 0x8383 0xA5E3 0x2563 0x30E3 0xE383A3
 ュ 0x8385 0xA5E5 0x2565 0x30E5 0xE383A5
 ョ 0x8387 0xA5E7 0x2567 0x30E7 0xE383A7
 ヮ 0x838E 0xA5EE 0x256E 0x30EE 0xE383AE
 ヵ 0x8395 0xA5F5 0x2575 0x30F5 0xE383B5
 ヶ 0x8396 0xA5F6 0x2576 0x30F6 0xE383B6
 ぁ 0x829F 0xA4A1 0x2421 0x3041 0xE38181
 ぃ 0x82A1 0xA4A3 0x2423 0x3043 0xE38183
 ぅ 0x82A3 0xA4A5 0x2425 0x3045 0xE38185
 ぇ 0x82A5 0xA4A7 0x2427 0x3047 0xE38187
 ぉ 0x82A7 0xA4A9 0x2429 0x3049 0xE38189
 っ 0x82C1 0xA4C3 0x2443 0x3063 0xE381A3
 ゃ 0x82E1 0xA4E3 0x2463 0x3083 0xE38283
 ゅ 0x82E3 0xA4E5 0x2465 0x3085 0xE38285
 ょ 0x82E5 0xA4E7 0x2467 0x3087 0xE38287
 ゎ 0x82EC 0xA4EE 0x246E 0x308E 0xE3828E
 ゕ ---- ---- ---- 0x3095 0xE38295
 ゖ ---- ---- ---- 0x3096 0xE38296
 ㇰ ---- ---- ---- 0x31F0 0xE387B0
 ㇱ ---- ---- ---- 0x31F1 0xF387B1
 ㇲ ---- ---- ---- 0x31F2 0xE387B2
 ㇳ ---- ---- ---- 0x31F3 0xE387B3
 ㇴ ---- ---- ---- 0x31F4 0xE387B4
 ㇵ ---- ---- ---- 0x31F5 0xE387B5
 ㇶ ---- ---- ---- 0x31F6 0xE387B6
 ㇷ ---- ---- ---- 0x31F7 0xE387B7
 ㇸ ---- ---- ---- 0x31F8 0xE387B8
 ㇹ ---- ---- ---- 0x31F9 0xE387B9
 ㇺ ---- ---- ---- 0x31FA 0xE387BA
 ㇻ ---- ---- ---- 0x31FB 0xE387BB
 ㇼ ---- ---- ---- 0x31FC 0xE387BC
 ㇽ ---- ---- ---- 0x31FD 0xE387BD
 ㇾ ---- ---- ---- 0x31FE 0xE387BE
 ㇿ ---- ---- ---- 0x31FF 0xE387BF
 々 0x8158 0xA1B9 0x2139 0x3005 0xE38085
 〻 ---- ---- ---- 0x303B 0xE380BB
行頭禁則和字

ハイフン類

=や-ってのハイフン系は行の最初に表示したらダメだそうです。「〜」はあるんですが「~」がないのは不思議です。

文字SJISEUCJISUnicodeUTF-8
 ‐ 0x815D 0xA1BE 0x213E 0x2010 0xE28090
 ゠ ---- ---- ---- 0x30A0 0xE382A0
 – ---- ---- ---- 0x2013 0xE28093
 〜 ---- 0x8FA1C1 0x2141  0x0212
(JIS X)
 0x301C 0xE3809C
 ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 - 0x2D 0x2D 0x2D 0x002D 0x2D
 ー 0x815B 0xA1BC 0x213C 0x30FC 0xE383BC
 ※行頭禁則和字に記載
 ~ 0x8160 0xA1C1 0x2141 0xFF5E 0xEFBD9E
 = 0x3D 0x3D 0x3D 0x003D 0x3D
 = 0x8181 0xA1E1 0x2161 0xFF1D 0xEFBC9D
ハイフン類

区切り約物

疑問符・感嘆符も行の最初に表示してはいけないそうです。

文字SJISEUCJISUnicodeUTF-8
 ? 0x3F 0x3F 0x3F 0x003F 0x3F
 ! 0x21 0x21 0x21 0x0021 0x21
 ‼ ---- ---- ---- 0x203C 0xE280BC
 ⁇ ---- ---- ---- 0x2047 0x28187
 ⁈ ---- ---- ---- 0x2048 0xE28188
 ⁉ ---- ---- ---- 0x2049 0xE28189
 ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 ? 0x8148 0xA1A9 0x2129 0xFF1F 0xEFBC9F
 ! 0x9149 0xA1AA 0x212A 0xFF01 0xEFBC81
区切り約物

中点類

句読点(「・」等)は行はじめに表示してはいけないそうです。

文字SJISEUCJISUnicodeUTF-8
 ・ 0x8145 0xA1A6 0x2126 0x30FB 0xE383BB
 : 0x3A 0x3A 0x3A 0x003A 0x3A
 ; 0x3B 0x3B 0x3B 0x003B 0x3B
 ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 : 0x8146 0xA1A7 0x2127 0xFF1A 0xEFBC9A
 ; 0x8147 0xA1A8 0x2128 0xFF1B 0xEFBC9B
中点類

句点類

句読点(「。」等)は行はじめに表示してはいけないそうです。

文字SJISEUCJISUnicodeUTF-8
 0x8142 0xA1A3 0x2123 0x3002 0xE38082
. 0x2E 0x2E 0x2E 0x002E 0x2E
 ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 0x8144 0xA1A5 0x2125 0xFF0E 0xEFBC8E
句点類

行末禁則文字

始め括弧類

行末に始め括弧は表示してはいけないそうです。

文字SJISEUCJISUnicodeUTF-8
 ( 0x28 0x28 0x28 0x0028 0x28
 [ 0x5B 0x5B 0x5B 0x005B 0x5B
 { 0x816F 0xA1D0 0x2150 0xFF5B 0xEFBD9B
 〔 0x816B 0xA1CC 0x214C 0x3014 0xE38094
 〈 0x8171 0xA1D2 0x2152 0x3008 0xE38088
 《 0x8173 0xA1D4 0x2154 0x300A 0xE3808A
 「 0x8175 0xA1D6 0x2156 0x300C 0xE3808C
 『 0x8177 0xA1D8 0x2158 0x300E 0xE3808E
 【 0x8179 0xA1DA 0x215A 0x3010 0xE38090
 〘 ---- ---- ---- 0x3018 0xE38098
 〖 ---- ---- ---- 0x3016 0xE38096
 〝 0x8780 0xADE0 0x2D60 0x301D 0xE3809D
 ' 0x8165 0xA1C6 0x2146 0x2018 0xE28098
 " 0x8167 0xA1C8 0x2148 0x201C 0xE2809C
 ⦅ ---- ---- ---- 0xFF5F 0xEFBD9F
 « ---- ---- ---- 0x00AB 0xC2AB
 ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。
 ( 0x8169 0xA1CA 0x214A 0xFF08 0xEFBC88
 [ 0x816D 0xA1CE 0x214E 0xFF3B 0xEFBCBB
始め括弧類

分離禁則

分離禁止文字

(「……」等)同じ文字が2個つながっている場合、泣き別れしたらいけないそうです。

文字SJISEUCJISUnicodeUTF-8
 — ---- ---- ---- 0x2014 0xE28094
 … 0x8163 0xA1C4 0x2144 0x2026 0xE280A6
 ‥ 0x8164 0xA1C5 0x2145 0x2025 0xE280A5
 〳 ---- ---- ---- 0x3033 0xE380B3
 〴 ---- ---- ---- 0x3034 0xE380B4
 〵 ---- ---- ---- 0x3035 0xE380B5
分離禁止文字

-備忘録
-, , , , , ,