wikipediaの禁則処理の文字列の文字コードを調べてみました。
参考にどうぞ。
行頭文字
終わり括弧類
カッコ文字が行の最初に表示したらダメですよってことですね。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
, | 0x2C | 0x2C | 0x2C | 0x002C | 0x2C |
) | 0x29 | 0x29 | 0x29 | 0x0029 | 0x29 |
] | 0x5D | 0x5D | 0x5D | 0x005D | 0x5D |
} | 0x8170 | 0xA1D1 | 0x2151 | 0xFF5D | 0xEFBD9D |
、 | 0x8141 | 0xA1A2 | 0x2122 | 0x3001 | 0xE38081 |
〕 | 0x816C | 0xA1CD | 0x214D | 0x3015 | 0xE38095 |
〉 | 0x8172 | 0xA1D3 | 0x2153 | 0x3009 | 0xE38089 |
》 | 0x8174 | 0xA1D5 | 0x2155 | 0x300B | 0xE3808B |
」 | 0x8176 | 0xA1D7 | 0x2157 | 0x300D | 0xE3808D |
』 | 0x8178 | 0xA1D9 | 0x2159 | 0x300F | 0xE3808F |
】 | 0x817A | 0xA1DB | 0x215B | 0x3011 | 0xE38091 |
〙 | ---- | ---- | ---- | 0x3019 | 0xE38099 |
〗 | ---- | ---- | ---- | 0x3017 | 0xE38097 |
〟 | 0x8781 | 0xADE1 | 0x2D61 | 0x301F | 0xE3809F |
' | 0x8166 | 0xA1C7 | 0x2147 | 0x2019 | 0xE28099 |
" | 0x8168 | 0xA1C9 | 0x2149 | 0x201D | 0xE2809D |
⦆ | ---- | ---- | ---- | 0xFF60 | 0xEFBDA0 |
» | ---- | ---- | ---- | 0x00BB | 0xC2BB |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
, | 0x8143 | 0xA1A4 | 0x2124 | 0xFF0c | 0xEFBC8C |
) | 0x816A | 0xA1CB | 0x214B | 0xFF09 | 0xEFBC89 |
] | 0x816E | 0xA1CF | 0x214F | 0xFF3D | 0xEFBCBD |
行頭禁則和字
表示だけだとわかりにくいですが、主に小さい文字(「ちゃ」の「ゃ」等)が行の最初に表示したらダメですよってことです。
Unicodeになるとㇰとかㇲもあるんですね……知りませんでした。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
ヽ | 0x8152 | 0xA1B3 | 0x2133 | 0x30FD | 0xE383BD |
ヾ | 0x8153 | 0xA1B4 | 0x2134 | 0x30FE | 0xE383BE |
ー | 0x815B | 0xA1BC | 0x213C | 0x30FC | 0xE383BC |
ァ | 0x8340 | 0xA5A1 | 0x2521 | 0x30A1 | 0xE382A1 |
ィ | 0x8342 | 0xA5A3 | 0x2523 | 0x30A3 | 0xE382A3 |
ゥ | 0x8344 | 0XA5A5 | 0x2525 | 0x30A5 | 0xE382A5 |
ェ | 0x8346 | 0xA5A7 | 0x2527 | 0x30A7 | 0xE382A7 |
ォ | 0x8348 | 0xA5A9 | 0x2529 | 0x30A9 | 0xE382A9 |
ッ | 0x8362 | 0xA5C3 | 0x2543 | 0x30C3 | 0xE38383 |
ャ | 0x8383 | 0xA5E3 | 0x2563 | 0x30E3 | 0xE383A3 |
ュ | 0x8385 | 0xA5E5 | 0x2565 | 0x30E5 | 0xE383A5 |
ョ | 0x8387 | 0xA5E7 | 0x2567 | 0x30E7 | 0xE383A7 |
ヮ | 0x838E | 0xA5EE | 0x256E | 0x30EE | 0xE383AE |
ヵ | 0x8395 | 0xA5F5 | 0x2575 | 0x30F5 | 0xE383B5 |
ヶ | 0x8396 | 0xA5F6 | 0x2576 | 0x30F6 | 0xE383B6 |
ぁ | 0x829F | 0xA4A1 | 0x2421 | 0x3041 | 0xE38181 |
ぃ | 0x82A1 | 0xA4A3 | 0x2423 | 0x3043 | 0xE38183 |
ぅ | 0x82A3 | 0xA4A5 | 0x2425 | 0x3045 | 0xE38185 |
ぇ | 0x82A5 | 0xA4A7 | 0x2427 | 0x3047 | 0xE38187 |
ぉ | 0x82A7 | 0xA4A9 | 0x2429 | 0x3049 | 0xE38189 |
っ | 0x82C1 | 0xA4C3 | 0x2443 | 0x3063 | 0xE381A3 |
ゃ | 0x82E1 | 0xA4E3 | 0x2463 | 0x3083 | 0xE38283 |
ゅ | 0x82E3 | 0xA4E5 | 0x2465 | 0x3085 | 0xE38285 |
ょ | 0x82E5 | 0xA4E7 | 0x2467 | 0x3087 | 0xE38287 |
ゎ | 0x82EC | 0xA4EE | 0x246E | 0x308E | 0xE3828E |
ゕ | ---- | ---- | ---- | 0x3095 | 0xE38295 |
ゖ | ---- | ---- | ---- | 0x3096 | 0xE38296 |
ㇰ | ---- | ---- | ---- | 0x31F0 | 0xE387B0 |
ㇱ | ---- | ---- | ---- | 0x31F1 | 0xF387B1 |
ㇲ | ---- | ---- | ---- | 0x31F2 | 0xE387B2 |
ㇳ | ---- | ---- | ---- | 0x31F3 | 0xE387B3 |
ㇴ | ---- | ---- | ---- | 0x31F4 | 0xE387B4 |
ㇵ | ---- | ---- | ---- | 0x31F5 | 0xE387B5 |
ㇶ | ---- | ---- | ---- | 0x31F6 | 0xE387B6 |
ㇷ | ---- | ---- | ---- | 0x31F7 | 0xE387B7 |
ㇸ | ---- | ---- | ---- | 0x31F8 | 0xE387B8 |
ㇹ | ---- | ---- | ---- | 0x31F9 | 0xE387B9 |
ㇺ | ---- | ---- | ---- | 0x31FA | 0xE387BA |
ㇻ | ---- | ---- | ---- | 0x31FB | 0xE387BB |
ㇼ | ---- | ---- | ---- | 0x31FC | 0xE387BC |
ㇽ | ---- | ---- | ---- | 0x31FD | 0xE387BD |
ㇾ | ---- | ---- | ---- | 0x31FE | 0xE387BE |
ㇿ | ---- | ---- | ---- | 0x31FF | 0xE387BF |
々 | 0x8158 | 0xA1B9 | 0x2139 | 0x3005 | 0xE38085 |
〻 | ---- | ---- | ---- | 0x303B | 0xE380BB |
ハイフン類
=や-ってのハイフン系は行の最初に表示したらダメだそうです。「〜」はあるんですが「~」がないのは不思議です。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
‐ | 0x815D | 0xA1BE | 0x213E | 0x2010 | 0xE28090 |
゠ | ---- | ---- | ---- | 0x30A0 | 0xE382A0 |
– | ---- | ---- | ---- | 0x2013 | 0xE28093 |
〜 | ---- | 0x8FA1C1 | 0x2141 0x0212 (JIS X) | 0x301C | 0xE3809C |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
- | 0x2D | 0x2D | 0x2D | 0x002D | 0x2D |
ー | 0x815B | 0xA1BC | 0x213C | 0x30FC | 0xE383BC |
※行頭禁則和字に記載 | |||||
~ | 0x8160 | 0xA1C1 | 0x2141 | 0xFF5E | 0xEFBD9E |
= | 0x3D | 0x3D | 0x3D | 0x003D | 0x3D |
= | 0x8181 | 0xA1E1 | 0x2161 | 0xFF1D | 0xEFBC9D |
区切り約物
疑問符・感嘆符も行の最初に表示してはいけないそうです。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
? | 0x3F | 0x3F | 0x3F | 0x003F | 0x3F |
! | 0x21 | 0x21 | 0x21 | 0x0021 | 0x21 |
‼ | ---- | ---- | ---- | 0x203C | 0xE280BC |
⁇ | ---- | ---- | ---- | 0x2047 | 0x28187 |
⁈ | ---- | ---- | ---- | 0x2048 | 0xE28188 |
⁉ | ---- | ---- | ---- | 0x2049 | 0xE28189 |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
? | 0x8148 | 0xA1A9 | 0x2129 | 0xFF1F | 0xEFBC9F |
! | 0x9149 | 0xA1AA | 0x212A | 0xFF01 | 0xEFBC81 |
中点類
句読点(「・」等)は行はじめに表示してはいけないそうです。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
・ | 0x8145 | 0xA1A6 | 0x2126 | 0x30FB | 0xE383BB |
: | 0x3A | 0x3A | 0x3A | 0x003A | 0x3A |
; | 0x3B | 0x3B | 0x3B | 0x003B | 0x3B |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
: | 0x8146 | 0xA1A7 | 0x2127 | 0xFF1A | 0xEFBC9A |
; | 0x8147 | 0xA1A8 | 0x2128 | 0xFF1B | 0xEFBC9B |
句点類
句読点(「。」等)は行はじめに表示してはいけないそうです。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
。 | 0x8142 | 0xA1A3 | 0x2123 | 0x3002 | 0xE38082 |
. | 0x2E | 0x2E | 0x2E | 0x002E | 0x2E |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
. | 0x8144 | 0xA1A5 | 0x2125 | 0xFF0E | 0xEFBC8E |
行末禁則文字
始め括弧類
行末に始め括弧は表示してはいけないそうです。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
( | 0x28 | 0x28 | 0x28 | 0x0028 | 0x28 |
[ | 0x5B | 0x5B | 0x5B | 0x005B | 0x5B |
{ | 0x816F | 0xA1D0 | 0x2150 | 0xFF5B | 0xEFBD9B |
〔 | 0x816B | 0xA1CC | 0x214C | 0x3014 | 0xE38094 |
〈 | 0x8171 | 0xA1D2 | 0x2152 | 0x3008 | 0xE38088 |
《 | 0x8173 | 0xA1D4 | 0x2154 | 0x300A | 0xE3808A |
「 | 0x8175 | 0xA1D6 | 0x2156 | 0x300C | 0xE3808C |
『 | 0x8177 | 0xA1D8 | 0x2158 | 0x300E | 0xE3808E |
【 | 0x8179 | 0xA1DA | 0x215A | 0x3010 | 0xE38090 |
〘 | ---- | ---- | ---- | 0x3018 | 0xE38098 |
〖 | ---- | ---- | ---- | 0x3016 | 0xE38096 |
〝 | 0x8780 | 0xADE0 | 0x2D60 | 0x301D | 0xE3809D |
' | 0x8165 | 0xA1C6 | 0x2146 | 0x2018 | 0xE28098 |
" | 0x8167 | 0xA1C8 | 0x2148 | 0x201C | 0xE2809C |
⦅ | ---- | ---- | ---- | 0xFF5F | 0xEFBD9F |
« | ---- | ---- | ---- | 0x00AB | 0xC2AB |
ここから下はwikipediaに掲載されていませんが、気になったので追加表示してます。 | |||||
( | 0x8169 | 0xA1CA | 0x214A | 0xFF08 | 0xEFBC88 |
[ | 0x816D | 0xA1CE | 0x214E | 0xFF3B | 0xEFBCBB |
分離禁則
分離禁止文字
(「……」等)同じ文字が2個つながっている場合、泣き別れしたらいけないそうです。
文字 | SJIS | EUC | JIS | Unicode | UTF-8 |
---|---|---|---|---|---|
— | ---- | ---- | ---- | 0x2014 | 0xE28094 |
… | 0x8163 | 0xA1C4 | 0x2144 | 0x2026 | 0xE280A6 |
‥ | 0x8164 | 0xA1C5 | 0x2145 | 0x2025 | 0xE280A5 |
〳 | ---- | ---- | ---- | 0x3033 | 0xE380B3 |
〴 | ---- | ---- | ---- | 0x3034 | 0xE380B4 |
〵 | ---- | ---- | ---- | 0x3035 | 0xE380B5 |