HTML,Unicode与NCR(数字字符引用)

标签: , , ,

昨天ihipop问的一个问题,下面是什么编码?

telecomadmin+8位数字

根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:

MsgBox ChrW(20301)&ChrW(25968)&ChrW(23383)

输出“位数字”,连起来就是“telecomadmin+8位数字”,读起来挺通顺的,看来是Unicode没错了。

Google了一下,这东西专业名称叫numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。

有了数字字符引用,就可以在网页中显示Unicode字符了,不用考虑html文件本身的编码,因为数字字符引用只用到ASCII字符集里的字符。所以,即使在gb2312编码的网页中,也可以用NCR显示埃及的象形文字了。

赞赏

微信赞赏支付宝赞赏

随机文章:

  1. PT作弊分析
  2. 利用WMI打造完美“三无”后门-Downloader and Uploader
  3. VBS也玩验证码识别
  4. 为OpenWrt编译Shadowsocks-libev
  5. VBS中&H前缀十六进制数的陷阱

留下回复