HTML,Unicode与NCR(数字字符引用)

标签: , , ,

昨天ihipop问的一个问题,下面是什么编码?

telecomadmin+8位数字

根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:

MsgBox ChrW(20301)&ChrW(25968)&ChrW(23383)

输出“位数字”,连起来就是“telecomadmin+8位数字”,读起来挺通顺的,看来是Unicode没错了。

Google了一下,这东西专业名称叫numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。

有了数字字符引用,就可以在网页中显示Unicode字符了,不用考虑html文件本身的编码,因为数字字符引用只用到ASCII字符集里的字符。所以,即使在gb2312编码的网页中,也可以用NCR显示埃及的象形文字了。

赞赏

微信赞赏支付宝赞赏

随机文章:

  1. 在VBS中定义字节数组Byte()
  2. UTF-16与UCS-2的区别
  3. 此版本之魔兽争霸III需要特定语言版本之Windows
  4. IIS7下以FastCGI模式运行PHP
  5. MySQL中CHAR和VARCHAR的区别

留下回复