HTML,Unicode与NCR(数字字符引用)

标签: , , ,

昨天ihipop问的一个问题,下面是什么编码?

telecomadmin+8位数字

根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:

MsgBox ChrW(20301)&ChrW(25968)&ChrW(23383)

输出“位数字”,连起来就是“telecomadmin+8位数字”,读起来挺通顺的,看来是Unicode没错了。

Google了一下,这东西专业名称叫numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。

有了数字字符引用,就可以在网页中显示Unicode字符了,不用考虑html文件本身的编码,因为数字字符引用只用到ASCII字符集里的字符。所以,即使在gb2312编码的网页中,也可以用NCR显示埃及的象形文字了。

随机文章:

  1. 又一个VBS病毒源码的解密
  2. 用Python脚本写ASP页面
  3. 在C语言程序中使用cURL库(libcurl)
  4. 在Windows下编译zlib 1.25
  5. 验证IPv4地址的正则表达式

留下回复