HTML,Unicode与NCR(数字字符引用)

标签: , , ,

昨天ihipop问的一个问题,下面是什么编码?

telecomadmin+8位数字

根据常识判断,&#后面的数字应该是Unicode编码值,写个VBS验证:

MsgBox ChrW(20301)&ChrW(25968)&ChrW(23383)

输出“位数字”,连起来就是“telecomadmin+8位数字”,读起来挺通顺的,看来是Unicode没错了。

Google了一下,这东西专业名称叫numeric character reference(NCR),直译就是数字字符引用。一个Numeric Character Reference编码是由一个与号(&)跟着一个井号(#),然后跟着这个字符的Unicode编码值,最后跟着一个分号组成的,就像上面的例子一样。

有了数字字符引用,就可以在网页中显示Unicode字符了,不用考虑html文件本身的编码,因为数字字符引用只用到ASCII字符集里的字符。所以,即使在gb2312编码的网页中,也可以用NCR显示埃及的象形文字了。

赞赏

微信赞赏支付宝赞赏

随机文章:

  1. 利用WMI打造完美“三无”后门-The Core
  2. 使用Image Generator (Image Builder)生成OpenWrt固件
  3. 用VBS屏蔽键盘和鼠标
  4. WMI入门教程:第三部分
  5. 用VBS检测U盘插入和弹出事件(二)

留下回复