“程序设计”目录存档

AscW函数返回负数的问题

2010年09月29日,星期三

其实这个问题在以前写《VBS实现PHP的urlencode函数》的时候就碰到了,但是当时没有记下来,造成写前面一篇文章《VBS实现Unicode转UTF-8》的时候重蹈覆辙。还是记录下来吧,免得以后又忘记。

MSDN文档对AscW的说明是:AscW是为使用Unicode字符的32位平台提供的。它返回Unicode(宽型)字符代码,因此可以避免从ANSI到Unicode的代码转换。

按照参考手册的定义,AscW函数应该返回一个字符的Unicode字符编码,但是直接拿返回的结果来用的话会有潜在的BUG,正如我碰到的。

“魔”字的Unicode编码是39764,测试如下代码

c = AscW("")
If c > 127 Then
	WScript.Echo "Not ASCII"
Else
	WScript.Echo "ASCII"
End If

你认为返回的结果是什么?"Not ASCII"?错!返回的结果是"ASCII"。

这就是潜在的BUG,对某些中文(当然还有其他字符)AscW函数返回的值是负数!如果你的代码拿这个值与一个正数比较大小,逻辑值将是False!

为什么呢?因为AscW的返回值的子类型是Integer,而VBS中Integer的取值范围是从-32768到32767。39764 > 32767,造成了溢出,所以返回负数。

怎样才能得到正确的结果呢?答案把子类型是转化成Long,Long的取值范围是-2,147,483,648到2,147,483,647,不会造成溢出。

WScript.Echo CLng("&H" & Hex(AscW("")))

先用Hex函数把AscW的返回值转化成十六进制的字符串,加上VBS中十六进制前缀&H,最后用CLng函数把子类型转化成Long。这样就能得到39764这个正确的Unicode编码值了。

VBS实现Unicode(UTF-16)转UTF-8

2010年09月28日,星期二

有UTF-8转Unicode当然就有Unicode转UTF-8。

'Author: Demon
'Website: https://demon.tw
'Date: 2010/9/28
Function UnicodeToUtf8(str)
    Dim i, c, length
    out = ""
    length = Len(str)
    For i = 1 To length
        c = CLng("&H" & Hex(AscW(Mid(str,i,1))))
        If (c >= &H0001) And (c <= &H007F) Then
            out = out & ChrB(c)
        ElseIf c > &H07FF Then
            out = out & ChrB(&HE0 Or (c\(2^12) And &H0F))
            out = out & ChrB(&H80 Or (c\(2^ 6) And &H3F))
            out = out & ChrB(&H80 Or (c\(2^ 0) And &H3F))
        Else
            out = out & ChrB(&HC0 Or (c\(2^ 6) And &H1F))
            out = out & ChrB(&H80 Or (c\(2^ 0) And &H3F))
        End If
    Next
    UnicodeToUtf8 = out
End Function

参考链接:UTF-8 – 维基百科,自由的百科全书

VBS实现UTF-8转Unicode(UTF-16)

2010年09月27日,星期一

本文源于一个VBS群里的一个看起来很牛逼的人给别人的一个UTF-8转Unicode的函数Utf8ToUnicode。代码有60多行,放在了文章后面,以免喧宾夺主~

代码太长了,不知道是他自己写的还是复制粘贴的。我没有仔细看,但是简单测试了一下,貌似是正确的。

当时回了一句“Utf8ToUnicode函数哪需要这么复杂”,谁知他来了句“如果用api的话,当然一个了。”

算了,看在他的代码功能是正确的份上,我就不多说什么了。下面给出我写的自以为比他的简单的Utf8ToUnicode函数。 (更多…)

JavaScript的Trim函数有12种写法,你可知道么?

2010年09月25日,星期六

昨天那个在线生成EditPlus注册码的JavaScript脚本要用到Trim函数,Google了一下,竟然有那么多种实现,而且效率也不一样。

具体的自己看看参考链接吧,下面只给出最常见的一种

return str.replace(/^\s+|\s+$/g, '');
参考链接:
  1. Faster JavaScript Trim
  2. Fastest JavaScript Trim
  3. JavaScript trim函数大赏

在VC中编译运行程序的小知识点

2010年09月21日,星期二

1、Run-Time Library

Run-Time Library是编译器提供的标准库,提供一些基本的库函数和系统调用。
我们一般使用的Run-Time Library是C Run-Time Libraries。当然也有Standard C++ libraries。
C Run-Time Libraries实现ANSI C的标准库。VC安装目录的CRT目录有C Run-Time库的大部分源代码。

C Run-Time Libraries有静态库版本,也有动态链接库版本;有单线程版本,也有多线程版本;还有调试和非调试版本。
可以在"project"->"settings"->"C/C++"->"Code Generation"中选择Run-Time Library的版本。

动态链接库版本:
/MD Multithreaded DLL                    使用导入库MSVCRT.LIB
/MDd Debug Multithreaded DLL       使用导入库MSVCRTD.LIB

静态库版本:
/ML Single-Threaded                       使用静态库LIBC.LIB
/MLd Debug Single-Threaded          使用静态库LIBCD.LIB
/MT Multithreaded                           使用静态库LIBCMT.LIB
/MTd Debug Multithreaded              使用静态库LIBCMTD.LIB

C Run-Time Library的标准io部分与操作系统的关系很密切,在Windows上,CRT的io部分代码只是一个包装,底层要用到操作系统内核kernel32.dll中的函数,在编译时使用导入库kernel32.lib。这也就是为什么在嵌入式环境中,我们一般不能直接使用C标准库。

(更多…)