windows操作系统四个基本特点(揭秘windows操作系统内部数据结构)(1)

在Win32编程的时候,会常常遇到各种各样的字符(串)数据类型,比如CHAR、LPSTR、PCTSTR、LPTSTR等等,这些种类繁多,又很相似的数据类型怎么才能分清楚,他们跟C语言中的char又有什么关系呢?

首先在C语言下的基本字符串类型是char,这个字符串类型与ANSI规定的是一样的。一个字节的低7位用于存放ASCII码,多个字符以空\0x00结尾即表示一个字符串。但是由于符号太多,根本不能用256字符来全部概括,所以出现多字节编码的方式,比如Unicode、UTF、BIG5等等。比如Windows常用Unicode编码方式,这种编码是有两个字节构成一个字符,所以在windows编程中就存在一个基本的双字节编码类型wchar_t这个实际上是一个无符号的16位数。既然这些都可以在同一个系统下出现,那么就由必要规定怎么来区分我要定义的是什么字符串了,于是Windows里面出现了这么多不同的类型定义,下面小编来说明如何辨别这些麻烦的win32数据类型。

windows操作系统四个基本特点(揭秘windows操作系统内部数据结构)(2)

由于两种不同的字符集,对于常量字符串的该如何定义呢?比如:

“This is a test!”

这个字符串,到底是ANSI还是Unicode呢?以前我们是知道的这个应该是一个char的字符串,那如何定义一个同样的宽字符串呢?微软公司规定了一个字符“L”放到字符串前面来表示一个宽字符串,而用_T()、__T()、_TEXT()、TEXT()等表示一个编译时由是否定义UNICODE、_UNICODE来选择宽还是单字节,如下所示:

CHAR str1[] = “This is a test!”; //ANSI字符串定义

WCHAR str2[] = L ”This is a test!”; //宽字符串定义

TCHAR str3[] = TEXT(“This is a test!”); //也可以用_T(“xxx”)等表示,编译时根据定义决定

在Win32平台下编写程序,为了ANSI和Unicode版本都能正常工作,所以推荐大家以后都用带_t的字符串处理函数。比如微软的WinCE嵌入式平台默认只支持Unicode编码的字符串,要在PC上开发然后移植到WinCE上,最好一开始就选_t开始的字符串函数来编写。

大家如果对编程感兴趣,想了解更多的编程知识,解决编程问题,咨询编程学习,可以关注我们的程序员互动联盟(coder_online),这里有java高手、C /C高手、windows/Linux高手等你来。

,