C语言字符串：不要小看字符串1

会计考友 · 发表于 2012-7-31 21:48:08

#ifdef _unicode　　#define _t l
　　#else
　　#define _t
　　#endif
　　these data-type mappings are defined in tchar.h and depend on whether the constant _unicode or _mbcs has been defined in your program.
　　当我们在利用cstring 类便捷性时，有些特殊化的东西无法做，于是相互之间的转换变经常被需要：
　　在转换之前必须确保你的字符的范围在你的范围之内。
　　1.cstirng转 char *
　　传给未分配内存的指针.
　　cstring cstr1="abcd";
　　char * ch=cstr1.getbuffer(cstr1.getlength()+1);  //获取指向cstring最后一个字符的地址。
　　cstr1.releasebuffer();
　　注意：用完ch后,不用delete ch,因为这样会破坏cstr内部空间,容易造成程序崩溃.
　　getbuffer :这个函数是为一个cstring对象重新获取其内部字符缓冲区的指针,返回的lptstr为非const的,从而允许直接修改cstring中的内容! 如果nminbuflength 比当前buffer大,那么就调用releasebuffer函数去释放当前的buffer,用一个被请求的大小去覆盖这个buffer.
　　而getbuffer则是返回一个可以供调用者写入的内存，并且，你可以给定大小。其实它就相当于申请一块nlen大小的内存，只不过，这块内存是被引用在cstring对象的内部而已，这是非常有效的一种用法，如果不直接用getbuffer函数来申请的话，那么你必须用new操作符（或者 malloc()函数）在cstring的外部申请，然后再将申请的内存拷贝到cstring对象中，显然这是一个非常冗余的操作，会使你函数的效率大大下降。
　　releasebuffer函数是用来告诉cstring对象，你的getbuffer所引用的内存已经使用完毕，现在必须对它进行封口，否则 cstring将不会知道它现在所包含的字符串的长度，所以在使用完getbuffer之后，必须立即调用releasebuffer函数重置 cstring的内部属性，其实也就是头部信息。
　　值赋给已分配内存的char *
　　cstring cstr1 = "asddsd";
　　int strlength = cstr1.getlength() + 1;
　　char *pvalue = new char[strlength];
　　strncpy(pvalue, cstr1, strlength);
　　赋值：
　　char* psz = “joise”; 没有构造函数，仅可以赋值（因为它本身就是基本型）
　　cstring cstr( psz ); 可以从基本的一些字符串变量构造而来，包括char*等
　　string str( cstr );  可以从几乎所有的字符串构造而来，包括cstring和char*；
　　以上也可以看作由 char *转cstirng的办法。

　　字符串非常非常常见又重要，而且还有那么多名堂在里面
　　字符串:
　　在标准c中，是没有字符串变量的，但是有字符数组。而且标准c带有的标准库函数：string.h中包含了大量的字符串操作函数，当然如果必要的话，你也可以自己写代码实现这些函数的功能。我认为即便c语言再简单，即便这些知识看起来是多么枯燥和简单，依然有必要回顾并牢记它们：
　　对于32位操作系统
　　int (2字节)  short （1字节） long（4字节）
　　unsigned  char 从0到256之间
　　char 从-128到127之间
　　byte  字节就是无符号的字符
　　unicode：两字节的字符
　　由此可见:byte=nusigned char, short=char
　　char* :是指向ansi字符数组的指针，其中每个字符占据8位（有效数据是除掉最高位的其他7位），这里保持了与传统的c,c++的兼容。
　　tchar: 在采用unicode方式编译时是wchar_t,在普通时编译成char. 如果定义_unicode，声明如：typedef wchar_t tchar; 如果没有定义_unicode，则声明如：typedef char tchar;
　　lpstr: 是一个指向以‘\0’结尾的ansi字符数组的指针，与char*可以互换使用，在win32中较多地使用lpstr。
　　lptstr和lpctstr：中的含义就是每个字符是这样的tchar。
　　lpwstr与lpcwstr：类似于lpstr与lpcstr，只是字符数据是16位的wchar_t而不是char。
　　lpcstr: 增加的‘c’的含义是“constant”（常量），表明这种数据类型的实例不能被使用它的api函数改变，除此之外，它与lpstr是等同的。
　　lpctstr:
　　#ifdef _unicode
　　typedef const wchar_t * lpctstr;
　　#else
　　typedef const char * lpctstr;
　　#endif
　　cstring类，是由微软公司集成在vc的mfc里面，包含字符串各种常见操作的类。其源码可以在mfc里面找到。
　　当声明一个字符串变量，首先会调用构造函数，在成功后，便可利用它的常见操作。
　　cstring 是一个完全独立的类，动态的tchar数组，封装了 + 等操作符和字符串操作方法。
　　1、ansi（即mbcs）：为多字节字符集，它是不定长表示世界文字的编码方式。
　　2、unicode：用两个字节表示一个字符的编码方式。
　　mbcs宏对应的字符串指针为lpstr，unicode对应的指针为lpwstr。lpstr被定义成是一个指向以null(‘\0’)结尾的8位ansi字符数组指针，而lpwstr是一个指向以null结尾的16位双字节字符数组指针。

　　为了写程序的方便，微软定义了类型lptstr，在mbcs下它表示lpstr，在unicode下它表示lpwstr，这就可以重定义一个宏进行不同字符集的转换了。

会计考友 · 发表于 2012-7-31 21:48:09

</p>　　lp str：指向一个字符串的32位指针，每个字符占1个字节。
　　lpc str：指向一个常量字符串的32位指针，每个字符占1个字节。
　　lp tstr：指向一个字符串的32位指针，每个字符可能占1个字节或2个字节。
　　lpc tstr：指向一个常量字符串的32位指针，每个字符可能占1个字节或2个字节。
　　强制转换为unicode，应该是l。字符串（literal string）前面的大写字母l，用于告诉编译器该字符串应该作为u n i c o d e字符
　　串来编译。当编译器将字符串置于程序的数据部分中时，它在每个字符之间分散插入零字节

		自动登录	找回密码
密码			立即注册

[C语言] C语言字符串：不要小看字符串1

C语言字符串：不要小看字符串1