首页 诗词 字典 板报 句子 名言 友答 励志 学校 网站地图
当前位置: 首页 > 教程频道 > 开发语言 > 编程 >

java 字符编码深入懂得(续)

2012-09-02 
java 字符编码深入理解(续)在看完Java核心技术第八版第46页3.6.5章节,对代码单元和代码点再做一次总结。关

java 字符编码深入理解(续)

在看完Java核心技术第八版第46页3.6.5章节,对代码单元和代码点再做一次总结。关于这俩概念的研究至此就算完成了。
有关代码单元和代码点的理解:
    Char:?在java中是采用UTF-16编码的,也就是说,Char是代表一个字符单元。代码单元:UTF-8中是用8个字节表示的,UTF-16中使用16个字节表示的等等。Java中采用的是UTF-16编码!代码点:对应各种真正字符(char不是真正的字符,是代码单元)的Unicode编码。一个代码点可能对应一对代码单元,如辅助字符。

因为以上原因,在Java中,不赞成使用Char类型,因为它并不能代表一个真正的字符,而只是代码单元,而操作中,我们往往想得到的是真正的字符,而不是代码单元char。

当然,一般我们很少遇到辅助字符(由两个代码单元组成),但还是有必要了解一下。

具体操作及区别:

String?test?=?"Hello";

长度:test.Length();???//返回代码单元的数量

? ? ? ? ?test.codePointCount(0,test.Length()); //0-length单元之间,返回代码点的数量

?

字符:

? ? test.charAt(i);??//返回第i个代码单元

?

int?index?=?test.offByCodePoint(0,i);?//返回第i个代码点的专用索引

test.codePointAt(index);?????????????//返回第i个代码点

?

遍历字符串真正字符:

int?cp?=?test.codePointAt(i);

if(Character.isSupplementaryCodePoint(cp))?i?+=?2;??//判断是否是辅助字符

else?i++;

最后,Java中除了不推荐使用char类型,也不推荐使用字符串的charAt方法!

热点排行