首页
社区
课程
招聘
[转帖]JAVA中的字符集
发表于: 2011-9-15 22:51 6783

[转帖]JAVA中的字符集

2011-9-15 22:51
6783
编码的原因可以总结为:
1. 计算机中存储信息的最小单元是一个字节即 8 个 bit,所以能表示的字符范围是 0~255 个
2. 人类要表示的符号太多,无法用一个字节来完全表示
3. 要解决这个矛盾必须需要一个新的数据结构 char,从 char 到 byte 必须编码

计算中提拱了多种翻译方式,常见的有 ASCII、ISO-8859-1、GB2312、GBK、UTF-8、UTF-16 等。它们都可以被看作为字典,它们规定了转化的规则,按照这个规则就可以让计算机正确的表示我们的字符。目前的编码格式很多,例如 GB2312、GBK、UTF-8、UTF-16 这几种格式都可以表示一个汉字,那我们到底选择哪种编码格式来存储汉字呢?这就要考虑到其它因素了,是存储空间重要还是编码的效率重要。根据这些因素来正确选择编码格式。

在JAVA的NIO中,最重要的一点是引入了字符集Charset。这样的话,就可以在不同类型的字符集进行转换,非常的方便。在附件里面,是两个ibm文档库的文章,感觉写得挺好的。对于理解字符集很有帮助。

java.nio.charset 包中有三个类帮助进行这种映射: Charset 、 CharsetEncoder 和 CharsetDecoder 。

[招生]科锐逆向工程师培训(2024年11月15日实地,远程教学同时开班, 第51期)

上传的附件:
收藏
免费 0
支持
分享
最新回复 (1)
雪    币: 90
活跃值: (91)
能力值: ( LV2,RANK:10 )
在线值:
发帖
回帖
粉丝
2
三克油为了马骑
2011-9-16 09:24
0
游客
登录 | 注册 方可回帖
返回
//