购物资讯
前文《为什么 String 要设计成 final ,又如何设计一个不可变类呢?》留下了一个编码相关的问题,Java 中理论说是一个字符(汉字 字母)占用两个字节。但是在 UTF-8 的时候 new String("字").getBytes().length 返回的是3 表示3个字节,知道是为什么吗,Java 中 char 占多少字节? 在回答这个问题之前,让我们先学习一点基础知识吧。 字符( Character )是文字与符号的总称,包括文字、图形符号、数学符号等。 一组抽象字符的集合就是字符集( Charset )。 之所以说“抽象”二字,是因为这里所提及的字符是不具任何具体形式的字符。例如“汉”这个字符,在文章中看到这个“汉”字,这其实是这个字符的一种具体表现形式,是它的图像表现形式,当人们读“汉”这个字的时候,他们使用的是另一个具体表现形式---声音。但是无论如何,这两个表现形式都是 ...