深入java虚拟机第5章, class文件常量池中字符串类urf8格的存储格式

 2019-12-22 11:03  阅读(1079)
文章分类:JVM

java虚拟机在class文件中对应类型的常量池中使用了一种类似utf8格式的变体来存储一个常量字符串。

(这里请不要和java se的string api搞混淆,这里谈的是class文件的文件格式问题,我这里只是感觉这种方式比较节省空间,故拿出来请大家看一下。)

utf-8编码模式允许字符串中的所有unicode字符以2个字节的形式表示,而ascii码(空字符null除外)以一个字节表示。

从’\u0001’到’、’\u007f’的所有字符都使用一个字节表示。

字节0: 0 6543210

空字符null(‘\u0000’)和从’\u0080’到’\u07ff’的所有字符使用两个字节表示。

字节0:1 1 1 10 9 8 7 6

字节1:1 0 5 4 3 2 1 0

从’\u0800’到’\uffff’的所有字符使用3个字节表示。

字节0:1 1 1 15 14 13 12

字节1:1 0 11 10 9 8 7 6

字节2:1 0 5 4 3 2 1 0

点赞(1)
版权归原创作者所有,任何形式转载请联系作者; Java 技术驿站 >> 深入java虚拟机第5章, class文件常量池中字符串类urf8格的存储格式

相关推荐