网站站群怎么做,做网站html,云南人参果,吉林省住房城乡建设网站在notepad中用utf8格式保存“你好”两个汉字#xff0c;文件名为a.txt.在eclipse中设置编码格式为gbk.在eclipse中用FileReader读取这个文件。FileReader的read方法返回的为int型#xff0c;用char做强制转换。结果出现乱码#xff0c;第一个乱码为“浣”。由于a.txt中的编码… 在notepad中用utf8格式保存“你好”两个汉字文件名为a.txt. 在eclipse中设置编码格式为gbk.在eclipse中用FileReader读取这个文件。FileReader的read方法返回的为int型用char做强制转换。结果出现乱码第一个乱码为“浣”。 由于a.txt中的编码格式为utf8故在硬盘中你保存为1110 01001011 11011010 0000.由于eclipse的格式为gbk每个gbk字符占两个字节。故以gbk格式读取时1110 01001011 1101(0xE4BD)被解读为gbk格式的“浣”。又因为java的字符串在内存中以unicode表示,故做了一次编码转换。这个浣读入内存后采用unicode表示具体表示为0x6D63. 最后FileReader的read方法返回的int型数值是浣unicode编码也就是0x6D63的十进制形式。用char强转之后依然是“浣”。 用char进行强转时总是会试图用unicode格式去解码。例如不论eclipse的编码格式是什么(char)28003永远输出的是浣因为“浣”的unicode编码为0x6D63而28003转换为十六进制也是0x6D63。