java使用readLine() 乱码的解决方法
这期内容当中小编将会给大家带来有关java使用readLine() 乱码的解决方法,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。
使用readLine() 乱码的解决
本人在公司开发程序遇到了读取 一行乱码
eclipse 默认为utf-8
FileInputStream f4 = new FileInputStream(new File("F:\\bb.txt"));BufferedReader bufferedReader2 = new BufferedReader(new InputStreamReader(f4));String readLine = bufferedReader2.readLine(); //会输出乱码
测试文件有两个文本文件分别为,aa.txt (UTF-8编码),bb.txt(GB2312编码)两个文件中的内容都为一个字符 中:
前提知识: utf-8中文占三个字节,GB2312中文占两个字节
测试 代码:
public class EncodeTest { @Test public void test1() throws Exception{ FileInputStream f1 = new FileInputStream(new File("F:\\aa.txt")); byte[] b1 = new byte[f1.available()]; f1.read(b1); for(byte b : b1){ System.out.println(b); } System.out.println(new String(b1)); System.out.println("++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"); FileInputStream f2 = new FileInputStream(new File("F:\\bb.txt")); byte[] b2 = new byte[f2.available()]; f2.read(b2); for(byte b : b2){ System.out.println(b); byte[] tb = new byte[]{b}; String lm = new String(tb); System.out.println("当前乱码"+lm); byte[] lm_b = lm.getBytes(); System.out.println("-----------乱码 start--------"); for(byte bn: lm_b){ System.out.println(bn); } System.out.println("-----------乱码 end--------"); } System.out.println(new String(b2,"gb2312")); System.out.println("++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"); FileInputStream f3 = new FileInputStream(new File("F:\\bb.txt")); BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(f3)); String readLine2 = bufferedReader.readLine(); byte[] b3 = readLine2.getBytes("UTF-8"); for(byte b : b3){ System.out.println(b); } System.out.println(new String(b3)); System.out.println("++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"); FileInputStream f4 = new FileInputStream(new File("F:\\bb.txt")); BufferedReader bufferedReader2 = new BufferedReader(new InputStreamReader(f4,"GB2312")); String readLine = bufferedReader2.readLine(); byte[] b4 =readLine.getBytes("UTF-8"); for(byte b : b4){ System.out.println(b); } System.out.println(new String(b4)); System.out.println("++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++"); }}
通过分析打印结果:
-28 #字节1
-72 #字节2
-83 #字节3
中 #utf-8 解码后字符为:中,没有出现乱码
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
-42 #字节1
当前乱码� #将 -42 按照utf-8 解码后的字符是乱码,然后再将乱码按照utf-8编码得到的字节如下
-----------乱码 start--------
-17
-65
-67
-----------乱码 end--------
-48 #字节2
当前乱码� ##将 -48 按照utf-8 解码后的字符是乱码,然后再将乱码按照utf-8编码得到的字节如下
-----------乱码 start--------
-17
-65
-67
-----------乱码 end--------
中 # 将 字节1: -42和字节2:-48 按照 gb2312 解码 后为字符 中
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
-17 # 这里为readline()方法没有设置使用eclipse默认编码 默认使用utf-8 (读取bb.txt)
-65
-67
-17
-65
-67
�� # 输出的中文为乱码
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
-28 #这里为readline()方法设置了编码为GB2312 读取一行文字为中 (读取bb.txt)
-72
-83
中
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
小结一下
new BufferedReader(new InputStreamReader(f4)); 默认用utf-8去解码字节,而bb.txt文件内容的字符是gb2312 所以该 中 字符在磁盘中占两个字节,而utf-8编码集中的中文占3个字节,而readline()的时候发现是两个字节,当前使用的又是utf-8,所以java底层就将这两个字节单独使用utf-8进行了解码, 每一个字节 使用utf-8编码一次为 一个char字符,所以经过utf-8将两个字节分别解码后的最终数据为两个乱码字符,
读者可以看上面的代码和打印的信息,两字符个乱码编码后的字节分别为-17 -65 -67(红色),和上面单独将一个字节用utf-8 接码后的字符再按照utf-8编码后得到的字节 -17 -65 -67(蓝色)一样,也就是说 当字节按照utf-8 解码时在utf-8编码集中找不到对应的正确的字符时就会默认作为� 输出,而� 对应的utf-8 字节 -17 -65 -67。所以当找不到对应正确的编码字符时都会按照 -17 -65 -67 对应的 字符 � 输出。
常识: 当使用 new BufferedReader(new InputStreamReader(f4),"文本源的编码") 文本源的编码一定要写。这样就不会有乱码。
调用readLine的乱码问题
readLine是一个很好用的方法,但是作为字符流的方法,确实会遇到各种关于编码方面的问题。但是用字节流来处理数据,比如说一个文本文件,要作按行处理的话,又会显得很不灵活。
下面提供的是readLine字符流指定编码方式的方法
//定义一个File对象File someFile = new File("somefile.txt");//输入流FileInputStream fis = new FileInputStream(someFile);InputStreamReader isr = new InputStreamReader(fis,"UTF-8"); //指定以UTF-8编码读入BufferedReader br = new BufferedReader(isr);//输出流FileOutputStream fos = new FileOutputStream(someFile + ".生成的文件.txt");OutputStreamWriter osw = new OutputStreamWriter(fos, "UTF-8"); //指定以UTF-8编码输出while ((line = br.readLine()) != null) {//osw.write("write something");osw.write(line);}//关闭IO流br.close();osw.close();
上述就是小编为大家分享的java使用readLine() 乱码的解决方法了,如果刚好有类似的疑惑,不妨参照上述分析进行理解。如果想知道更多相关知识,欢迎关注编程网行业资讯频道。
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341