我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Java如何高效的读取一个超大文件

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Java如何高效的读取一个超大文件

这篇文章主要介绍“Java如何高效的读取一个超大文件”,在日常操作中,相信很多人在Java如何高效的读取一个超大文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Java如何高效的读取一个超大文件”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

前言

我最近在优化我的PDF转word的开源小工具,有时候会遇到一个问题,就是如果我的PDF文件比较大,几百兆,如何更快更节省内存的读取它。于是我分析对比了四种常见的读取文件的方式,并使用javaVisualVM工具进行了分析。最后的出的结论是commons-io时间和空间都更加的高效。研究分析依然来自哪位baeldung国外大佬。

下面我会给出几种常见的读取大文件的方式。

读取大文件的四种方式

首先我自己在本地压缩了一个文件夹,大概500M左右。虽然不是很大但是,相对还可以。

方法1:Guava读取

String path = "G:\\java书籍及工具.zip"; Files.readLines(new File(path), Charsets.UTF_8);

使用guava读取比较简单,一行代码就搞定了。

下面去jdk的bin目录找到javaVisualVM工具,然后双击运行即可。

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:20秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%

我们一个500M的文件,堆内存最高竟然2.5G,如果我们读取一个2G的文件,可能我们的电脑直接死机了就。

方式2:Apache Commons IO普通方式

String path = "G:\\java书籍及工具.zip"; FileUtils.readLines(new File(path), Charsets.UTF_8);

这种方式也比较简单,同样是一行代码。下面运行,也分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:17秒

  • 堆内存:最高2.5G

  • CPU消耗:最高50%,平稳运行25%左右

这种方式和上面那种基本上消耗差不多,肯定不是我想要的。

方式3:java文件流

FileInputStream inputStream = null; Scanner sc = null; try {      inputStream = new FileInputStream(path);      sc = new Scanner(inputStream, "UTF-8");      while (sc.hasNextLine()) {           String line = sc.nextLine();           //System.out.println(line);      }      if (sc.ioException() != null) {           throw sc.ioException();      } } finally {      if (inputStream != null) {           inputStream.close();      }      if (sc != null) {            sc.close();      } }

这种方式其实就是java中最常见的方式,然后我们运行分析一波:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:32秒,增加了一倍

  • 堆内存:最高1G,少了一半

  • CPU消耗:平稳运行25%左右

这种方式确实很优秀,但是时间上开销更大。

方式4:Apache Commons IO流

LineIterator it = FileUtils.lineIterator(new File(path), "UTF-8"); try {       while (it.hasNext()) {           String line = it.nextLine();       } } finally {      LineIterator.closeQuietly(it); }

这种方式代码看起来比较简单,所以直接运行一波吧:

Java如何高效的读取一个超大文件

从上图可以看到:

  • 时间消耗:16秒,最低

  • 堆内存:最高650M,少了一半

  • CPU消耗:平稳运行25%左右

OK,就它了,牛。

结论

通过以上的分析,我们可以得出一个结论,如果我们想要读取一个大文件,选择了错误的方式,就有可能极大地占用我的内存和CPU,当文件特别大时,会造成意向不到的问题。

因此为了去解决这样的问题,有四种常见的读取大文件的方式。通过分析对比,发现,Apache Commons IO流是最高效的一种方式。

到此,关于“Java如何高效的读取一个超大文件”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注编程网网站,小编会继续努力为大家带来更多实用的文章!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

Java如何高效的读取一个超大文件

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Java高效读取大文件实例分析

1、概述本教程将演示如何用Java高效地读取大文件。Java——回归基础。2、在内存中读取读取文件行的标准方式是在内存中读取,Guava和ApacheCommonsIO都提供了如下所示快速读取文件行的方法:Files.readLines(n
2023-05-30

python如何读取一个大于10G的txt文件

这篇文章给大家分享的是有关python如何读取一个大于10G的txt文件的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。前言用python 读取一个大于10G 的文件,自己电脑只有8G内存,一运行就报内存溢出:Me
2023-06-15

java如何读取大文件文本

Java可以使用`BufferedReader`类来读取大文件文本。`BufferedReader`类提供了一个`readLine()`方法,可以逐行读取文本文件。以下是一个读取大文件文本的示例代码:```javaimport java.i
2023-08-08

如何在 PHP 中逐行读取一个大文件

在本文中,我们将介绍在 PHP 中逐行读取一个大文件的方法。使用 fgets() 函数使用 file() 函数使用 stream_get_line() 函数在 PHP 中使用 fgets() 函数逐行读取大文件内置函数 fgets() 从一
如何在 PHP 中逐行读取一个大文件
2024-02-27

python如何流式读取数G超大文件

这篇文章将为大家详细讲解有关python如何流式读取数G超大文件,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。如何流式读取数G超大文件使用 with...open... 可以从一个文件中读取数据,这是所有
2023-06-27

Java如何读取整个文件流

在Java中,可以使用`InputStream`类来读取文件流。以下是一个示例代码,演示如何读取整个文件流并将其打印出来:```javaimport java.io.FileInputStream;import java.io.IOExce
2023-08-26

Java如何读取打开的 zip 档案中的下一个文件

Java通过ZipFile、ZipInputStream或ApacheCommonsCompress库读取ZIP档案的下一个文件。ZipFile适用于读取单个档案,ZipInputStream适用于读取多个或流中的档案,而ApacheCommonsCompress库提供高级功能。
Java如何读取打开的 zip 档案中的下一个文件
2024-04-02

利用java读取超大文件时出现内存溢出如何解决

利用java读取超大文件时出现内存溢出如何解决?很多新手对此不是很清楚,为了帮助大家解决这个难题,下面小编将为大家详细讲解,有这方面需求的人可以来学习下,希望你能有所收获。1. 传统方式:在内存中读取文件内容读取文件行的标准方式是在内存中读
2023-05-31

一个简单的Java文件读取的进度条

这篇文章主要介绍了一个简单的Java文件读取的进度条,写一个可以使用的 demo,涉及到了文件的相对路径问题,需要的朋友可以参考下
2023-05-14

如何用 Java 实现高效的文件读写操作

Java作为一门强大的编程语言,提供了多种高效的文件读写操作方式,本文将介绍使用 Java 实现高效文件读写操作的几种常见方法,并提供示例代码。
如何用 Java 实现高效的文件读写操作
2024-02-26

如何提高Android从文件中读取图像的效率

本篇文章给大家分享的是有关如何提高Android从文件中读取图像的效率,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。方法一start_time = System.current
2023-05-31

如何实现一个读取xml文件内容的类

这篇文章将为大家详细讲解有关如何实现一个读取xml文件内容的类,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一个读取xml文件内容的类 package project.util.xml;import ja
2023-06-03

java读取大文件如何防止内存泄漏

读取大文件时,可以使用以下方法来防止内存泄漏:使用缓冲流:通过缓冲流(如BufferedReader)来读取文件,可以减少内存占用,提高读取效率。分块读取:避免一次性将整个文件加载到内存中,可以分块读取文件内容,处理完一个块后再读取下一个块
java读取大文件如何防止内存泄漏
2024-04-08

java读取大文件内存溢出如何解决

在Java中,如果读取大文件时遇到内存溢出的问题,可以尝试以下几种解决方案:1. 使用缓冲区:使用BufferedReader或者BufferedInputStream来读取文件,并设置一个适当大小的缓冲区。这样可以减少每次读取的次数,从而
2023-08-25

如何在 Golang 中高效地处理大量文件读写?

如何高效处理文件读写?并发 io:利用协程并行处理文件块,提升效率。内存映射:将文件映射到进程内存,消除系统调用和文件系统操作开销。如何在 Golang 中高效地处理大量文件读写?在 Golang 项目中处理大量文件读写时,优化性能至关重
如何在 Golang 中高效地处理大量文件读写?
2024-05-16

编程热搜

目录