我的编程空间,编程开发者的网络收藏夹
学习永远不晚

java 实现读取 word 文件文字内容信息

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

java 实现读取 word 文件文字内容信息

【需求】

最近项目中有一个需求,需要实现 java 读取上传的 word 文件的内容

【实现方法】

现有一文档内容如下:
在这里插入图片描述

实现代码如下:

  1. 引入依赖:

    <dependency>    <groupId>org.apache.poigroupId>    <artifactId>poi-ooxmlartifactId>    <version>4.1.2version>dependency><dependency>    <groupId>org.apache.poigroupId>    <artifactId>poi-scratchpadartifactId>    <version>4.1.2version>dependency>
  2. 编写工具类如下:

    public class WordUtil {    public static String readDocContent(String wordPath) throws Exception {        String content = "";        if (wordPath.endsWith(".doc")) {            FileInputStream fileInputStream = new FileInputStream(new File(wordPath));            // 获取单词提取器            WordExtractor wordExtractor = new WordExtractor(fileInputStream);            content = wordExtractor.getText();            wordExtractor.close();        } else if (wordPath.endsWith(".docx")) {            OPCPackage opcPackage = POIXMLDocument.openPackage(wordPath);            // 获得文本提取器            POIXMLTextExtractor textExtractor = new XWPFWordExtractor(opcPackage);            content = textExtractor.getText();            textExtractor.close();        } else {            throw new SysException("此文件不是 word 文件");        }        return content;    }        public static String readDocContent(InputStream inputStream, String fileName) throws IOException {        String content = "";        if (fileName.endsWith(".doc")) {            // 获取单词提取器            WordExtractor wordExtractor = new WordExtractor(inputStream);            content = wordExtractor.getText();            wordExtractor.close();        } else if (fileName.endsWith(".docx")) {            XWPFDocument xwpfDocument = new XWPFDocument(inputStream);            // 获得文本提取器            POIXMLTextExtractor textExtractor = new XWPFWordExtractor(xwpfDocument);            content = textExtractor.getText();            textExtractor.close();        } else {            throw new SysException("此文件不是 word 文件");        }        return content;    }}
  3. 编写测试类进行测试:

    @Testpublic void testReadDoc() {    String wordPath = "C:\\Users\\Administrator\\Desktop\\ktest.docx";    // 根据文件路径获取内容    try {        String content = WordUtil.readDocContent(wordPath);        System.err.println(content);    } catch (Exception e) {        throw new RuntimeException(e);    }// 根据输入流获取内容    try {        String content2 = WordUtil.readDocContent(new FileInputStream(wordPath), "ktest.docx");        System.err.println(content2);    } catch (IOException e) {        throw new RuntimeException(e);    }}

    运行输出结果如下:
    在这里插入图片描述

来源地址:https://blog.csdn.net/weixin_44117737/article/details/131451747

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

java 实现读取 word 文件文字内容信息

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

Java实现读取TXT和CSV文件内容

这篇文章主要为大家详细介绍了如何利用Java语言实现读取TXT和CSV文件内容的功能,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
2023-02-08

java如何读取word文档表格内容

要读取Word文档中的表格内容,可以使用Apache POI库来处理Word文档。以下是一个简单的示例代码,演示如何读取Word文档中的表格内容:```import org.apache.poi.xwpf.usermodel.*;impor
2023-09-22

java怎么读取json文件内容

在Java中,可以使用JSON库来读取JSON文件内容。以下是使用Jackson库进行JSON文件读取的示例代码:javaimport com.fasterxml.jackson.databind.ObjectMapper;import j
2023-10-18

java怎么读取excel文件内容

可以使用Apache POI库来读取Excel文件内容。首先,你需要下载并导入Apache POI库。你可以在官方网站(https://poi.apache.org/)上找到所需的JAR文件。将JAR文件添加到你的项目中。以下是一个简单的例
2023-09-20

如何读取html文件中的文字内容

要读取 html 文件中的文字内容,请执行以下步骤:加载 html 文件解析 html使用 text 属性或 get_text() 方法提取文本可选:清理文本(删除空白、特殊字符和转换小写)输出文本(打印、写入文件等)如何读取 HTML 文
如何读取html文件中的文字内容
2024-04-11

TXT文件的内容如何利用Java实现读取

本篇文章为大家展示了TXT文件的内容如何利用Java实现读取,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。Java读取txt文件内容。可以作如下理解:首先获得一个文件句柄。File file = n
2023-05-31

怎么用Python对Word文件内容进行读取

今天小编给大家分享一下怎么用Python对Word文件内容进行读取的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。利用 pyt
2023-06-30

java怎么读取文件并修改文件内容

要读取和修改文件内容,可以使用Java中的File类和FileInputStream、FileOutputStream类。首先,使用File类来创建文件对象,指定要读取和修改的文件路径:File file = new File("文件路
java怎么读取文件并修改文件内容
2024-02-29

java怎么逐行读取文件内容

在Java中,我们可以使用BufferedReader类来逐行读取文件内容。以下是一个示例代码:import java.io.BufferedReader;import java.io.FileReader;import java.i
java怎么逐行读取文件内容
2024-03-05

python怎么实现循环读取文件内容

可以使用open()函数打开文件,并使用read()函数循环读取文件内容。以下是一个示例代码:with open("file.txt", "r") as file:for line in file:# 每次循环读取文件中的一行内容prin
python怎么实现循环读取文件内容
2024-02-29

Android 读取文件内容实现方法总结

Android 读取文件内容实现方法,这里整理了几种方法,大家需要可以看下。 如果要打开存放在/data/data//files目录应用私有的文件,可以使用Activity提供openFileInput()方法。
2022-06-06

node.js实现逐行读取文件内容的代码

在此之前先介绍一个逐行读取文件内容NPM:https://github.com/nickewing/line-reader,需要的朋友可以看看。 直接上代码:function readLines(input, func) {var rema
2022-06-04

Java中如何对文件进行遍历并读取内容?(在Java中,如何实现文件的遍历并读取其中的内容?)

本文详细介绍Java中文件遍历和读取内容的方法。包括使用Files.walk()遍历文件系统,按模式过滤遍历结果,以及使用缓冲区读取器和字符流读取文件内容。通过示例代码展示了每种方法的使用,可供参考学习。
Java中如何对文件进行遍历并读取内容?(在Java中,如何实现文件的遍历并读取其中的内容?)
2024-04-02

java怎么读取文件内容并写入到另一文件

在Java中,可以使用`FileReader`和`BufferedReader`来读取文件内容,并使用`FileWriter`和`BufferedWriter`来写入到另一个文件。下面是一个示例代码,演示了如何读取一个文件的内容,并将其写入
2023-09-20

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录