我的编程空间,编程开发者的网络收藏夹
学习永远不晚

apache tika检测文件是否损坏的方法

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

apache tika检测文件是否损坏的方法

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。

将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏

maven引入如下:


<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-app</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

  如果jar包冲突时可以引入如下:


<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-core</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>org.apache.tika</groupId>
  <artifactId>tika-parsers</artifactId>
  <version>1.18</version>
</dependency>
<dependency>
  <groupId>xerces</groupId>
  <artifactId>xercesImpl</artifactId>
  <version>2.11.0</version>
</dependency>

使用tika检测文件是否损坏: 

  如果从输入流读取失败,则parse方法抛出IOException异常,从流中获取的文档不能被解析抛TikaExceptQXRvwyOion异常,处理器不能处理事件则抛SAXException异常

  当文档不能被解析时,说明文档损坏

执行过程:


public static void main(String[] args) {
    try {
      //Assume sample.txt is in your current directory
      File file = new File("D:\\测试.txt");
      boolean result = isParseFile(file);
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
 
  
  private static boolean isParseFile(File file) throws Exception {
    try {
      Tika tika = new Tika();
      String filecontent = tika.parseToString(file);
      System.out.println(filecontent);
      return true;
    } catch (TikaException e) {
      return false;
    }
  }

  输出结果:

测试数据---读取文本内容

总结

以上所述是小编给大家介绍的apache tika检测文件是否损坏的方法,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

apache tika检测文件是否损坏的方法

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

apache tika检测文件是否损坏的方法

Apache Tika用于文件类型检测和从各种格式的文件内容提取的库。 将上传文件至服务器,进行解析文件时,经常需要判断文件是否损坏。我们可以使用tika来检测文件是否损坏 maven引入如下:&l
2022-06-04

Win8系统文件损坏或丢失怎么办? Win8系统文件损坏或丢失的解决方法

解决思路:出现这种问题就需要找到所损坏的文件并对其进行修复。 解决方法:一、先看看命令文件检查器工具使用方法 1、在win8中使用组合键“CTRL+F”打开搜索,或者在开始屏幕中找到搜索并输入“CMD&
2022-06-04

ppt文件损坏修复无法读取的解决方法

这篇文章将为大家详细讲解有关ppt文件损坏修复无法读取的解决方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决方法:首先点击顶部导航栏的“文件”选项卡,在下拉列表里选择“选项”;然后找到“信任中心”,
2023-06-14

gzip压缩文件底层结构及文件损坏的修复方法是什么

本文小编为大家详细介绍“gzip压缩文件底层结构及文件损坏的修复方法是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“gzip压缩文件底层结构及文件损坏的修复方法是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知
2023-06-04

SQL Server中.BAK 文件损坏的原因及解决方法

目录SQL Server 中 .BAK 文件损坏的常见原因恢复损坏的 .bak 文件的可靠解决方案鸿萌数据恢复服务SQL Server 中 .BAK 文件损坏的常见原因以下是一些可能导致 SQL Server 中 .bak 文件损坏的原因
SQL Server中.BAK 文件损坏的原因及解决方法
2024-08-14

Win8文件损坏无法自动修复的尝试解决方法

一、检查映像是否可修复 1.扫描映像来检查损坏。在管理员命令提示符下键入以下命令: Dism /Online /Cleanup-Image /ScanHealth 这条命令将扫描全部系统文件并和官方系统文件对比,扫描计算机中的不一致情况。
2023-06-04

检测ip和port是否可连接的方法

windows cmd telnet format:telnet ip portcase:telnet 191.1.1.1 8080telnet不能加http:// telnet不支持域名 tehttp://www.cppcns.c
2022-06-04

使用Bash Shell检查文件是否存在的方法

前言 大家在工作的时候可能经常会遇到这样的需求,在类Unix系统的Bash环境下,怎样检查文件是否存在呢?既然有需求,当然就有解决的办法了,Shell中的test命令,可以用来检测文件的类型或者比较数值是否相等,该命令也能用来检查文件是否存
2022-06-04

php检测变量是否为空的方法是什么

在 PHP 中,可以使用以下方法来检测变量是否为空:使用 empty() 函数:empty() 函数可以检测变量是否为空,如果变量为 0、空字符串、null、false、空数组等情况,empty() 函数都会返回 true。例如:$var
php检测变量是否为空的方法是什么
2024-03-06

计算机中解压zip显示文件已损坏的解决方法

这篇文章将为大家详细讲解有关计算机中解压zip显示文件已损坏的解决方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。解决方法:1、双击打开已损坏的压缩包,点击页面顶部的“工具”选项卡选择“修复压缩文件”即
2023-06-15

脚本批量检测网站是否存活的方法

小编给大家分享一下脚本批量检测网站是否存活的方法,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!1. 脚本内容编写如下:#!/bin/bashurl=(www.ba
2023-06-09

计算机中win10文件或目录损坏无法读取的解决方法

这篇文章主要介绍计算机中win10文件或目录损坏无法读取的解决方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!win10系统文件或目录损坏且无法读取出现错误代码0x80070570怎么办?在复制文件的时候很多的用户
2023-06-10

Golang的方法:检测字符串是否以指定字符开头

Golang的方法:检测字符串是否以指定字符开头引言在Golang编程中,经常会遇到需要检测字符串是否以指定字符开头的情况。本文将介绍如何使用Golang的方法来实现这一功能,并附上具体的代码示例。Golang字符串处理方法Gola
Golang的方法:检测字符串是否以指定字符开头
2024-03-12

java判断文件是否为空的方法

在File类中并没有提供判断文件是否为空的方法,但可以借助length()方法的返回值进行判断。(推荐:java视频教程)length()方法定义为:public long length()如果文件不存在或文件为空时,length()方法返回0。示例代码如下:
java判断文件是否为空的方法
2018-10-04

java读取文件是否存在的方法

以下实例演示了使用 File 类的 file.exists() 方法来检测文件是否存在:import java.io.File;public class Main { public static void main(String[] args) {
java读取文件是否存在的方法
2021-05-31

win8安装驱动提示此文件可能已损坏或被篡改的解决方法

win8安装驱动提示文件哈希值不在指定的目录文件中,此文件可能已损坏或被篡改解决办法解决办法:1. 按快捷键win+R 打开运行命令2. (请先看完后面的再操作!!)运行输入 shutdown.exe /r /o /f /t 003. 点击
2022-06-04

编程热搜

目录