我的编程空间,编程开发者的网络收藏夹
学习永远不晚

CentOS下使用LibreOffice实现文档格式的转换方式

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

CentOS下使用LibreOffice实现文档格式的转换方式

项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。

先是试了一下phpoffice/phpword这个包,发现其对doc的转换很不理想,这个包更适合用来根据内容生成文档,而不是转换文档,不是太适合我这种需求。

然后发现了LibreOffice这个开源工具,经过使用,效果很好,分享一下。

服务器是CentOS7,直接使用yum安装LibreOffice,大概需要600MB+ 的磁盘空间:


# 装之前可以先删除一下,防止之前装过
yum remove libreoffice-*
yum install libreoffice

等待安装完成后,确认一下版本啥的,虽然官方已经到6.1版本了,yum里面还是5.3.6的包,不过用起来并没有什么毛病,在这里我还是建议大家使用各自的linux系统的包管理工具来安装,这样可以省去很多麻烦的。


[root@localhost /]# soffice --version
LibreOffice 5.3.6.1 30(Build:1)

不会用的话可以使用soffice --help看一下帮助,非常多的参数和使用案例,转换格式就很简单:


soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source

以上的命令就是将/opt/upload/source/123.doc文件转换成docx格式,输出到/opt/upload/source文件夹里。

默认情况下mebtVNPN

  1. 会使用源文件名+新的扩展名保存输出文件;
  2. 会覆盖outdir里已经有的同名文件;

转换成功会输出类似这样的:


convert /opt/upload/source/123.doc -> /opt/upload/source/123.docx using filter : MS Word 2007 XML
Overwriting: /opt/upload/source/123.docx

LibreOffice会根据文件格式自动匹配格式过滤器(filter),至于它支持哪些格式,可以参考一下官网。

总结

以上所述是小编给大家介绍的CentOS下使用LibreOffice实现文档格式的转换方式,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对我们网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

CentOS下使用LibreOffice实现文档格式的转换方式

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

CentOS下使用LibreOffice实现文档格式的转换方式

项目需求,对上传的文档进行一些预处理,如果用户上传了doc格式的文档,需要将其处理为docx或者pdf格式,以便后续的流程对文档内容进行提取。 先是试了一下phpoffice/phpword这个包,发现其对doc的转换很不理想,这个包更适合
2022-06-04

怎么使用pandoc将Markdown转换为格式化文档

小编给大家分享一下怎么使用pandoc将Markdown转换为格式化文档,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!基本转换首先,在你的计算机上安装 pando
2023-06-16

利用Golang和FFmpeg实现视频格式转换的方法

要利用Golang和FFmpeg实现视频格式转换的方法,你可以按照以下步骤进行操作:1. 安装FFmpeg:首先需要在计算机上安装FFmpeg。你可以从FFmpeg官方网站(https://ffmpeg.org/)下载适合你操作系统的二进制
2023-10-08

Python实现将HTML转换成doc格式文件的方法示例

本文实例讲述了Python实现将HTML转换成doc格式文件的方法。分享给大家供大家参考,具体如下: 网页上的一些文章,因为有格式的原因,它们在网页上的源码都是带有html标签的,用css来进行描述。本文利用HTML Parser 和doc
2022-06-04

实用指南:PHP中实现JSON Unicode到中文的转换方式

在PHP中实现JSON Unicode到中文的转换是一个常见的需求,特别是在处理来自前端传递的包含Unicode编码的JSON数据时。在本文中,我们将详细介绍如何使用PHP将Unicode编码的JSON字符串转换为中文,同时提供具体的代码示
实用指南:PHP中实现JSON Unicode到中文的转换方式
2024-03-05

linux命令实现音频格式转换和拼接的方法

安装FFmpeg flaceric@ray:~$ sudo apt install FFmpeg flac安装lame faaceric@ray:~$ sudo apt install lame faac将一个后缀为.ape格式的视频转换成
2022-06-04

Go语言中实现将PDF文件转换为Word文档的实用方法

Go语言实现PDF转Word文档的实用方法前言PDF和Word是两种常用的文档格式,在不同的场景下有不同的用途。PDF格式的文档具有跨平台兼容性好、安全性高、易于存储和传输等优点,而Word格式的文档则具有可编辑性强、易于修改和格式化等
Go语言中实现将PDF文件转换为Word文档的实用方法
2024-01-31

python 使用GDAL实现栅格tif转矢量shp的方式小结

前言目前有一张tif格式的栅格影像,需要在web地图上进行展示,使用动态切片WMS的方式,渲染速度比较慢,而且大的时候会出现模糊的问题。并且后面需要做多期影像的切换,渲染与加载效率也值得关注。计划是使用栅格转矢量的方式,将栅格数据转为矢量s
2022-06-02

Python使用正则表达式实现文本替换的方法

本文实例讲述了Python使用正则表达式实现文本替换的方法。分享给大家供大家参考,具体如下: 2D客户端编程从某种意义上来讲就是素材组织,所以,图片素材组织经常需要批量处理,python一定是最佳选择,不管是win/linux/mac都有一
2022-06-04

编程热搜

目录