我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何使用brotli压缩大文件

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何使用brotli压缩大文件

本篇文章给大家分享的是有关如何使用brotli压缩大文件,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。

大文件问题

函数计算对上传的 zip 代码包尺寸限制为 50M。某些场景中代码包中会超过这一限制,比如未经裁剪的 serverless-chrome ,类似的还有 libreoffice ,此外常见的还有机器学习训练的模型文件。
目前解决大文件问题有三种方法

  1. 采用更高压缩比的算法,比如本文介绍的 brotli 算法

  2. 采用 OSS 运行时下载

  3. 采用 NAS 文件共享

简单的比较一下这三种方法的优劣

方法优点缺点
高密度压缩发布简单,启动最快上传代码包较慢;要写解压代码;大小受限制不超过 50 M
OSS下载解压后文件不超过 512 M需要预先上传至 OSS;要写下载和解压代码,大概 50M/s 的下载速度
NAS文件大小没有限制,无需压缩需要预先上传至 NAS;VPC 环境有冷启动时延(~5s)

正常情况下如果代码包能控制在 50M 以下启动较快。而且工程上也比较简单,数据和代码放在一起,不需要额外的写脚本去同步更新 OSS 或者 NAS。

压缩算法

Brotli 是 Google 工程师开发的开源压缩算法,目前已经被新版的主流浏览器支持,作为 HTTP 传输的压缩算法。下面是在网上找到的关于 Brotli 和其他常见压缩算法对比基准测试。

如何使用brotli压缩大文件
如何使用brotli压缩大文件
如何使用brotli压缩大文件
如何使用brotli压缩大文件

从上面三幅图我们可以看出:相比于 gzip、xz 和 bz2,brotli 有最高的压缩比,接近于 gzip 的解压速度,以及最慢的压缩速度。

然而在我们的场景对于压缩慢这一缺点不敏感,压缩任务只要在开发准备物料的阶段执行一次就好了。

制作压缩文件

下面我先介绍一下如何制作压缩文件。下面的代码和用例都来自于项目 packed-selenium-java-example 。

安装 brotli 命令

Mac 用户

brew install brotli

Windows 用户可以去这个界面下载,https://github.com/google/brotli/releases

打包并压缩

打包前两个文件大小分别为 7.5M 和 97M

╭─ ~/D/test1[◷ 18:15:21]╰─  lltotal 213840-rwxr-xr-x  1 vangie  staff   7.5M  3  5 11:13 chromedriver-rwxr-xr-x  1 vangie  staff    97M  1 25  2018 headless-chromium

使用 GZip 打包并压缩,大小为 44 M。

╭─ ~/D/test1[◷ 18:15:33]╰─  tar -czvf chromedriver.tar chromedriver headless-chromiuma chromedrivera headless-chromium╭─ ~/D/test1[◷ 18:16:41]╰─  lltotal 306216-rwxr-xr-x  1 vangie  staff   7.5M  3  5 11:13 chromedriver-rw-r--r--  1 vangie  staff    44M  3  6 18:16 chromedriver.tar-rwxr-xr-x  1 vangie  staff    97M  1 25  2018 headless-chromium

tar 去掉 z 选项再打包一遍,大小为 104M

╭─ ~/D/test1[◷ 18:16:42]╰─  tar -cvf chromedriver.tar chromedriver headless-chromiuma chromedrivera headless-chromium╭─ ~/D/test1[◷ 18:17:06]╰─  lltotal 443232-rwxr-xr-x  1 vangie  staff   7.5M  3  5 11:13 chromedriver-rw-r--r--  1 vangie  staff   104M  3  6 18:17 chromedriver.tar-rwxr-xr-x  1 vangie  staff    97M  1 25  2018 headless-chromium

压缩后的大小为 33M,相比 Gzip 的 44M 小了不少。耗时也非常的感人 6 分 18 秒,Gzip 只要 5 秒。

╭─ ~/D/test1[◷ 18:17:08]╰─  time brotli -q 11 -j -f chromedriver.tarbrotli -q 11 -j -f chromedriver.tar  375.39s user 1.66s system 99% cpu 6:18.21 total╭─ ~/D/test1[◷ 18:24:23]╰─  lltotal 281552-rwxr-xr-x  1 vangie  staff   7.5M  3  5 11:13 chromedriver-rw-r--r--  1 vangie  staff    33M  3  6 18:17 chromedriver.tar.br-rwxr-xr-x  1 vangie  staff    97M  1 25  2018 headless-chromium

运行时解压缩

下面以 java maven 项目为例

添加解压依赖包

<dependency>    <groupId>org.apache.commons</groupId>    <artifactId>commons-compress</artifactId>    <version>1.18</version></dependency><dependency>    <groupId>org.brotli</groupId>    <artifactId>dec</artifactId>    <version>0.1.2</version></dependency>

commons-compress 是 apache 提供的解压缩工具包,对于各种压缩算法提供一致的抽象接口,其中对于 brotli 算法只支持解压,这里足够了。org.brotli:dec 包是 Google 提供的 brotli 解压算法的底层实现。

实现 initialize 方法

public class ChromeDemo implements  FunctionInitializer {    public void initialize(Context context) throws IOException {        Instant start = Instant.now();        try (TarArchiveInputStream in =                     new TarArchiveInputStream(                             new BrotliCompressorInputStream(                                     new BufferedInputStream(                                             new FileInputStream("chromedriver.tar.br"))))) {            TarArchiveEntry entry;            while ((entry = in.getNextTarEntry()) != null) {                if (entry.isDirectory()) {                    continue;                }                File file = new File("/tmp/bin", entry.getName());                File parent = file.getParentFile();                if (!parent.exists()) {                    parent.mkdirs();                }                System.out.println("extract file to " + file.getAbsolutePath());                try (FileOutputStream out = new FileOutputStream(file)) {                    IOUtils.copy(in, out);                }                Files.setPosixFilePermissions(file.getCanonicalFile().toPath(),                        getPosixFilePermission(entry.getMode()));            }        }        Instant finish = Instant.now();        long timeElapsed = Duration.between(start, finish).toMillis();        System.out.println("Extract binary elapsed: " + timeElapsed + "ms");    }}

实现 FunctionInitializer 接口的 initialize 方法。解压过程刚开始是四层嵌套流,作用分别如下:

  1. FileInputStream 读取文件

  2. BufferedInputStream 提供缓存,介绍系统调用带来的上下文切换,提示读取的速度

  3. BrotliCompressorInputStream 对字节流进行解码

  4. TarArchiveInputStream 把 tar 包里的文件逐个解出来

然后 Files.setPosixFilePermissions 的作用是还原 tar 包中文件的权限。代码太长此处略去,参阅 packed-selenium-java-example

Instant start = Instant.now();...Instant finish = Instant.now();long timeElapsed = Duration.between(start, finish).toMillis();System.out.println("Extract binary elapsed: " + timeElapsed + "ms");

上面的代码段会打印出解压的耗时,真实执行大概在 3.7 s 左右。

最后不要忘记在 template.yml 里配置上 InitializerInitializationTimeout

以上就是如何使用brotli压缩大文件,小编相信有部分知识点可能是我们日常工作会见到或用到的。希望你能通过这篇文章学到更多知识。更多详情敬请关注编程网行业资讯频道。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何使用brotli压缩大文件

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何使用brotli压缩大文件

本篇文章给大家分享的是有关如何使用brotli压缩大文件,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。大文件问题函数计算对上传的 zip 代码包尺寸限制为 50M。某些场景中代
2023-06-04

Win10如何使用自带压缩、解压zip压缩文件功能

Windows系统自带不少工具,到了Win10,好用的功能依然保留,比如压缩/解压zip压缩文件的功能。压缩文件能为系统节省空间,这一功能必不可少。Win10如何使用压缩/解压zip压缩文件功能?Win10压缩zip功能Windows10自
2023-06-10

如何使用Python破解压缩文件

这篇文章主要介绍如何使用Python破解压缩文件,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!其实都大同小异:无非就是字典爆破,就看你是有现成密码字典,还是自己生成密码字典,然后进行循环输入密码,直到输入正确位置。现
2023-06-14

如何使用WinRar对VB.NET文件压缩

这篇文章给大家分享的是有关如何使用WinRar对VB.NET文件压缩的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。因为一些数据库文件(如Access文件)在远程传输过程中可能由于文件比较大而影响传递效果。如果进行
2023-06-17

wps如何压缩文件

这篇文章主要介绍wps如何压缩文件,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!wps压缩文件的方法:1、在wps软件中打开想要压缩的文件;2、选择点击顶部导航栏中的“工具”选项;3、在打开的菜单中点击“文件瘦身”选
2023-06-14

bandizip如何压缩文件

这篇文章主要介绍了bandizip如何压缩文件的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇bandizip如何压缩文件文章都会有所收获,下面我们一起来看看吧。bandizip压缩文件教程1、打开bandizi
2023-04-13

如何使用unzip命令解压缩文件

这篇“如何使用unzip命令解压缩文件”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“如何使用unzip命令解压缩文件”文章吧
2023-06-27

如何使用PHP进行文件的压缩和解压缩?(PHP中实现文件压缩和解压缩的常用库有哪些?)

本文介绍了使用PHP进行文件压缩和解压缩的方法,包括常用库及其优缺点。Zlib:轻量级,语法简单,提供gzip和deflate算法。BZip2:压缩率更高但速度较慢,需要PHP扩展。7-Zip:第三方库,提供各种算法,压缩率最高但速度最慢。其他库:如Phar、Rar、Tar和Gzip。选择库应考虑压缩率、速度、易用性和文件格式支持。最佳实践包括选择合适库、权衡压缩率和速度、解压缩前使用压缩文件以及妥善处理压缩文件。
如何使用PHP进行文件的压缩和解压缩?(PHP中实现文件压缩和解压缩的常用库有哪些?)
2024-04-02

如何在Linux中使用Gzip压缩和解压文件

这篇文章主要介绍“如何在Linux中使用Gzip压缩和解压文件”,在日常操作中,相信很多人在如何在Linux中使用Gzip压缩和解压文件问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”如何在Linux中使用Gz
2023-06-13

Android如何实现压缩和解压缩文件

废话不多说了,直接给大家贴java代码了,具体代码如下所示: Java代码 package com.maidong.utils; import java.io.BufferedInputStream; import java.io.Bu
2022-06-06

windows中360压缩如何压缩文件到最小

本篇内容介绍了“windows中360压缩如何压缩文件到最小”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!360压缩压缩文件到最小的方法:1
2023-07-02

ubuntu如何压缩文件夹

在Ubuntu中,可以使用以下命令压缩文件夹:1. 使用tar命令:```tar -zcvf archive.tar.gz folder_name```该命令将会创建一个名为archive.tar.gz的压缩文件,其中包含folder_na
2023-08-29

windows中winrar压缩文件如何解压

这篇“windows中winrar压缩文件如何解压”文章的知识点大部分人都不太理解,所以小编给大家总结了以下内容,内容详细,步骤清晰,具有一定的借鉴价值,希望大家阅读完这篇文章能有所收获,下面我们一起来看看这篇“windows中winrar
2023-07-04

Android应用中如何对文件进行压缩与解压缩

Android应用中如何对文件进行压缩与解压缩?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。使用场景当我们在应用的Assets目录中需要加入文件时,可以直接将源文件放入,但这样
2023-05-31

java如何解压与压缩文件夹

这篇文章将为大家详细讲解有关java如何解压与压缩文件夹,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。注意:JDK7支持设置编码设置编码格式 zipFile,zipInputStream,zipOutpu
2023-05-31

Linux中.tar.xz文件如何解压压缩

小编给大家分享一下Linux中.tar.xz文件如何解压压缩,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!安装如果系统没有xz命令,需要进行安装,安装方法非常简单
2023-06-09

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录