我的编程空间,编程开发者的网络收藏夹
学习永远不晚

数据拷贝的基础过程是什么

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

数据拷贝的基础过程是什么

本篇内容主要讲解“数据拷贝的基础过程是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“数据拷贝的基础过程是什么”吧!

数据拷贝基础过程

在 Linux 系统内部缓存和内存容量都是有限的,更多的数据都是存储在磁盘中。

对于 Web 服务器来说,经常需要从磁盘中读取数据到内存,然后再通过网卡传输给用户:

数据拷贝的基础过程是什么

上述数据流转只是大框,接下来看看几种模式:

①仅 CPU 方式

数据拷贝的基础过程是什么

如上图:

  • 当应用程序需要读取磁盘数据时,调用 read() 从用户态陷入内核态,read() 这个系统调用最终由 CPU 来完成。

  • CPU 向磁盘发起 I/O 请求,磁盘收到之后开始准备数据。

  • 磁盘将数据放到磁盘缓冲区之后,向 CPU 发起 I/O 中断,报告 CPU 数据已经 Ready 了。

  • CPU 收到磁盘控制器的 I/O 中断之后,开始拷贝数据,完成之后 read() 返回,再从内核态切换到用户态。

②CPU&DMA 方式

数据拷贝的基础过程是什么

CPU 的时间宝贵,让它做杂活就是浪费资源。

直接内存访问(Direct Memory Access),是一种硬件设备绕开 CPU 独立直接访问内存的机制。

所以 DMA 在一定程度上解放了 CPU,把之前 CPU 的杂活让硬件直接自己做了,提高了 CPU 效率。

目前支持 DMA 的硬件包括:网卡、声卡、显卡、磁盘控制器等。

有了 DMA 的参与之后的流程发生了一些变化:

数据拷贝的基础过程是什么

最主要的变化是,CPU 不再和磁盘直接交互,而是 DMA 和磁盘交互并且将数据从磁盘缓冲区拷贝到内核缓冲区,之后的过程类似。

敲黑板:无论从仅 CPU 方式和 DMA&CPU 方式,都存在多次冗余数据拷贝和内核态&用户态的切换。

我们继续思考 Web 服务器读取本地磁盘文件数据再通过网络传输给用户的详细过程。

普通模式数据交互

一次完成的数据交互包括几个部分:系统调用 syscall、CPU、DMA、网卡、磁盘等。

数据拷贝的基础过程是什么

系统调用 syscall 是应用程序和内核交互的桥梁,每次进行调用/返回就会产生两次切换:

  • 调用 syscall,从用户态切换到内核态。

  • syscall 返回,从内核态切换到用户态。

数据拷贝的基础过程是什么

来看下完整的数据拷贝过程简图:

数据拷贝的基础过程是什么

读数据过程:

  • 应用程序要读取磁盘数据,调用 read() 函数从而实现用户态切换内核态,这是第 1 次状态切换。

  • DMA 控制器将数据从磁盘拷贝到内核缓冲区,这是第 1 次 DMA 拷贝。

  • CPU 将数据从内核缓冲区复制到用户缓冲区,这是第 1 次 CPU 拷贝。

  • CPU 完成拷贝之后,read() 函数返回实现用户态切换用户态,这是第 2 次状态切换。

写数据过程:

  • 应用程序要向网卡写数据,调用 write() 函数实现用户态切换内核态,这是第 1 次切换。

  • CPU 将用户缓冲区数据拷贝到内核缓冲区,这是第 1 次 CPU 拷贝。

  • DMA 控制器将数据从内核缓冲区复制到 socket 缓冲区,这是第 1 次 DMA 拷贝。

  • 完成拷贝之后,write() 函数返回实现内核态切换用户态,这是第 2 次切换。

综上所述:

  • 读过程涉及 2 次空间切换、1 次 DMA 拷贝、1 次 CPU 拷贝。

  • 写过程涉及 2 次空间切换、1 次 DMA 拷贝、1 次 CPU 拷贝。

可见传统模式下,涉及多次空间切换和数据冗余拷贝,效率并不高,接下来就该零拷贝技术出场了。

零拷贝技术

出现原因

我们可以看到,如果应用程序不对数据做修改,从内核缓冲区到用户缓冲区,再从用户缓冲区到内核缓冲区。

两次数据拷贝都需要 CPU 的参与,并且涉及用户态与内核态的多次切换,加重了 CPU 负担。

我们需要降低冗余数据拷贝、解放 CPU,这也就是零拷贝 Zero-Copy 技术。

解决思路

目前来看,零拷贝技术的几个实现手段包括:mmap+write、sendfile、sendfile+DMA 收集、splice 等。

数据拷贝的基础过程是什么

①mmap 方式

mmap 是 Linux  提供的一种内存映射文件的机制,它实现了将内核中读缓冲区地址与用户空间缓冲区地址进行映射,从而实现内核缓冲区与用户缓冲区的共享。

这样就减少了一次用户态和内核态的 CPU 拷贝,但是在内核空间内仍然有一次 CPU 拷贝。

数据拷贝的基础过程是什么

mmap 对大文件传输有一定优势,但是小文件可能出现碎片,并且在多个进程同时操作文件时可能产生引发 coredump 的 signal。

②sendfile 方式

mmap+write 方式有一定改进,但是由系统调用引起的状态切换并没有减少。

sendfile 系统调用是在 Linux 内核 2.1 版本中被引入,它建立了两个文件之间的传输通道。

sendfile 方式只使用一个函数就可以完成之前的 read+write 和 mmap+write 的功能,这样就少了 2  次状态切换,由于数据不经过用户缓冲区,因此该数据无法被修改。

数据拷贝的基础过程是什么

数据拷贝的基础过程是什么

从图中可以看到,应用程序只需要调用 sendfile 函数即可完成,只有 2 次状态切换、1 次 CPU 拷贝、2 次 DMA 拷贝。

但是 sendfile 在内核缓冲区和 socket 缓冲区仍然存在一次 CPU 拷贝,或许这个还可以优化。

③sendfile+DMA 收集

Linux 2.4 内核对 sendfile 系统调用进行优化,但是需要硬件 DMA 控制器的配合。

升级后的 sendfile 将内核空间缓冲区中对应的数据描述信息(文件描述符、地址偏移量等信息)记录到 socket 缓冲区中。

DMA 控制器根据 socket 缓冲区中的地址和偏移量将数据从内核缓冲区拷贝到网卡中,从而省去了内核空间中仅剩 1 次 CPU 拷贝。

数据拷贝的基础过程是什么

这种方式有 2 次状态切换、0 次 CPU 拷贝、2 次 DMA 拷贝,但是仍然无法对数据进行修改,并且需要硬件层面 DMA 的支持,并且  sendfile 只能将文件数据拷贝到 socket 描述符上,有一定的局限性。

④splice 方式

splice 系统调用是 Linux 在 2.6 版本引入的,其不需要硬件支持,并且不再限定于 socket  上,实现两个普通文件之间的数据零拷贝。

数据拷贝的基础过程是什么

splice 系统调用可以在内核缓冲区和 socket 缓冲区之间建立管道来传输数据,避免了两者之间的 CPU 拷贝操作。

数据拷贝的基础过程是什么

splice 也有一些局限,它的两个文件描述符参数中有一个必须是管道设备。

到此,相信大家对“数据拷贝的基础过程是什么”有了更深的了解,不妨来实际操作一番吧!这里是编程网网站,更多相关内容可以进入相关频道进行查询,关注我们,继续学习!

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

数据拷贝的基础过程是什么

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

C++的拷贝构造函数是什么

这篇文章主要介绍了C++的拷贝构造函数是什么,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。拷贝构造函数用以将一个类的对象拷贝给同一个类的另一个对象,比如之前学习过的strin
2023-06-29

js中基础的数据类型是什么

本篇文章为大家展示了js中基础的数据类型是什么,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。六种数据类数据类型指的是字面类型 在JS中有六种数据类型String 字符串Number
2023-06-26

ansible拷贝远程文件到本地的方法是什么

在使用Ansible拷贝远程文件到本地的方法有两种:使用`fetch`模块:在playbook中使用`fetch`模块,指定源文件路径和目标文件路径,例如:- name: Fetch file from remotehosts: tasks
2023-10-24

为什么ubuntu系统下向U盘拷贝数据提示目标是只读的

这篇文章主要介绍“为什么ubuntu系统下向U盘拷贝数据提示目标是只读的”,在日常操作中,相信很多人在为什么ubuntu系统下向U盘拷贝数据提示目标是只读的问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”为什么
2023-06-13

大数据的十个基础面试题是什么

本文小编为大家详细介绍“大数据的十个基础面试题是什么”,内容详细,步骤清晰,细节处理妥当,希望这篇“大数据的十个基础面试题是什么”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。 1、当一个对象被当作参数
2023-06-02

 Python的基础知识及数据类型是什么

今天给大家介绍一下 Python的基础知识及数据类型是什么。文章的内容小编觉得不错,现在给大家分享一下,觉得有需要的朋友可以了解一下,希望对大家有所帮助,下面跟着小编的思路一起来阅读吧。1 基础知识1.1 Python的应用方向和语言特点1
2023-06-26

MySQL关系型数据库的基础概念是什么

这篇文章主要介绍“MySQL关系型数据库的基础概念是什么”,在日常操作中,相信很多人在MySQL关系型数据库的基础概念是什么问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”MySQL关系型数据库的基础概念是什么
2023-06-20

HBase的数据迁移的过程是什么

HBase的数据迁移过程通常包括以下几个步骤:准备目标环境:首先需要准备好目标HBase集群,包括配置好HBase服务、准备好目标表的结构等。数据导出:将源HBase集群中的数据导出到一个中间数据存储中,通常可以选择使用Hadoop的Map
HBase的数据迁移的过程是什么
2024-03-11

Python基础中什么是进制和数据类型

这篇文章将为大家详细讲解有关Python基础中什么是进制和数据类型,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。一、进制1、什么是进制?进制也就是进位计数制,是人为定义的带进位的计数方法(有
2023-06-15

MongoDB数据块的迁移过程是什么

MongoDB的数据块迁移是指在数据分片集合中,当数据块需要在不同的分片之间迁移时的过程。数据块迁移通常发生在数据分片的rebalance过程中,以确保数据在各个分片之间分布均匀,避免热点数据集中在某个分片上导致负载不均衡的情况。数据块迁
MongoDB数据块的迁移过程是什么
2024-04-19

Linux数据库的存储过程是什么

在Linux上,存储过程是一组SQL语句的集合,它们被存储在数据库中并可以被调用和执行。存储过程通常用来执行一系列的操作,比如插入、更新、删除数据,并且可以接收参数进行动态操作。在Linux上,常见的数据库管理系统如MySQL、Postg
Linux数据库的存储过程是什么
2024-05-06

SpringBoot多数据源配置的过程是什么

本篇内容主要讲解“SpringBoot多数据源配置的过程是什么”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“SpringBoot多数据源配置的过程是什么”吧!前言多数据源的核心就是向 IOC 容
2023-06-25

编程热搜

目录