我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Java多线程并发编程提高数据处理效率是多少

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Java多线程并发编程提高数据处理效率是多少

本文小编为大家详细介绍“Java多线程并发编程提高数据处理效率是多少”,内容详细,步骤清晰,细节处理妥当,希望这篇“Java多线程并发编程提高数据处理效率是多少”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。

    工作场景中遇到这样一个需求:根据主机的 IP 地址联动更新其他模型的相关信息。需求很简单,只涉及一般的数据库联动查询以及更新操作,然而在编码实现过程中发现,由于主机的数量很多,导致循环遍历查询、更新时花费很长的时间,调用一次接口大概需要 30-40 min 时间才能完成操作。

    因此,为了有效缩短接口方法的执行时间,便考虑使用多线程并发编程方法,利用多核处理器并行执行的能力,通过异步处理数据的方式,便可以大大缩短执行时间,提高执行效率。

    这里使用可重用固定线程数的线程池 FixedThreadPool,并使用 CountDownLatch 并发工具类提供的并发流程控制工具作为配合使用,保证多线程并发编程过程中的正常运行:

    • 首先,通过 Runtime.getRuntime().availableProcessors() 方法获取运行机器的 CPU 线程数,用于后续设置固定线程池的线程数量。

    • 其次,判断任务的特性,如果为计算密集型任务则设置线程数为 CPU 线程数+1,如果为 IO 密集型任务则设置线程数为 2 * CPU 线程数,由于在方法中需要与数据库进行频繁的交互,因此属于 IO 密集型任务。

    • 之后,对数据进行分组切割,每个线程处理一个分组的数据,分组的组数与线程数保持一致,并且还要创建计数器对象 CountDownLatch,调用构造函数,初始化参数值为线程数个数,保证主线程等待所有子线程运行结束后,再进行后续的操作。

    • 然后,调用 executorService.execute() 方法,重写 run 方法编写业务逻辑与数据处理代码,执行完当前线程后记得将计数器减1操作。最后,当所有子线程执行完成后,关闭线程池。

    在省略工作场景中的业务逻辑代码后,通用的处理方法示例如下所示:

    public ResponseData updateHostDept() {// ...List<Map> hostMapList = mongoTemplate.find(query, Map.class, "host");        // split the hostMapList for the following multi-threads task        // return the number of logical CPUs        int processorsNum = Runtime.getRuntime().availableProcessors();        // set the threadNum as 2*(the number of logical CPUs) for handling IO Tasks,        // if Computing Tasks set the threadNum as (the number of logical  CPUs) + 1        int threadNum = processorsNum * 2;          // the number of each group data         int eachGroupNum = hostMapList.size() / threadNum;         List<List<Map>> groupList = new ArrayList<>();        for (int i = 0; i < threadNum; i++) {            int start = i * eachGroupNum;            if (i == threadNum - 1) {                int end = mapList.size();                groupList.add(hostMapList.subList(start, end));            } else {                int end = (i+1) * eachGroupNum;                groupList.add(hostMapList.subList(start, end));            }        }        // update data by using multi-threads asynchronously        ExecutorService executorService = Executors.newFixedThreadPool(threadNum/2);        CountDownLatch countDownLatch = new CountDownLatch(threadNum);        for (List<Map> group : groupList) {            executorService.execute(()->{                try {                    for (Map map : group) {                    // update the data in mongodb                    }                } catch (Exception e) {                    e.printStackTrace();                } finally {                // let counter minus one                     countDownLatch.countDown();                  }            });        }        try {        // main thread donnot execute until all child threads finish            countDownLatch.await();          } catch (Exception e) {            e.printStackTrace();        }        // remember to shutdown the threadPool        executorService.shutdown();          return ResponseData.success();}

    那么在使用多线程异步更新的策略后,从当初调用接口所需的大概时间为 30-40 min 下降到了 8-10 min,大大提高了执行效率。

    需要注意的是,这里使用的 newFixedThreadPool 创建线程池,它有一个缺陷就是,它的阻塞队列默认是一个无界队列,默认值为 Integer.MAX_VALUE 极有可能会造成 OOM 问题。因此,一般可以使用 ThreadPoolExecutor 来创建线程池,自己可以指定等待队列中的线程个数,避免产生 OOM 问题。

    public ResponseData updateHostDept() {// ...List<Map> hostMapList = mongoTemplate.find(query, Map.class, "host");        // split the hostMapList for the following multi-threads task        // return the number of logical CPUs        int processorsNum = Runtime.getRuntime().availableProcessors();        // set the threadNum as 2*(the number of logical CPUs) for handling IO Tasks,        // if Computing Tasks set the threadNum as (the number of logical  CPUs) + 1        int threadNum = processorsNum * 2;          // the number of each group data         int eachGroupNum = hostMapList.size() / threadNum;         List<List<Map>> groupList = new ArrayList<>();        for (int i = 0; i < threadNum; i++) {            int start = i * eachGroupNum;            if (i == threadNum - 1) {                int end = mapList.size();                groupList.add(hostMapList.subList(start, end));            } else {                int end = (i+1) * eachGroupNum;                groupList.add(hostMapList.subList(start, end));            }        }        // update data by using multi-threads asynchronously        ThreadPoolExecutor executor = new ThreadPoolExecutor(5, 8, 30L, TimeUnit.SECONDS,                 new ArrayBlockingQueue<>(100));        CountDownLatch countDownLatch = new CountDownLatch(threadNum);        for (List<Map> group : groupList) {            executor.execute(()->{                try {                    for (Map map : group) {                    // update the data in mongodb                    }                } catch (Exception e) {                    e.printStackTrace();                } finally {                // let counter minus one                     countDownLatch.countDown();                  }            });        }        try {        // main thread donnot execute until all child threads finish            countDownLatch.await();          } catch (Exception e) {            e.printStackTrace();        }        // remember to shutdown the threadPool        executor.shutdown();          return ResponseData.success();}

    在上述的代码中,核心线程数和最大线程数分别为 5 和 8,并没有设置的很大的值,因为如果如果设置的很大,线程间频繁的上下文切换也会增加时间消耗,反而不能最大程度上发挥多线程的优势。至于如何选择合适的参数,需要根据机器的参数以及任务的类型综合考虑决定。

    最后补充一点,如果想要通过非编码的方式获取机器的 CPU 线程个数也很简单,windows 系统通过任务管理器,选择 “性能”,便可以查看 CPU 线程个数的情况,如下图所示:

    Java多线程并发编程提高数据处理效率是多少

    从上图可以看到,我的机器中内核是八个 CPU,但是通过超线程技术一个物理的 CPU 核心可以模拟成两个逻辑 CPU 线程,因此我的机器是支持8核16线程的。

    读到这里,这篇“Java多线程并发编程提高数据处理效率是多少”文章已经介绍完毕,想要掌握这篇文章的知识点还需要大家自己动手实践使用过才能领会,如果想了解更多相关内容的文章,欢迎关注编程网行业资讯频道。

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    Java多线程并发编程提高数据处理效率是多少

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    Java多线程并发编程提高数据处理效率是多少

    本文小编为大家详细介绍“Java多线程并发编程提高数据处理效率是多少”,内容详细,步骤清晰,细节处理妥当,希望这篇“Java多线程并发编程提高数据处理效率是多少”文章能帮助大家解决疑惑,下面跟着小编的思路慢慢深入,一起来学习新知识吧。工作场
    2023-07-05

    Java 多线程并发编程提高数据处理效率的详细过程

    这篇文章主要介绍了Java 多线程并发编程提高数据处理效率,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2023-05-14

    Java中多线程下载图片并压缩能不能提高效率

    小编给大家分享一下Java中多线程下载图片并压缩能不能提高效率,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!前言需求 导出Excel:本身以为是一个简单得导出,但
    2023-06-20

    java多线程并发处理的方法是什么

    Java多线程并发处理的方法有以下几种:1. 继承Thread类:创建一个继承自Thread类的子类,重写run方法来定义线程需要执行的任务,然后创建该子类的对象并调用start方法启动线程。2. 实现Runnable接口:创建一个实现了R
    2023-08-24

    PHP7中对多线程编程的支持:如何利用多核处理器提高代码的并发性?

    PHP7是一种高级的编程语言,已经为软件开发人员带来了许多令人兴奋的功能和性能提升。其中一个重要的改进是对多线程编程的支持。多线程编程允许开发人员在多个线程上同时执行代码,以利用多核处理器的优势,从而提高代码的并发性和执行效率。在本文中,我
    2023-10-22

    java多线程批量处理数据的方法是什么

    Java中处理批量数据的方法有以下几种:1. 使用线程池:创建一个线程池,将任务拆分为多个子任务,然后将子任务交给线程池中的线程进行处理。线程池会自动管理线程的创建和销毁,可以控制并发执行的线程数量,提高处理效率。2. 使用多线程并发处理:
    2023-09-27

    Golang多线程排序实现快速高效地处理大规模数据

    Golang多线程排序是一种快速高效地处理大规模数据的方法,通过使用Golang的协程和通道,可以将排序任务分配到多个线程中并行处理,提高了排序的效率和速度,需要详细了解可以参考下文
    2023-05-19

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录