我的编程空间,编程开发者的网络收藏夹
学习永远不晚

java8 Stream大数据量List分批处理切割方式

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

java8 Stream大数据量List分批处理切割方式

java8 Stream大数据量List分批处理

//按每3个一组分割
private static final Integer MAX_NUMBER = 3;


private static Integer countStep(Integer size) {
    return (size + MAX_NUMBER - 1) / MAX_NUMBER;
}

public static void main(String[] args) {
      List<Integer> list = Arrays.asList(1, 2, 3, 4, 5, 6, 7);
      int limit = countStep(list.size());
      //方法一:使用流遍历操作
      List<List<Integer>> mglist = new ArrayList<>();
      Stream.iterate(0, n -> n + 1).limit(limit).forEach(i -> {
          mglist.add(list.stream().skip(i * MAX_NUMBER).limit(MAX_NUMBER).collect(Collectors.toList()));
      });

      System.out.println(mglist);

      //方法二:获取分割后的集合
      List<List<Integer>> splitList = Stream.iterate(0, n -> n + 1).limit(limit).parallel().map(a -> list.stream().skip(a * MAX_NUMBER).limit(MAX_NUMBER).parallel().collect(Collectors.toList())).collect(Collectors.toList());
      
      System.out.println(splitList);
}

使用google guava对List进行分割

//使用guava对list进行分割
List<User> users = userService.findAll();
//按每50个一组分割
List<List<User>> parts = Lists.partition(users, 50);
parts.stream().forEach(list -> {
    process(list);
});

使用apache common collection

List<Integer> intList = Lists.newArrayList(1, 2, 3, 4, 5, 6, 7, 8);
List<List<Integer>> subs = ListUtils.partition(intList, 3);

java 手写将一个List等分成n个list

public static <T> List<List<T>> averageAssign(List<T> source, int n) {
    List<List<T>> result = new ArrayList<>();
    //(先计算出余数)
    int remainder = source.size() % n;  
    //然后是商
    int number = source.size() / n;  
    //偏移量
    int offset = 0;
    for (int i = 0; i < n; i++) {
        List<T> value;
        if (remainder > 0) {
            value = source.subList(i * number + offset, (i + 1) * number + offset + 1);
            remainder--;
            offset++;
        } else {
            value = source.subList(i * number + offset, (i + 1) * number + offset);
        }
        result.add(value);
    }
    return result;
}

java8部分特性及list的常见操作

主要记录如何使用Java8中的流式处理,简洁的处理各种常见的操作。

注意:

数组转集合,体现的是适配器模式,只是转换接口,后台的数据仍是数组。所以使用集合相关的操作add、remove、clear会抛异常:UNSupportOperationException。

List<String> list = Arrays.asList("官僚","买办","资产阶级");

集合转数组,不能直接使用无参toArray()方法,该方法返回的是Object[],若强转可能会存在转换异常。带参的大小,必须要跟集合list保持一致,否则会涉及重新分配内存。

Lambda表达式

  • 格式(params) -> {expression}
  • 比如我们实现一个Runnable接口
Runnable run = new Runnable() {
    @Override
    public void run() {
        // TODO
    }
}

使用Lambda表达式:Runnable run = () -> {# TODO}

函数式接口,规范:

  • 接口中只能有一个抽象方法
  • (可选)在接口上添加@FunctionalInterface注解,这样可以检验它是否一个函数式接口

比如:

@FunctionalInterface
public interface MyFun {
    void fun();
}

//也可以使用泛型
@FunctionalInterface
public interface MyFun1<T> {
    void fun(T t);
}

使用的时候

public static void domething(MyFun myfun) {
    myfun.fun();
}

public static void domething(MyFun1<User> myFun) {
    User user = new User();
    user.setName("我是泛型");
    myFun.fun(user);
}

public static void main(String[] args) {
    domething(() -> {System.out.println("通过lambda表达式执行了函数式接口");});
    domething1((item) -> {
        item.setId(100);
        item.setAge(20);
        System.out.println("这是MyFun1函数式接口真正的执行逻辑,最终的结果是:" + JsonObject.toJsonString(item);)
    });
}

常见的list操作


List<String> arrList = Arrays.asList("买办", "资产阶级", "官僚");


List<String> list = new ArrayList<>();
list.add("买办");
list.add("官僚");
list.add("资产阶级");
// 注意:大小必须和list保持一致,若小于3,则需要重新分配内存地址,并返回新数组地址;
// 若数组元素大于所需,则下标为[list.size()]的元素置为null,其他元素为原值
// 所以最好将数组大小跟集合大小保持一致,可以验证new String[1],new String[5]的输出值
String[] arr = new String[list.size()];
arr = list.toArray(arr);
System.out.println("arr :" + Arrays.toString(arr));

// list 初始化(guava)
List<String> initList = Lists.newArrayList("Java", "Python", "Javascript");

List<User> students = new ArrayList<>();
User st1 = new User();
st1.setId(123);
st1.setAge(10);

User st2 = new User();
st2.setId(123);
st2.setAge(20);

User st3 = new User();
st3.setId(456);
st3.setAge(20);
students.add(st1);
students.add(st2);
students.add(st3);

// list 分割(guava)
List<List<User>> splits = Lists.partition(students, 2);
System.out.println("list分割:" + JsonUtil.toJSONString(splits));

// list分组
Map<Integer, List<User>> groupStu = students.stream().collect(
        Collectors.groupingBy(User::getAge));
System.out.println("list分组:" + JsonUtil.toJSONString(groupStu));

// list转map, (k,v),若集合中有重复的key,会抛异常:Duplicate key……
// 通过(k1, k2)->k1来处理重复情况,保留k1,舍弃k2
Map<Integer, Integer> studentIdMap = students.stream().collect(
        Collectors.toMap(User::getId, User::getAge, (k1, k2) -> k1));
System.out.println("list转map, (k,v) :" + studentIdMap);

// list转map, (k,t)
Map<Integer, User> studenteMap = students.stream().collect(
        Collectors.toMap(User::getId, Function.identity(), (k1, k2) -> k1));
System.out.println("list转map, (k,t) :" + studenteMap);

// list过滤
List<User> oldStu = students.stream().filter(
        student -> student.getAge() > 10).collect(Collectors.toList());
System.out.println("list过滤filter :" + JsonUtil.toJSONString(oldStu));

// list对象转换
List<Teacher> teachers = students.stream().map(
        student -> {
            Teacher teacher = new Teacher();
            BeanUtils.copyProperties(student, teacher);
            teacher.setTitle("教师");
            return teacher;
        }).collect(Collectors.toList());
System.out.println("list对象转化:" + JsonUtil.toJSONString(teachers));

// list转set
Set<Integer> ages = students.stream().map(User::getAge).collect(Collectors.toSet());
System.out.println("list转set:" + ages);

// 过滤掉空元素后再map
    public static void main(String[] args) {

        List<Customer> customerList = new ArrayList<>();
        customerList.add(new Customer(1L, "Ryu"));
        customerList.add(new Customer(2L, "Ken"));
        customerList.add(new Customer(3L, null));
        customerList.add(null);
        customerList.add(new Customer(5L, null));
        customerList.add(new Customer(6L, "Zangief"));
        
        
        List<String> nameList1 = customerList.stream()
                .filter(Objects::nonNull) // 過濾掉Customer為null的元素
                .map(e -> e.getName())    
                .filter(Objects::nonNull) // 過濾掉Customer.getName()為null的元素
                .collect(Collectors.toList());
        
        
        System.out.println(nameList1); // [Ryu, Ken, Zangief]
        
    }

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

java8 Stream大数据量List分批处理切割方式

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

java8 Stream大数据量List分批处理切割方式

这篇文章主要介绍了java8 Stream大数据量List分批处理切割方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
2023-02-15

Mybatis集成MySQL使用游标查询处理大批量数据方式

MyBatis集成MySQL游标查询,通过将结果集保留在数据库中,减少网络开销,延迟结果集处理和处理大数据集。优点包括减少网络消耗、分批处理和轻量化资源消耗。缺点包括潜在锁定、资源占用和复杂性。使用步骤涉及建立、打开、获取和关闭游标。MyBatis集成需要创建游标、配置连接和使用SqlSession创建游标。示例代码演示了如何使用游标查询。注意事项强调及时关闭游标、性能优化和使用批处理模式。
Mybatis集成MySQL使用游标查询处理大批量数据方式
2024-04-02

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录