位置：首页-资讯-后端开发

Redis特殊数据类型HyperLogLog基数统计算法讲解

2024-04-02 19:55

短信预约 -IT技能 免费直播动态提醒

Redis HyperLogLog基数统计

HyperLogLog 是用来做基数统计的算法。

先了解下什么是基数。

比如数据集{1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为{1, 3, 5 ,7, 8}，基数(不重复元素)为5。

如果，现在需要统计一下网页的UV，那么就会涉及到去重了，这种场景就很适合用HyperLogLog。

这不就是set集合嘛？我用set来得出不重复的元素也可以呀。

没错，是可以，但是当数据量非常大的时候，你这个set是不是会占用非常大的内存呢？
如果用HyperLogLog来处理就好了，因为它计算基数所需要的空间是一定的，只要12kb，就可以计算接近 2^64 个不同元素的基数。

但是注意在这个数量级下，是会存在0.81%的错误率的，所以说具体还得看业务是否可以接受这样的错误率。
像上面说的统计UV的场景，这点错误率是可以忽略的。

一、pfadd

将所有元素参数添加到 HyperLogLog 数据结构中。

pfadd mypf 1 2 3 a b c 3 4 5 c d a

二、pfcount

返回给定 HyperLogLog 的基数估算值。

pfcount mypf

可以看到，返回的是9，也就是不重复的元素数量有9个。

三、pfmerge

将多个 HyperLogLog 合并为一个 HyperLogLog ，合并后的 HyperLogLog 的基数估算值是通过对所有给定 HyperLogLog 进行并集计算得出的。

pfmerge mypftotal mypf3 mypf4

把mypf3、mypf4合并到mypftotal 上。

以上就是Redis特殊数据类型HyperLogLog基数统计算法讲解的详细内容，更多关于Redis HyperLogLog基数统计的资料请关注编程网其它相关文章！

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

阅读原文内容投诉

Redis特殊数据类型HyperLogLog基数统计算法讲解

下载Word文档到电脑，方便收藏和打印～

下载Word文档

Redis特殊数据类型HyperLogLog基数统计算法讲解

目录

Redis HyperLogLog基数统计

一、pfadd

二、pfcount

三、pfmerge

Redis特殊数据类型HyperLogLog基数统计算法讲解

相关文章

猜你喜欢

Redis特殊数据类型HyperLogLog基数统计算法讲解

详解redis的三种特殊数据类型

简单讲解Python中的数字类型及基本的数学计算

热门标签

编程热搜

Python 学习之路 - Python

chatgpt的中文全称是什么

C/C++中extern函数使用详解

C/C++可变参数的使用

css样式文件该放在哪里

php中数组下标必须是连续的吗

Python 3 教程

Python pip包管理

ubuntu如何重新编译内核

改善Java代码之慎用java动态编译

编程资源站

2021年下半年软考高级信息系统项目管理师高频考点精选资料

2021下半年软考高级信息系统技术知识点记忆口诀精选资料

2021下半年软考《信息系统项目管理师》考试真题及答案精选资料

2021下半年软考高级考试备考攻略精选资料

2021年软考高级《信息系统项目管理师》巩固练习题汇总精选资料

2021下半年软考高级信息系统项目管理师30个易考知识点汇总精选资料

2021下半年软考高级知识点这样记，还担心记不住吗精选资料

2021年下半年软考高级考试重点汇总精选资料

2021下半年软考高级信息系统项目管理师计算公式汇总精选资料

2021年下半年软考高级《信息系统项目管理师》模拟试题精选资料

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

Redis特殊数据类型HyperLogLog基数统计算法讲解

目录

Redis HyperLogLog基数统计

一、pfadd

二、pfcount

三、pfmerge

Redis特殊数据类型HyperLogLog基数统计算法讲解

相关文章

猜你喜欢

Redis特殊数据类型HyperLogLog基数统计算法讲解

详解redis的三种特殊数据类型

简单讲解Python中的数字类型及基本的数学计算

热门标签

编程热搜

编程资源站

目录

感谢您的提交，我们服务专员将在30分钟内给您回复