我的编程空间,编程开发者的网络收藏夹
学习永远不晚

HiveSQL分位数函数percentile()使用详解+实例代码

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

HiveSQL分位数函数percentile()使用详解+实例代码

前言

作为数据分析师每个SQL数据库的函数以及使用技能操作都得点满,尤其是关于统计函数的使用方法。关于统计出数据的中位数,众数和分位数的方法必须掌握几种,一般在实际业务上大部分都是以写SQL查询为主,因为如果想用Python的Pandas去做数据分析还得将数据导出来读出来,输出了结果还得再倒进去,十分的麻烦。若是能在SQL上面直接处理简单问题,那么效率要远高于导出做Pandas处理。本篇文章主要介绍percentile分位数函数使用方法,后几篇文章将主要详解每个SQL中统计函数的使用方法,感兴趣觉得帮助大的朋友可以关注。本篇博客博主将长期维护,若有错误请在评论区指出。

HiveSQL中关于分位数的计算主要是通过percentile()percentile_approx() 这两个函数来实现。

一、percentile()

函数使用语法:

percentile(col, p)

参数说明:
col:指定需要计算的列名,并且列的值必须为int类型。.

p:指定得到的分位数数值,取值范围为[0,1],若为0.5则为中位数,若为0.75则为四分之三分位数,依此类推。

示例使用:

SELECT percentile(num,0.2) as two_parts#取二分位数FROM dbbasename.table

另外还可以已数列的方式输入p,则也回返回一个数列,包含其输入数列对应的百分位数:

SELECT percentile(num,array(0.2,0.4,0.6)) as parts#取二分位数FROM dbbasename.table

二、percentile_approx()

函数使用语法:

percentile_approx(DOUBLE col,p,B) 

求近似的第p个百分位数,p必须介于0和1之间,返回类型为double,但是col字段支持浮点类型。参数B控制内存消耗的近似精度,B越大,结果的精度越高。默认值为10000。当col字段中的distinct值的个数小于B时,结果就为准确的百分位数。

SELECT percentile_approx(num,0.2,9999) as two_parts#取二分位数FROM dbbasename.table

当然一样也能输出数列:

SELECT percentile_approx(num,array(0.25,0.5,0.75)) as parts#取二分位数FROM dbbasename.table

来源地址:https://blog.csdn.net/Huangjiazhen711/article/details/127984771

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

HiveSQL分位数函数percentile()使用详解+实例代码

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

PHP函数使用实例代码分析

今天小编给大家分享一下PHP函数使用实例代码分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。PHP检测IP是否内网地址、保
2023-07-05

C++ 函数继承详解:如何使用虚函数实现代码复用?

函数继承允许派生类继承并重用基类的函数。通过使用虚函数,可以实现代码复用,其中派生类可以覆盖基类的同名函数,并根据调用对象类型动态执行不同的函数版本。C++ 函数继承详解:如何使用虚函数实现代码复用引言函数继承是面向对象编程 (OOP)
C++ 函数继承详解:如何使用虚函数实现代码复用?
2024-05-04

Express框架详解app函数使用实例

这篇文章主要为大家介绍了Express框架app函数使用实例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2023-03-03

MySQL中substr函数使用方法实例详解

目录前言1. SUBSTR 函数简介2. SUBSTR 函数的基本语法3. SUBSTR 函数的使用示例3.1 提取子字符串3.2 从特定位置开始提取3.3 提取特定长度的子字符串3.4 在实际应用中的示例示例 1:从电子邮件地址中提取域名
MySQL中substr函数使用方法实例详解
2024-08-09

C++使用宏函数实现单例模板详解

在我们日常开发中,无可避免需要使用单例模式进行设计类对象。这篇文章主要介绍了如何使用宏函数实现单例模板,感兴趣的小伙伴可以了解一下
2023-02-10

PHP随机数生成代码与使用实例分析

在PHP程序设计中,随机数的生成尤为重要。我们需要用随机数在我们的页面中展示随机记录(比如图片、用户记录、文章ID等)。
2022-11-21

C++ 虚拟函数实战应用:代码示例与解疑

虚拟函数允许在派生类中覆盖基类函数,在运行时根据对象类型调用适当函数:创建虚拟函数:基类中使用 virtual 关键字声明函数。覆盖虚拟函数:派生类中使用 override 关键字覆盖基类虚拟函数。实战调用:通过基类指针或引用指向派生类对象
C++ 虚拟函数实战应用:代码示例与解疑
2024-04-29

Android使用OKHTTP解析JSON数据的实例代码

为了代码重用,我们首先封装一个类。这个类是HttpUtilHttpUtil.javapackage com.example.asus.networktest; import okhttp3.OkHttpClient;import okhtt
2023-05-31

Node.js全局可用变量、函数和对象实例代码分析

今天小编给大家分享一下Node.js全局可用变量、函数和对象实例代码分析的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。前言在
2023-07-05

C++ 函数继承详解:如何使用继承实现代码解耦和模块化?

函数继承是一种 c++++ 机制,可通过派生新函数从基类覆盖函数,实现代码解耦和模块化。好处包括:代码解耦:分离基类和派生类的代码。模块化:将功能分解为单个模块,提高可重用性。可扩展性:在不修改原有代码的情况下添加新功能。代码重用:可在子类
C++ 函数继承详解:如何使用继承实现代码解耦和模块化?
2024-05-03

c++使用单例模式实现命名空间函数案例详解

这篇文章主要介绍了c++使用单例模式实现命名空间函数,本案例实现一个test命名空间,此命名空间内有两个函数,分别为getName()和getNameSpace(),本文结合实例代码给大家讲解的非常详细,需要的朋友可以参考下
2023-05-17

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录