我的编程空间,编程开发者的网络收藏夹
学习永远不晚

三分钟,看回归分析模型怎么做

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

三分钟,看回归分析模型怎么做

本文转载自微信公众号「码工小熊」,作者小熊妹  。转载本文请联系码工小熊公众号。

大家好,我是爱学习的小xiong熊妹。

总有小伙伴想看分析模型,我们就从最简单的回归分析模型讲起。回归分析是所有分析模型里最浅显,最容易懂的,并且回归分析有很多变化形态,能适用于很多问题场景。今天就一起来看一下。

一、为什么叫回归?

回归翻译自:regression,最初是统计学家们,关注到:孩子的身高总会向平均身高靠近,即使父母都很高,孩子也不会无限长高下去。从这些研究里,总结出回归分析方法(regression,还有一个意思是:退化,可以说很形象了)。

所以,这里的“回归”只是一个习惯称呼,和业务部门口中的“回归初心”“回归原点”一毛钱关系都没有!在讨论问题的时候,业务部门最喜欢扯“回归”,做数据的小伙伴们,千万别被绕进去了!!!

二、回归模型有什么用?

回归模型是用来做:预测的。

在数据分析里,预测分两种:

  • 连续型预测:比如预计销售额是3550万,预测客户15万,预测结果是一个连续型数字。
  • 分类预测:比如预计用户接电话/不接电话,预计新品上市后是A级/B级/C级,预测结果不是一个连续型数字,而是一个分类结果。

大部分回归分析模型都是连续型预测(逻辑回归除外)。今天就从最简单的,只有一个变量的简单线性回归分析讲起。

三、如何进行回归分析

做回归分析有五步:

  • 第一步:确认是否是预测问题
  • 第二步:确认要预测的因变量,影响预测结果的自变量
  • 第三步:收集数据,检验数据间关系
  • 第四步:计算模型,检验结果
  • 第五步:进行预测

看个具体问题场景:某公司在新品上市前,会提前进行宣传,并进行预约。虽然最终上市以后,并非只有预约用户买,但是如果能通过预约人数,预测销售情况,就能提前预判商品会不会受欢迎,从而把控库存情况。具体数据如下表。

拿到问题后,一步步来:

该场景需要的是预测,要预测的是销售额,是一个连续型变量。

确认因变量,自变量。该问题中:

因变量(要预测的):销售额

自变量(影响预测结果的):预约人数

没有其他变量了。

拿到数据后,可初步判断两个指标是否有关系,是何种关系,从而选择合适的模型。判断关系,最简单快捷的方法就是:散点图。因此拿到数据以后,可以先做散点图。如上图所示,因变量和自变量之间看起来是有明显线性关系的,因此可以用线性回归来做。

收集数据,题目已帮忙收集好了,进入下一步。

进行计算。简单的线性回归,用excel→数据分析→回归即可计算(如下图)

至于模型解读,略为复杂,我们慢慢看哦

四、模型计算与解读

回归分析的模型解读略显复杂,并且包含了大量假设检验的知识,这里先不探讨其复杂原理,给个最简单的判断原则,小伙伴们抄起来能用即可。

模型解读,分为三个部分:

  • 模型本身预测准不准。主要看R平方(如下图蓝色)
  • 模型整体是否有效。主要看F检验的结果(如下图橙色)
  • 模型里,每个因变量的检验结果(如下图绿色)

从上图可以看出,本次建模的三个检验结果全部通过,表明模型可用。

这次建模只有一个自变量+一个常数项,因此最终模型就是y=60+5x。常数项和自变量的数值,参见下图黄色部分:

五、回归分析模型应用

有了回归模型,我们就能预测未来情况啦。比如有一款新品,预约人数为4.5万人,则可以代入模型,预测销量为60+5*4.5=82.5万,商品部门就能据此备货了。

六、回归分析局限性

没有模型是万能的,回归分析突出弱点有两个:

回归不等于因果!不等于因果!不等于因果!回归模型只能从数据上说明:两个变量存在关系,但是实际上有没有关系,得看具体业务情况。因此千万不要乱用。 

模型检验可能难以通过。为了演示方便,本文选择的数据非常漂亮,做出来三项检测全部通过,但实际情况会很复杂,出现各种检测不通过的情况,因此也衍生出更多、更复杂的知识点,这个我们后边慢慢分享。

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

三分钟,看回归分析模型怎么做

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

三分钟,看回归分析模型怎么做

总有小伙伴想看分析模型,我们就从最简单的回归分析模型讲起。回归分析是所有分析模型里最浅显,最容易懂的,并且回归分析有很多变化形态,能适用于很多问题场景。今天就一起来看一下。

数据分析师,定价模型怎么做?

现实的难点是:要怎么知道这个需求函数“Q=1000-4P”。本能的想法是:我先标个价格,比如100元,然后再降低到90、80、70、60……然后再提高到110、120、130、140,这样不就能测出来了?

3分钟,看懂多版本 ABtest 怎么做

如果只有AB两个版本比较,那么做假设检验的时候,原假设是:A版本均值/比例=B版本均值/比例。之后,只要我们能用测试结果推翻原假设,就能说明AB版本均值/比例不同,从而论证哪个版本更好。相应的统计量,也是依此设计的。

做数据分析十年,第一次见到靠谱的归因模型

从经验上来看:投诉类来电,在业务上性质特殊,属于高风险行为。别的来电都能用小程序替代,唯独怒气冲冲的客户,必须用人工来服务,至少让人家消消气。

一文看懂:渠道分析怎么做

推广渠道分析的最大难点,在于数据采集。实际上,如果有足够的数据采集,所有推广渠道的分析都可以用漏斗分析法,追踪用户从接触推广内容到最后消费的全路径。

Python怎么实现RFM用户分析模型

本篇内容介绍了“Python怎么实现RFM用户分析模型”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!看这篇文章前源数据长这样:学完后只要敲一
2023-06-16

Paddle模型性能分析工具Profiler怎么使用

本篇内容介绍了“Paddle模型性能分析工具Profiler怎么使用”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!Paddle模型性能分析P
2023-07-05

设计师要怎么做产品分析?来看总监的经验!

UX设计流程中,需求分析是绝大多数流程的开端。所以今天,我们先从产品分析作为切入点,进入到 UX 进阶知识中的第一篇分享。

PyTorch中怎么进行模型评估和性能分析

在PyTorch中,可以使用torch.utils.data.DataLoader加载测试数据集,并调用模型的eval()方法进入评估模式。然后使用测试数据集对模型进行推理,并计算模型的性能指标,如准确率、损失值等。import torc
PyTorch中怎么进行模型评估和性能分析
2024-03-05

怎么分析SAP CRM里产品主数据的文本模型设计

怎么分析SAP CRM里产品主数据的文本模型设计,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。SAP CRM的产品主数据设计了这几种不同类型的文本模型:第1部分和第2部分实
2023-06-04

平均1秒生成1篇高分高考作文,飞桨文心大模型是怎么做到的?

百度数字人度晓晓在高考语文考试结束后,化身为“数字人考生”,挑战高考作文写作
数字人百度2024-12-13

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录