我的编程空间,编程开发者的网络收藏夹
学习永远不晚

sklearn交叉验证函数cross_val_score用法及参数解释

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

sklearn交叉验证函数cross_val_score用法及参数解释

文章目录

一 、使用示例

import numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn import svmfrom sklearn.model_selection import cross_val_scoretarget=odata["target"]X=odata.drop(columns="target")clf = svm.SVC(kernel='linear', C=1)scores = cross_val_score(clf,X,target, cv=5,scoring = "neg_mean_squared_error")
cross_val_score(estimator, X, y,, scoring=None, cv=None, n_jobs=None, verbose=0, fit_params=None, pre_dispatch="2*n_jobs")

二、参数含义

参数解释取值
estimator使用的模型实例实例化模型(SVM,XGBoost,DBDT)
X, y自变量,标签值数据集
soring评估效果取值下表详述
cv交叉验证时迭代次数整数
n_jobs同时工作的cpu个数(-1代表全部)[-1,1,2…]
verbose日志冗长度-
int冗长度0:不输出训练过程,1:偶尔输出,>1:对每个子模型都输出
fit_params传递给估计器的拟合方法的参数-
pre_dispatch控制并行执行期间调度的作业数量。减少这个数量对于避免在CPU发送更多作业时CPU内存消耗的扩大是有用的。“2*n_jobs”/数值

三、常见的scoring取值

下两个网址可以帮助理解
https://zhuanlan.zhihu.com/p/509437755
https://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter

取值含义
‘accuracy’准确度
‘precision’精度
‘f1’f1_score对于二进制目标
‘f1_micro’微观F1
‘f1_macro’宏F1,二分类使用Accuracy和F1-score,多分类使用Accuracy和宏F1。
‘recall’召回率
‘roc_auc’AUC值
neg_log_lossneg_log_loss损失,结果越接近0,表示损失越小,模型效果越好,对数似然函数 Log_loss是一种直接根据概率预测结果衡量损失的函数,和逻辑回归中的损失函数类似。对数似然函数直接指向模型最优化方向,对于那些以最优化为目的求解模型的算法来说,会天然有较好的得分。比如逻辑回归、svm等,其中逻辑回归的损失函数就是对数似然。
‘r2’R方,越大越好,R^2可以为负
neg_mean_squared_error负均值平方误差,负数,越小越好,均方误差MSE的数值,其实就是neg_mean_squared_error去掉负号的数字
neg_mean_absolute_error负绝对均值误差,MAE的负取值,现实中MSE和MAE选一个来使用就好了

1.分类、回归和聚类scoring参数选择

 分类问题一般选择‘roc_auc’、‘neg_log_loss’、‘f1’等,根据实际需求选择。 回归问题一般选择‘neg_mean_absolute_error、neg_mean_squared_error、‘r2’等 ,根据实际需求选择。 聚类:adjusted_rand_score、completeness_score等

2.f1_micro和f1_macro区别

在这里插入图片描述

3.负均方误差和均方误差

虽然均方误差永远为正,但是sklearn中的参数scoring下,均方误差作为评判标准时,却是计算”负均方误差“(neg_mean_squared_error)。这是因为sklearn在计算模型评估指标的时候,会考虑指标本身的性质,均方误差本身是一种误差,所以被sklearn划分为模型的一种损失(loss)。在sklearn当中,所有的损失都使用负数表示,因此均方误差也被显示为负数了。真正的均方误差MSE的数值,其实就是neg_mean_squared_error去掉负号的数字。

来源地址:https://blog.csdn.net/worther/article/details/126909270

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

sklearn交叉验证函数cross_val_score用法及参数解释

下载Word文档到电脑,方便收藏和打印~

下载Word文档

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录