我的编程空间,编程开发者的网络收藏夹
学习永远不晚

Python 机器学习工具包SKlearn的安装与使用

短信预约 信息系统项目管理师 报名、考试、查分时间动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

Python 机器学习工具包SKlearn的安装与使用

目录
  • 1、SKlearn 是什么
  • 2、SKlearn 的安装
  • 3、SKlearn 内置数据集
    • 测试问题数据集
    • 实际问题数据集
  • 4、Sklearn 数模笔记的计划

    1、SKlearn 是什么

      Sklearn(全称 SciKit-Learn),是基于 Python 语言的机器学习工具包。

      Sklearn 主要用Python编写,建立在 Numpy、Scipy、Pandas 和 Matplotlib 的基础上,也用 Cython编写了一些核心算法来提高性能。

      Sklearn 包括六大功能模块:

    • 分类(Classification):识别样本属于哪个类别,常用算法有 SVM(支持向量机)、nearest neighbors(最近邻)、random forest(随机森林)
    • 回归(Regression):预测与对象相关联的连续值属性,常用算法有 SVR(支持向量机)、 ridge regression(岭回归)、Lasso
    • 聚类(Clustering):对样本进行无监督的自动分类,常用算法有 k-Means(k均值)、spectral clustering(特征聚类)、mean-shift(均值漂移)
    • 数据降维(Dimensionality reduction):减少相关变量维数,常用算法有 PCA(主成分分析)、feature selection(特征选择)、non-negative matrix factorization(非负矩阵分解)
    • 模型选择(Model Selection):比较,验证,选择参数和模型,常用模块有 grid search(网格搜索)、cross validation(交叉验证)、 metrics(度量)
    • 数据处理 (Preprocessing):特征提取和归一化,常用模块有 preprocessing(预处理),feature extraction(特征提取)
    • 这六个功能模块涉及 4类算法,分类、回归 属于监督学习,聚类属于非监督学习。

      官网地址:https://scikit-learn.org/

      官方文档中文版: https://www.scikitlearn.com.cn/

      内置数据集:https://scikit-learn.org/stable/datasets.html

    2、SKlearn 的安装

      Sklearn 的安装要求:Python 3.5 以上版本,需要安装 NumPy、SciPy、Pandas 工具包的支持,部分内容需要使用 Matplotlib、joblib 工具包。

      pip 安装命令:  

    pip3 install -U scikit-learn
    pip3 install -U scikit-learn -i https://pypi.douban.com/simple

      注意 Sklearn 建议安装 Numpy+mkl,可以在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/ 找到你需要的numpy+mkl版本,下载后 pip3安装:

    pip install numpy-1.11.1+mkl-cp27-cp27m-win_amd64.whl

    3、SKlearn 内置数据集

      Sklearn 内置了一些标准数据集可以用于练习和测试,都是经常被引用的经典问题,数据网址:https://scikit-learn.org/stable/datasets.html  
      Sklearn 标准数据集主要包括:

    测试问题数据集

    • 波士顿房价:Boston house prices dataset
    • 鸢尾花问题:Iris plants dataset
    • 糖尿病数据:Diabetes dataset
    • 手写数字的识别:Optical recognition of handwritten digits dataset
    • 体能训练:Linnerrud dataset
    • 葡萄酒鉴别:Wine recognition dataset
    • 威斯康星州癌症诊断:reast cancer wisconsin (diagnostic) dataset

    实际问题数据集

    • 人脸数据:The Olivetti faces dataset
    • 20个新闻文本数据:The 20 newsgroups text dataset
    • 标记的人脸数据:The Labeled Faces in the Wild face recognition dataset
    • 森林覆盖类型:Forest covertypes
    • 路透社新闻数据:RCV1 dataset
    • 网络入侵检测数据:Kddcup 99 dataset
    • 加州住房数据:California Housing dataset

    4、Sklearn 数模笔记的计划

      粗略看看 Sklearn 的文档,是一个功能强大和丰富的机器学习库,远远超出了数学建模学习的范围。
      基于数模教学的目的,本系列主要对应数模学习中的分类、聚类、降维问题,并不打算全面讲解 Sklearn 的各种算法,而是以典型问题为例来介绍原理简单、使用广泛的基本方法,以便新手入门。

    以上就是Python 机器学习工具包SKlearn的安装与使用的详细内容,更多关于Python SKlearn的安装与使用的资料请关注编程网其它相关文章!

    免责声明:

    ① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

    ② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

    Python 机器学习工具包SKlearn的安装与使用

    下载Word文档到电脑,方便收藏和打印~

    下载Word文档

    猜你喜欢

    Python 机器学习工具包SKlearn的安装与使用

    目录1、SKlearn 是什么2、SKlearn 的安装3、SKlearn 内置数据集测试问题数据集实际问题数据集4、Sklearn 数模笔记的计划1、SKlearn 是什么Sklearn(全称 SciKit-Learn),是基于 Pyth
    2022-06-02

    python机器学习工具pyCaret怎么使用

    这篇文章主要介绍“python机器学习工具pyCaret怎么使用”,在日常操作中,相信很多人在python机器学习工具pyCaret怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”python机器学习工
    2023-06-25

    学习正确使用pip安装Python扩展包的方法

    pip安装命令解析:学习如何正确安装Python扩展包,需要具体代码示例概述:在Python编程过程中,我们经常需要使用各种不同的扩展包来帮助我们完成各种任务。pip是Python的包管理器,它可以帮助我们快速方便地安装、卸载和管理扩展包
    学习正确使用pip安装Python扩展包的方法
    2024-01-18

    容器管理工具 Rancher的安装与使用

    这篇文章主要介绍了容器管理工具 Rancher的安装与使用,通过本文学习可以掌握基于Rancher的应用部署、扩容缩容操作,本文实例图文相结合给大家介绍的非常详细,需要的朋友可以参考下
    2022-11-13

    Golang技术在机器学习中使用的库和工具

    go语言中适用于机器学习的库和工具包括:tensorflow:流行的机器学习库,提供构建、训练和部署模型的工具。golearn:一系列分类、回归和聚类算法.gonum:科学计算库,提供矩阵操作和线性代数功能。Go 中用于机器学习的库和工具
    Golang技术在机器学习中使用的库和工具
    2024-05-08

    使用Python编写并实现一个具备人工智能的聊天机器人(包含代码和步骤)

    聊天机器人是一种人工智能,它通过应用程序或消息来模拟与用户的对话。本文我们将使用Pytho的chatterbot库来实现聊天机器人。该库生成对用户输入的自动响应。响应基于库中实现的机器学习算法。机器学习算法使聊天机器人在收集用户响应时更容
    使用Python编写并实现一个具备人工智能的聊天机器人(包含代码和步骤)
    2024-01-22

    编程热搜

    • Python 学习之路 - Python
      一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
      Python 学习之路 - Python
    • chatgpt的中文全称是什么
      chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
      chatgpt的中文全称是什么
    • C/C++中extern函数使用详解
    • C/C++可变参数的使用
      可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
      C/C++可变参数的使用
    • css样式文件该放在哪里
    • php中数组下标必须是连续的吗
    • Python 3 教程
      Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
      Python 3 教程
    • Python pip包管理
      一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
      Python pip包管理
    • ubuntu如何重新编译内核
    • 改善Java代码之慎用java动态编译

    目录