我的编程空间,编程开发者的网络收藏夹
学习永远不晚

《机器学习实战》书中python2.7与

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

《机器学习实战》书中python2.7与

《机器学习实战》书中使用的是python2.7,而对于现在新接触python的同学来说都是上手python3.6版本。

由于本渣渣也正在学习此书,将陆续列出遇到的不同于现实编码的困难与解决方法(如果能解决的话.......)。


1.import numpy时候,书中提倡from numpy import *
而我们在学习python3.6时常用import numpy as np,于是在调用tile、zeros等函数时,要改为np.tile(),np.zeros()。


2.输出的print后边要加上()


3.在使用pickle打开文件时,由于打开方式时二进制,要在‘w’后面或者‘r’后面加上‘b’,如‘wb’

    import pickle
    fw = open(filename,'wb')                   #pickle是二进制打开,加b
    pickle.dump(inputTree,fw)
    fw.close()

4.书中的获取字典dict的keys方法dict.keys()获得的字典集不是list形式不能直接使用'[ ]'取值

这是python2.7的取值方法,在3.6中应该改为如下:

str = list(dict.keys())[0]
先将dict.keys()转化为list形式

5.在第四章出现一个无法解决的问题:

tokenText = textParse(open('E:/BigData/machinelearninginaction/Ch04/email/spam/%d.txt' % i).read())

这个打开文件会出现解码错误的问题:'gbk' codec can't decode byte 0xff in position 199

然后我试着用‘utf-8’ 出现:'utf-8' codec can't decode byte 0xff in position 43

似乎是这些文件中有两种的编码的方式。于是我只提取前15个文件,不用修改就成功了。

试了很多方法,全部文件的读取还是没有成功。

如果同时解码多个编码方式还是没有解决。


6.在一个dataSet = range(50),中 del(dataSet[30])会出现错误

因为range返回的是range object 先将起转化为list

如:dataSet = list(range(50))


7.第九章中在加载数据时有这块代码:

for line in fr.readlines():
        curline = line.strip().split('\t')
        fltLine = map(float,curline)
        dataMat.append(fltLine)
这里会报错,提示map对象不能做mean处理,原因是python 2.7的map返回的是直接的结果,而python 3.6中返回的是map的对象:

<map object at 0x00000000021DA860> 
这里把这个对象转化为list即可,具体整个代码块改为:

for line in fr.readlines():
        curline = line.strip().split('\t')
        curline = list(map(float,curline))
        dataMat.append(curline)





免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

《机器学习实战》书中python2.7与

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

《机器学习实战》书中python2.7与

《机器学习实战》书中使用的是python2.7,而对于现在新接触python的同学来说都是上手python3.6版本。由于本渣渣也正在学习此书,将陆续列出遇到的不同于现实编码的困难与解决方法(如果能解决的话.......)。1.在impor
2023-01-31

python机器学习实战(三)

原文链接:www.cnblogs.com/fydeblog/p/7277205.html 前言这篇博客是关于机器学习中基于概率论的分类方法--朴素贝叶斯,内容包括朴素贝叶斯分类器,垃圾邮件的分类,解析RSS源数据以及用朴素贝叶斯来分析不同地
2023-01-31

python机器学习实战(一)

原文链接:www.cnblogs.com/fydeblog/p/7140974.html前言这篇notebook是关于机器学习中监督学习的k近邻算法,将介绍2个实例,分别是使用k-近邻算法改进约会网站的效果和手写识别系统.操作系统:ubun
2023-01-31

Python机器学习实战教程

Python机器学习实战教程分享网盘地址——https://pan.baidu.com/s/1miIb4og 密码: wtiw课程真心不错,分享给大家机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计
2023-01-31

SAP战略中的机器学习

SAP战略中的机器学习https://mp.weixin.qq.com/s/buv3R6AEr5PWhjpniYh_BQ 作者曾介绍过SAP将智能企业愿景推向市场的原因,以及帮助企业应对数字化挑战。本篇博客的目的,是尝试解释机器学习的基本概
2023-06-05

机器学习python实战之决策树

决策树原理:从数据集中找出决定性的特征对数据集进行迭代划分,直到某个分支下的数据都属于同一类型,或者已经遍历了所有划分数据集的特征,停止决策树算法。每次划分数据集的特征都有很多,那么我们怎么来选择到底根据哪一个特征划分数据集呢?这里我们需要
2022-06-04

机器学习python实战之手写数字识别

看了上一篇内容之后,相信对K近邻算法有了一个清晰的认识,今天的内容——手写数字识别是对上一篇内容的延续,这里也是为了自己能更熟练的掌握k-NN算法。 我们有大约2000个训练样本和1000个左右测试样本,训练样本所在的文件夹是trainin
2022-06-04

机器学习实践中如何将Spark与Python结合

本篇文章给大家分享的是有关机器学习实践中如何将Spark与Python结合,小编觉得挺实用的,因此分享给大家学习,希望大家阅读完这篇文章后可以有所收获,话不多说,跟着小编一起来看看吧。Apache Spark是处理和使用大数据最广泛的框架之
2023-06-02

用 Python 征服机器学习:揭秘入门、实战与职业发展之路

:从入门到实战再到职业发展,用 Python 征服机器学习的世界。
用 Python 征服机器学习:揭秘入门、实战与职业发展之路
2024-02-22

机器学习web服务化实战:一次吐血的服

背景在公司内部,我负责帮助研究院的小伙伴搭建机器学习web服务,研究院的小伙伴提供一个机器学习本地接口,我负责提供一个对外服务的HTTP接口。说起人工智能和机器学习,python是最擅长的,其以开发速度快,第三方库多而广受欢迎,以至于现在大
2023-01-31

MongoDB与机器学习的结合实践与模型持久化

随着大数据和人工智能的发展,机器学习技术在不断地发展和应用,而数据存储和管理也成为了关键的一环。MongoDB作为一种NoSQL数据库,具有高可扩展性、高性能、灵活数据模型等特性,并且与机器学习的结合也具有很好的优势。本文将介绍MongoD
MongoDB与机器学习的结合实践与模型持久化
2023-11-02

C++技术中的机器学习:使用C++训练机器学习模型的最佳实践

在 c++++ 中训练机器学习模型的最佳实践包括:使用高效的数据结构。优化内存管理。利用多线程。集成流行的机器学习库。关注代码简洁性。C++ 技术中的机器学习:训练机器学习模型的最佳实践引言C++ 是机器学习领域中一种功能强大且广泛使用
C++技术中的机器学习:使用C++训练机器学习模型的最佳实践
2024-05-11

C++技术中的机器学习:使用C++实现机器学习算法的并行编程

c++++ 中的并行编程可以极大地提高机器学习算法的效率。c++ 提供了线程等并行工具,以及 openmp 和 mpi 等 api。openmp 可用于共享内存并行,而 mpi 则适用于分布式内存并行。通过使用 openmp,可以并行化线性
C++技术中的机器学习:使用C++实现机器学习算法的并行编程
2024-05-12

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录