我的编程空间,编程开发者的网络收藏夹
学习永远不晚

将爬取的数据保存到mysql中

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

将爬取的数据保存到mysql中

为了把数据保存到mysql费了很多周折,早上再来折腾,终于折腾好了

安装数据库

1、pip install pymysql(根据版本来装)

2、创建数据

      打开终端 键入mysql -u root -p  回车输入密码

      create database scrapy (我新建的数据库名称为scrapy)

3、创建表

      use scrapy;

      create table xiaohua (name varchar(200) ,url varchar(100));

 

    数据库部分就酱紫啦

4、编写pipeline

5、编写setting

 

 6、编写spider文件

 

 

 7、爬取数据保存到mysql

scrapy crawl xhwang

 

之前报错为2018-10-18 09:05:50 [scrapy.log] ERROR: (1241, 'Operand should contain 1 column(s)')

因为我的spider代码中是这样

 附一张网上找到的答案

 

 

错误原因:item中的结果为{'name':[xxx,xxxx,xxxx,xxx,xxxxxxx,xxxxx],'url':[yyy,yyy,yy,y,yy,y,y,y,y,]},这种类型的数据

更正为6下面代码后出现如下会有重复

 

 然后又查了下原因终于解决问题之所在

在图上可以看出,爬取的数据结果是没有错的,但是在保存数据的时候出错了,出现重复数据。那为什么会造成这种结果呢? 

其原因是由于spider的速率比较快,scrapy操作数据库相对较慢,导致pipeline中的方法调用较慢,当一个变量正在处理的时候

一个新的变量过来,之前的变量值就会被覆盖了,解决方法是对变量进行保存,在保存的变量进行操作,通过互斥确保变量不被修改。

在pipeline中修改如下代码

完成以上设定再来爬取,OK 大功告成(截取部分)

 

 

 

 

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

将爬取的数据保存到mysql中

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

将爬取的数据保存到mysql中

为了把数据保存到mysql费了很多周折,早上再来折腾,终于折腾好了安装数据库1、pip install pymysql(根据版本来装)2、创建数据      打开终端 键入mysql -u root -p  回车输入密码      crea
2023-01-30

python怎么爬取数据保存到数据库

要将爬取的数据保存到数据库,可以使用Python的数据库模块(如SQLite、MySQL、MongoDB等)将数据插入到数据库中。以下是一个使用SQLite数据库保存爬取数据的示例:首先,需要安装sqlite3模块。可以使用以下命令进行安装
2023-09-08

爬取微博图片数据存到Mysql中遇到的

由于硬件等各种原因需要把大概170多万2t左右的微博图片数据存到Mysql中.之前存微博数据一直用的非关系型数据库mongodb,由于对Mysql的各种不熟悉,踩了无数坑,来来回回改了3天才完成。   PS:(本人长期出售超大量微博数据、
2023-01-31

Python爬虫如何获取数据并保存到数据库中

本篇内容主要讲解“Python爬虫如何获取数据并保存到数据库中”,感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷,实用性强。下面就让小编来带大家学习“Python爬虫如何获取数据并保存到数据库中”吧!1.简介介绍-网络爬虫(又称为网页蜘
2023-07-02

Scrapy怎么将数据保存到Excel和MySQL中

这篇文章主要讲解了“Scrapy怎么将数据保存到Excel和MySQL中”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Scrapy怎么将数据保存到Excel和MySQL中”吧!Scrapy是
2023-07-05

python制作爬虫并将抓取结果保存到excel中

学习Python也有一段时间了,各种理论知识大体上也算略知一二了,今天就进入实战演练:通过Python来编写一个拉勾网薪资调查的小爬虫。 第一步:分析网站的请求过程 我们在查看拉勾网上的招聘信息的时候,搜索Python,或者是PHP等等的岗
2022-06-04

Scrapy将数据保存到Excel和MySQL中的方法实现

目录1. Excel1.1 openpyxl1.1.1 代码说明1.1.2 注意1.2 pandas1.2.1 代码说明1.2.2 常见错误1.3 openpyxl和pandas对比2. mysql2.1 代码说明2.2 pymysql介绍
2023-02-28

C#怎么将DataGridView中的数据保存到CSV和Excel中

这篇文章主要介绍“C#怎么将DataGridView中的数据保存到CSV和Excel中”,在日常操作中,相信很多人在C#怎么将DataGridView中的数据保存到CSV和Excel中问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作
2023-06-30

python 爬取股市数据存入mysql

1.利用casperjs 爬取新浪股市排行数据,生成数据文件//获取新浪股票排行var casper = require('casper').create({    waitTimeout: 10000,    verbose:true, 
2023-01-31

编程热搜

目录