我的编程空间,编程开发者的网络收藏夹
学习永远不晚

python3.6+scrapy+m

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

python3.6+scrapy+m

最近闲着,把之前写的小爬虫分享一下,才疏学浅,仅当参考。

[介绍文档]

    python版本:python3.6
    scrapy: 1.5.0
    需要安装pymysql包支持访问mysql数据库
    可以使用pip安装: pip install pymysql
*或者按照下述方法执行一键安装依赖:pip install -r requirements.txt

*重要事情说三遍:请确保你安装了mysql数据库! 请确保你安装了mysql数据库! 请确保你安装了mysql数据库!

*所有平台的Mysql下载地址为: https://dev.mysql.com/downloads/挑选你需要的 MySQL Community Server 版本及对应的平台。

爬虫工作配置

  • 第一步:下载github项目文件
git clone git@github.com:caffreycc/jb51.com_crawler.git

或者直接到https://github.com/caffreycc/jb51.com_crawler.git 下载zip文件
* 第二步:安装依赖:
pip install -r requirements.txt
  • 第三步:修改配置Config.py:
    Config.py 为项目配置文件

    host = '127.0.0.1' #改成你的数据库地址,如果需要保存在线服务器请填写数据库IP
    dbname = 'your database naem'  # 数据库名字,请修改
    user = 'your databse user'  # 数据库账号,请修改
    psw = 'your password'  # 数据库密码,请修改
    port = 3306  # 数据库端口,在dbhelper中使用,一般无需修改
  • 第四步:运行小爬虫
    命令行cd到你的项目文件夹,运行以下命令:
    或者直接在你的爬虫文件夹内shift + 右键 打开命令提示符或者powershell,运行以下命令
    scrapy crawl Common_crawler

    爬取的内容会自动保存到 config.py 中配置的mysql数据库中

问题反馈

  有任何关于项目的问题欢迎提issues

贡献代码

本项目基于PythonCrawler-Scrapy-Mysql-File-Template开发,感谢作者@lawlite19(https://github.com/lawlite19)的开源分享精神。

项目地址: python3.6+scrapy+mysql 爬虫实战

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

python3.6+scrapy+m

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

python3.6+scrapy+m

最近闲着,把之前写的小爬虫分享一下,才疏学浅,仅当参考。[介绍文档] python版本:python3.6 scrapy: 1.5.0 需要安装pymysql包支持访问mysql数据库 可以使用pip安装: pip
2023-01-31

CentOS + Python3.6+

目录:CentOS上升级Python安装easy_install和pipuwsgi安装及测试Django安装及测试连接uwsgi与Djangonginx安装及测试连接uwsgi与nginx连接uwsgi与Django与nginxuwsgi
2023-01-31

Pycharm+,,Python3.6以

首先说明一下,Django2.0以上版本不支持Mysql5.7以下版本,Python3.4以上版本不支持mysqldb,如何在这种环境下通过Django操作mysql数据库那?1.安装Mysql5.7以上版本请看我的上一篇博客,里面讲得很清
2023-01-30

Centos 7.5 python3.6

一、Django 概述Django 中提供了开发网站经常用到的模块,常见的代码都为你写好了,通过减少重复的代码,Django 使你能够专注于 web 应用上有 趣的关键性的东西。为了达到这个目标,Django 提供了通用Web开发模式的高度
2023-01-31

Centos7 安装Python3.6.

一、centos7 安装 Python3.6.5教程1、在安装Python之前,需要先安装一些后面遇到的依赖问题(如果有依赖问题,按照提示安装):    yum -y install zlib-devel bzip2-devel opens
2023-01-31

Ubuntu安装Python3.6

1、配置软件仓库sudo add-apt-repository ppa:jonathonf/python-3.62、检查系统软件包并安装Python3.6sudo apt-get updatesudo apt-get install pyt
2023-01-31

python3.6+pyQt5+QtDe

1. python 官网下载安装python3.6并配置好环境;2.cmd下 运行:pip install PyQt5   安装PyQt库;3.cmd下运行:pip3.6 install PyQt5-tools 安装QtDesigner4.
2023-01-31

Python3.6 和 Pycharm

一.Python3.61.下载Python安装包  https://www.python.org/ 2.安装Python  2.1.双击安装,勾选下面两项,选择自定义安装2.2.此处默认,直接下一步2.3.选择安装路劲,开始安装2.4.安装
2023-01-31

CentOS7 安装 Python3.6

先看编译安装,编译安装后的文件目录基本和Windows平台上目录差不多。指定安装路径的话,所有的文件都是在一起的。后面有yum的安装的方法。编译安装,会装好setuptools和pip这两个工具,都在site-packages这个文件夹里。
2023-01-31

python3.6 安装pyhook_

首先是根据网上的资料来安装的 第一次是通过swig形式的安装 但是一直不行被迫无奈只能找另外一个方法通过文件形式安装 安装pyhook3的时候自己系统是64位的所以下载了python_hdf4‑0.9.1‑cp36‑cp36m‑win_
2023-01-31

Centos6X安装python3.6

下载包去官网下载最新的python安装包官网地址: https://www.python.org/downloads/ 安装python3.6可能使用的依赖yum install openssl-devel bzip2-devel expa
2023-01-30

centos 7 安装python3.6

centos7 默认安装了python2.7.5,当需要使用python3的时候,可以手动下载python源码后编译安装.python 官网:www.python.org1.安装python可能用到的依赖yum install openss
2023-01-31

Centos下安装Python3.6

一、安装python3.6.11、安装依赖环境#yum install readline-devel ##必须安装否则会出现python3编译器中不能使用退格键和方向键2、下载安装包并解压[root@bogon ~]# wget ht
2023-01-31

【framework】spring3-m

前言spring一直以来提供了大量文档和例子,来让我们熟悉和了解spring. springMVC是一个比较成功的MVC模式,有人甚至认为这是java最好的web开发模式。 这个,我们不评价,不过这也能说明一些问题。自spring3加入了大
2023-01-31

Python socket.help M

DESCRIPTION This module provides socket operations and some related functions. On Unix, it supports IP (Internet P
2023-01-31

Linux安装python3.6

Linux下安装Python3.6和第三方库如果本机安装了python2,尽量不要管他,使用python3运行python脚本就好,因为可能有程序依赖目前的python2环境,比如yum!!!!!不要动现有的python2环境!一、安装py
2023-01-31

Python3.6安装ConfigPar

本文转载至:http://www.pythontab.com/html/2014/pythonhexinbiancheng_1120/919.html1.基本的读取配置文件-read(filename) 直接读取ini文件内容-sectio
2023-01-31

python3.6替换python3.7

使用低版本的python替换高版本的python只需要把环境变量中PATH的第一个python的路径替换成低版本的python的路径就行了。在编译python脚本的时候电脑就是使用第一个找到的python路径里的那个版本具体的方式是:我的电
2023-01-31

python3.6以上 asyncio模

这是python3.6以上版本的用法,本例是python3.7.2编写使用asyncio模块的异步编程模型,生产这消费者,异步生产,用sleep来代替IO等待使用async和await语法来进行描述async关键字描述一个方法是异步函数(协
2023-01-30

用python -m http.serv

工作时同事间几mb小文件的传输,一般使用QQ或者微信就足够了,但当传输文件几百MB或者几十G时,这种方法的效率就显得不足了。本篇就是简单说明一个python小功能,让大家能利用python方便的搭建一个本地局域网。跟同事测试时,速度轻松达到
2023-01-31

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录