爬坑记:解决Python的urllib3
1、问题:项目中在使用itchat发送文件时发现包含中文字符的文件会无法正常发送2、分析:ithcat发送文件使用urllib3,而urllib3确实存在中文编码问题3、解决:找到 D:\Python36\Lib\site-packages
2024-11-16
centos7安装Mysql爬坑记录 - G
centos7安装Mysql爬坑记录 查看是否已安装使用下列命令查看是否已经安装过mysql/mariadb/PostgreSQL如果未安装,不返回任何结果(ECS的centos镜像默认未安装任何数据库)[root@Gwj ~]# rpm -qa|grep -
2024-11-16
elasticsearch 单节点搭建与爬坑记录 - G
elasticsearch 单节点搭建与爬坑记录 prepare 虚拟机或者云服务器(这里用的是阿里云ECS)linux---centos7安装完毕的jdk相应的安装包(在https://www.cnblogs.com/G-Aurora/p/13099459.
2024-11-16
python爬虫踩坑教程
我们的目标是爬取下面这个个网址上的2010~2018年的数据http://stockdata.stock.hexun.com/zrbg/Plate.aspx?date=2015-12-31获取我们需要的表格中的某些列的数据(这是我从我的微
2024-11-16
Oracle 踩坑记
1、Oracle 用连接工具(Navicat、SQL Developer)创建的用户名的字母要大写,否则无法连接,报ERROR ora-01017:invalid username/password2、Oracle 主键自增设置过程中,创建完序列后,创建触发
2024-11-16
Python/NodeJS坑记
自从学了Python和NodeJS,每每在写新的程序之前我就会问自己:到底用Python好,还是用NodeJS好?两者都能进行快速开发,并且各有千秋。现在就记录一下Python和NodeJS开发程序时的各种坑,方便以后纠结的时候查询。因为增
2024-11-16
Python编码爬坑指南(必看)
自己最近有在学习python,这实在是一门非常短小精悍的语言,很喜欢这种语言精悍背后又有强大函数库支撑的语言。可是刚接触不久就遇到了让人头疼的关于编码的问题,在网上查了很多资料现在在这里做一番总结,权当一个记录也为后来的兄弟姐妹们服务,如果
2024-11-16
Flask+Nginx踩坑记录
因为之前的网站项目使用的是Spring MVC,而且当时为了尽快赶完,代码结构非常粗暴,还存在大量的copy-paste代码,然后被师兄批评,然后决定接受师兄的建议,对网站进行重构,并且使用听说可以让我长寿一点的python【什么鬼。。。】
2024-11-16
【Python3爬虫】百度一下,坑死你?
这个标题是借用的路人甲大佬的一篇文章的标题(百度一下,坑死你),而且这次的爬虫也是看了这篇文章后才写出来的,感兴趣的可以先看下这篇文章。前段时间有篇文章《搜索引擎百度已死》引起了很多讨论,而百度对此的回复是:百家号的内容在百度搜索结果中不超
2024-11-16
python爬虫笔记-day3
正则使用的注意点re.findall("a(.*?)b","str"),能够返回括号中的内容,括号前后的内容起到定位和过滤的效果原始字符串r,待匹配字符串中有反斜杠的时候,使用r能够忽视反斜杠带来的转义的效果点号默认情况匹配不到\n\s能够
2024-11-16
『爬虫』学习记录
## 在学习爬虫中遇到很多坑,写出来供道友参考出现诸如以下错误 ModuleNotFoundError: No module named 'js2xml' NameError: name 'js2xml' is not defi
2024-11-16
爬虫笔记1:Python爬虫常用库
请求库:1、urllib:urllib库是Python3自带的库(Python2有urllib和urllib2,到了Python3统一为urllib),这个库是爬虫里最简单的库。2、requests:requests属于第三方库,使用起来比
2024-11-16