我的编程空间,编程开发者的网络收藏夹
学习永远不晚

如何用Python来找你喜欢的妹子

短信预约 -IT技能 免费直播动态提醒
省份

北京

  • 北京
  • 上海
  • 天津
  • 重庆
  • 河北
  • 山东
  • 辽宁
  • 黑龙江
  • 吉林
  • 甘肃
  • 青海
  • 河南
  • 江苏
  • 湖北
  • 湖南
  • 江西
  • 浙江
  • 广东
  • 云南
  • 福建
  • 海南
  • 山西
  • 四川
  • 陕西
  • 贵州
  • 安徽
  • 广西
  • 内蒙
  • 西藏
  • 新疆
  • 宁夏
  • 兵团
手机号立即预约

请填写图片验证码后获取短信验证码

看不清楚,换张图片

免费获取短信验证码

如何用Python来找你喜欢的妹子

这篇文章将为大家详细讲解有关如何用Python来找你喜欢的妹子,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

先上效果图吧,no pic say bird!

如何用Python来找你喜欢的妹子

如何用Python来找你喜欢的妹子

如何用Python来找你喜欢的妹子

我之前写了一个抓取妹子资料的文章,主要是使用selenium来模拟网页操作,然后使用动态加载,再用xpath来提取网页的资料,但这种方式效率不高。

所以今天我再补一个高效获取数据的办法.由于并没有什么模拟的操作,一切都可以人工来控制,所以也不需要打开网页就能获取数据!

但我们需要分析这个网页,打开网页 http://www.lovewzly.com/jiaoyou.html 后,按F12,进入Network项中

url在筛选条件后,只有page在发生变化,而且是一页页的累加,而且我们把这个url在浏览器中打开,会得到一批json字符串,所以我可以直接操作这里面的json数据,然后进行存储即可!

代码结构图:

如何用Python来找你喜欢的妹子

操作流程:

  • headers 一定要构建反盗链以及模拟浏览器操作,先这样写,可以避免后续问题!

  • 条件拼装

  • 然后记得数据转json格式

  • 然后对json数据进行提取,

  • 把提取到的数据放到文件或者存储起来

主要学习到的技术:

  • 学习requests+urllib

  • 操作execl

  • 文件操作

  • 字符串

  • 异常处理

  • 另外其它基础

请求数据:

def craw_data(self):         '''数据抓取'''         headers = {             'Referer': 'http://www.lovewzly.com/jiaoyou.html',             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.104 Safari/537.36 Core/1.53.4620.400 QQBrowser/9.7.13014.400'         }         page = 1         while True:              query_data = {                 'page':page,                 'gender':self.gender,                 'starage':self.stargage,                 'endage':self.endgage,                 'stratheight':self.startheight,                 'endheight':self.endheight,                 'marry':self.marry,                 'salary':self.salary,             }             url = 'http://www.lovewzly.com/api/user/pc/list/search?'+urllib.urlencode(query_data)             print url             req = urllib2.Request(url, headers=headers)             response = urllib2.urlopen(req).read()             # print response             self.parse_data(response)             page += 1

字段提取:

def parse_data(self,response):       '''数据解析'''       persons = json.loads(response).get('data').get('list')       if persons is None:           print '数据已经请求完毕'           return        for person in persons:           nick = person.get('username')           gender = person.get('gender')           age = 2018 - int(person.get('birthdayyear'))           address = person.get('city')           heart = person.get('monolog')           height = person.get('height')           img_url = person.get('avatar')           education = person.get('education')           print nick,age,height,address,heart,education           self.store_info(nick,age,height,address,heart,education,img_url)           self.store_info_execl(nick,age,height,address,heart,education,img_url)

文件存放:

def store_info(self, nick,age,height,address,heart,education,img_url):         '''         存照片,与他们的内心独白         '''         if age < 22:             tag = '22岁以下'         elif 22 <= age < 28:             tag = '22-28岁'         elif 28 <= age < 32:             tag = '28-32岁'         elif 32 <= age:             tag = '32岁以上'         filename = u'{}岁_身高{}_学历{}_{}_{}.jpg'.format(age,height,education, address, nick)          try:             # 补全文件目录             image_path = u'E:/store/pic/{}'.format(tag)             # 判断文件夹是否存在。             if not os.path.exists(image_path):                 os.makedirs(image_path)                 print image_path + ' 创建成功'              # 注意这里是写入图片,要用二进制格式写入。             with open(image_path + '/' + filename, 'wb') as f:                 f.write(urllib.urlopen(img_url).read())              txt_path = u'E:/store/txt'             txt_name = u'内心独白.txt'             # 判断文件夹是否存在。             if not os.path.exists(txt_path):                 os.makedirs(txt_path)                 print txt_path + ' 创建成功'              # 写入txt文本             with open(txt_path + '/' + txt_name, 'a') as f:                 f.write(heart)         except Exception as e:             e.message

execl操作:

def store_info_execl(self,nick,age,height,address,heart,education,img_url):        person = []        person.append(self.count)   #正好是数据条        person.append(nick)        person.append(u'女' if self.gender == 2 else u'男')        person.append(age)        person.append(height)        person.append(address)        person.append(education)        person.append(heart)        person.append(img_url)         for j in range(len(person)):            self.sheetInfo.write(self.count, j, person[j])         self.f.save(u'我主良缘.xlsx')        self.count += 1        print '插入了{}条数据'.format(self.count)

如何用Python来找你喜欢的妹子

关于如何用Python来找你喜欢的妹子就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

免责声明:

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

如何用Python来找你喜欢的妹子

下载Word文档到电脑,方便收藏和打印~

下载Word文档

猜你喜欢

如何用Python来找你喜欢的妹子

这篇文章将为大家详细讲解有关如何用Python来找你喜欢的妹子,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。先上效果图吧,no pic say bird!我之前写了一个抓取妹子资料的文章,主
2023-06-17

如何使用Win7+IE9一键锁定你所喜欢的网站

IE9不但界面设计与Winhttp://www.cppcns.com7完全匹配之外,还针对Win7的新特性提供了网站锁定功能。从此以后,网友们再也不用在收藏夹中层层搜索自己喜欢的网站地址,而可以借助“Win7+IE9&rdquo
2023-05-25

如何在Linux上运行你最喜欢的Windows应用程序

如何在Linux上运行你最喜欢的Windows应用程序,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。WINE 是一个开源项目,它可以协助很多 Windows 应用程序在 L
2023-06-15

如何使用Python实现给喜欢的主播自动发弹幕

这篇文章主要为大家展示了“如何使用Python实现给喜欢的主播自动发弹幕”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“如何使用Python实现给喜欢的主播自动发弹幕”这篇文章吧。前言发弹幕只是其
2023-06-22

如何用Python探究你喜爱的歌手的音乐风格

如何用Python探究你喜爱的歌手的音乐风格,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。2019年5月, Tones and I发行了她的第二张单曲《Dance Mon
2023-06-16

如何使用Python的find()函数查找字符串中的子串

如何使用Python的find()函数查找字符串中的子串在Python的字符串处理中,经常需要查找字符串中的子串。Python提供了find()函数来帮助我们实现这个功能。本文将介绍如何使用Python的find()函数查找字符串中的子串,
如何使用Python的find()函数查找字符串中的子串
2023-11-18

编程热搜

  • Python 学习之路 - Python
    一、安装Python34Windows在Python官网(https://www.python.org/downloads/)下载安装包并安装。Python的默认安装路径是:C:\Python34配置环境变量:【右键计算机】--》【属性】-
    Python 学习之路 - Python
  • chatgpt的中文全称是什么
    chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列
    chatgpt的中文全称是什么
  • C/C++中extern函数使用详解
  • C/C++可变参数的使用
    可变参数的使用方法远远不止以下几种,不过在C,C++中使用可变参数时要小心,在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少,否则会产生访问越界,运气不好的话还会导致程序崩溃
    C/C++可变参数的使用
  • css样式文件该放在哪里
  • php中数组下标必须是连续的吗
  • Python 3 教程
    Python 3 教程 Python 的 3.0 版本,常被称为 Python 3000,或简称 Py3k。相对于 Python 的早期版本,这是一个较大的升级。为了不带入过多的累赘,Python 3.0 在设计的时候没有考虑向下兼容。 Python
    Python 3 教程
  • Python pip包管理
    一、前言    在Python中, 安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具: easy_install  和  pip , 目前官方推荐使用 pip。    
    Python pip包管理
  • ubuntu如何重新编译内核
  • 改善Java代码之慎用java动态编译

目录