Python的系统管理_07_pytho
一个通过正则匹配来下载指定页面图片的示例,
几个可能出错的地方都用print打印出来,可以观察是否正确。
目标站点::http://www.tupian.com/tag/xinggan
#引入数据包
import re
import urllib
#定义获得url中HTML代码的方法。
def getHtml(url):
page=urllib.urlopen(url)
html = page.read()
return html
#获得指定网站的源代码
html =getHtml("http://www.tupian.com/tag/xinggan")
#显示出来查看是否正确。
print html
clear
#正则表达式对比截取图片文件路径
printre.findall(r'class="lazy" data-src="(.*?\.jpg)"alt',html)
imglist =re.findall(r'class="lazy" data-src="(.*?\.jpg)"alt',html)
#迭代下载图片,另存为1的叠加
x = 0
for imgurl in imglist:
urllib.urlretrieve(imgurl,'%s.jpg' %x)
x+=1
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341