我的编程空间，编程开发者的网络收藏夹

学习永远不晚

位置：首页-资讯-后端开发

python简单的HTML解析

2023-01-31 01:34

短信预约 -IT技能 免费直播动态提醒

# coding:utf-8

# 引入相关模块

import json
import requests
from bs4 import BeautifulSoup
url = "http://news.qq.com/"
# 请求腾讯新闻的URL，获取其text文本
wbdata = requests.get(url).text
# 对获取到的文本进行解析
soup = BeautifulSoup(wbdata,'lxml')
# 从解析文件中通过select选择器定位指定的元素，返回一个列表
news_titles = soup.select("div.text > em.f14 > a.linkto")

#对返回的列表进行遍历
for n in news_titles:
    # 提取出标题和链接信息
    title = n.get_text()
    link = n.get("href")
    data = {
        '标题':title,
        '链接':link
    }

    print json.dumps(data).decode("unicode-escape").replace(u'\ufffd', u' ')

免责声明：

① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的，并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据，供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。

② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341

简单 python HTML

阅读原文内容投诉

python简单的HTML解析

下载Word文档到电脑，方便收藏和打印～

下载Word文档

相关文章

猜你喜欢

python简单的HTML解析

# coding:utf-8# 引入相关模块import jsonimport requestsfrom bs4 import BeautifulSoupurl = "http://news.qq.com/"# 请求腾讯新闻的URL，获取其

2023-01-31

python之解析最简单的xml

1、person.xm文件如下2、用xml.etree.ElementTree解析person.xml的实现3、效果如下4、总结python里面的list = []相当于java里面的list，然后可以改变其中的值。

2023-01-31

Python解析最简单的验证码

最近在学python，正好遇到学校需要选宿舍，就用python写了一个抢宿舍的软件。其中有一个模块是用来登陆的，登陆的时候需要输入验证码，不过后来发现了直接可以绕过验证码直接登陆的bug。不过这是另外的话题，开始的时候我并没有发现这个隐藏起

2022-06-04

Python简单解析和封装json

python list对象转换成json格式#!/usr/bin/env pythonimport jsondata = [{'type':'trigger','addr':'0x1234','data':'0x1234'}]print "

2023-01-31

Python odoo中嵌入html简单

在odoo中，通过iframe嵌入 html，页面数据则通过controllers获取，使用jinja2模板传值渲染html页面分页内容，这里写了判断逻辑

2023-01-31

mysqldump简单解析

2024-04-02

python简单的分析文本

import collectionsimport re#读取tips.txt文件内容，type(mytips)=strwith open("tips.txt","r",encoding="utf-8") as tip: myt

2023-01-31

Python编写简单的HTML页面合并脚本

最近写一个BootStrap页面...因为功能需要所以决定一个页面解决所有问题，然后用jQuery来动态显示功能....然而这样做的话页面会相当庞大，一堆隐藏模态窗口和功能div都堆在一起看起来挺难受的然后想了下就用Python写了个小脚

2022-06-04

Python正则简单实例分析

本文实例讲述了Python正则简单用法。分享给大家供大家参考，具体如下：悄悄打入公司内部UED的一个Python爱好者小众群，前两天一位牛人发了条消息：小的测试题：re.split('(W+)', ' test, test, test.

2022-06-04

Android ViewFlipper简单用法解析

ViewFlipper和ViewPager挺像的，都是一个view容器。内部可以添加多个view，只是viewpager可以通过左右滑动来切换view，而viewFlipper则没有这个功能，所以需要在它上面监听手势。比较方便的是它不用使用

2022-06-06

简单的Python解密rsa案例

2024-04-02

HTML怎么编写一个简单的表单

这篇文章主要介绍了HTML怎么编写一个简单的表单，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。我们先来看下常用的表单元素有哪些：文本域文本域通过

2023-06-27

用python解析html[SGMLPa

因为要用python做学校网络的认证程序，需要解析服务器传回的html，本以为会像javascript里操作DOM那样简单，结果发现并不是这样，被搞了一下。其实python里面有xml.dom模块，但是这次却不能用，为啥呢？因为服务器传回

2023-01-31

解析mybatis-plus中的resultMap简单使用

2024-04-02

Android json解析及简单例子

一种轻量级的数据交换格式，具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案（有点类似于正则表达式，获得了当今大部分语言的支持），从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式，同时也具备类似于C

2022-06-06

简单HCIA题库讲解分析

　　简单hcia题库讲解分析：只需要笔试的华为认证HCIA难度会比较低，一般情况下，掌握了对应的知识点后，通过练习题库，通过的难度都不大，接下来编程学习网小编就来简单的讲解分析一下HCIA题库的相关内容。　　简单HCIA题库举例　　先来带大家看几道简答的HCIA题库里的题目。　　1、Tracert诊断工具记录下每一个ICM

简单HCIA题库讲解分析

2024-04-18

简单解析ipv4地址分类

　　IP地址简介　　简单解析ipv4地址分类：基本的IP地址是分成8位一个单元(称为8 位位组)的32位二进制数。二进制与十进制大家都懂吧。为了方便人们的使用，对机器友好的二进制地址转变为人们更熟悉的十进制地址。IP地址中的每一个8位位组用0～255之间的一个十进制数表示。这些数之间用点(.)隔开，这是所谓的点-十进制

简单解析ipv4地址分类

2024-04-18

Python [::-1]的简单理解与用法

2023-09-02

Python中如何解析HTML

本篇文章给大家分享的是有关Python中如何解析HTML，小编觉得挺实用的，因此分享给大家学习，希望大家阅读完这篇文章后可以有所收获，话不多说，跟着小编一起来看看吧。这是一个典型的图像标签：

2023-06-17

【Python3】Python简单的登

#!/usr/bin/env python# -*- coding: utf-8 -*-# Author:Chuncheng.Fan f1 = open('db','r')data = f1.read()

2023-01-31

编程热搜

Python 学习之路 - Python
一、安装Python34Windows在Python官网（https://www.python.org/downloads/）下载安装包并安装。Python的默认安装路径是：C:\Python34配置环境变量：【右键计算机】--》【属性】-
chatgpt的中文全称是什么
chatgpt的中文全称是生成型预训练变换模型。ChatGPT是什么ChatGPT是美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型，它能够通过学习和理解人类的语言来进行对话，还能根据聊天的上下文进行互动，并协助人类完成一系列
C/C++中extern函数使用详解
C/C++可变参数的使用
可变参数的使用方法远远不止以下几种，不过在C,C++中使用可变参数时要小心，在使用printf()等函数时传入的参数个数一定不能比前面的格式化字符串中的’%’符号个数少，否则会产生访问越界，运气不好的话还会导致程序崩溃
css样式文件该放在哪里
php中数组下标必须是连续的吗
Python 3 教程
Python 3 教程 Python 的 3.0 版本，常被称为 Python 3000，或简称 Py3k。相对于 Python 的早期版本，这是一个较大的升级。为了不带入过多的累赘，Python 3.0 在设计的时候没有考虑向下兼容。 Python
Python pip包管理
一、前言在Python中，安装第三方模块是通过 setuptools 这个工具完成的。 Python有两个封装了 setuptools的包管理工具： easy_install 和 pip ，目前官方推荐使用 pip。
ubuntu如何重新编译内核
改善Java代码之慎用java动态编译

编程资源站

资料下载
历年试题

信息系统项目管理师选择题每日一练（2024）历年试题

2023年下半年信息系统项目管理师综合知识真题演练历年试题

目录

反馈

我要
反馈