python 解析库Beautiful Soup的安装
Beautiful Soup的安装
一、Beautiful Soup的安装
Beautiful Soup是Python的一个HTML或XML的解析库,使用它可以很方便地从网页中提取数据。它的解析器是依赖于lxml库的,所以在此之前,请确保已经成功安装好了lxml库。
本文环境是windows 10 64位+ python3.11, 此处以windows安装为例。
1.1 安装lxml库
lxml库的安装,首先尝试使用pip进行安装:
pip install lxml
如果pip安装报错,比如提示缺少libxml2库等信息,那么可以采用wheel方式安装
采用wheel方式安装,首先需要安装wheel
pip install wheel
然后去官网https://pypi.org/project/lxml/下载lxml对应的的wheel版本, 当前最新版本是lxml 4.9.1, 点击Download files
在列出的files里面,选出和自己的版本相匹配的,例如你的python版本是3.10的,你的机器是windows系统,64位版本,那么就选lxml-4.9.1-cp310-cp310-win_amd64.whl
这里比较坑的一点是,python版本最新的已经是3.11版本了,但是lxml没有对应的官方windows 311版本,只有linux下的311版本。可以选择对python版本降级,比如降到python3.10版。
或者在https://www.lfd.uci.edu/~gohlke/pythonlibs/里,倒是可以找到311版本的windows wheel安装包,可以自行尝试。
安装wheel包的话,到wheel安装包所在目录执行pip 命令即可,或者带上全路径也可以
pip install lxml-4.9.0-cp311-cp311-win_amd64.whl
1.2 安装beautifulsoup4
推荐使用pip来安装,执行下述安装命令
pip install beautifulsoup4
1.3 验证beautifulsoup4能否运行
执行以下代码,能成功输出hello,就说明可以成功使用beautifulsoup4进行解析了。
如果只有beautifulsoup4安装成功,lxml库没有正确安装的话,下面代码不能成功执行。
from bs4 import BeautifulSoup as bssoup = bs('hello
', 'lxml')print(soup.p.string)
来源地址:https://blog.csdn.net/hubing_hust/article/details/128278550
免责声明:
① 本站未注明“稿件来源”的信息均来自网络整理。其文字、图片和音视频稿件的所属权归原作者所有。本站收集整理出于非商业性的教育和科研之目的,并不意味着本站赞同其观点或证实其内容的真实性。仅作为临时的测试数据,供内部测试之用。本站并未授权任何人以任何方式主动获取本站任何信息。
② 本站未注明“稿件来源”的临时测试数据将在测试完成后最终做删除处理。有问题或投稿请发送至: 邮箱/279061341@qq.com QQ/279061341