python爬虫之xpath的基本使用

Lan

2020-02-23 / 0 评论 / 906 阅读 / 正在检测是否收录...

02/23

温馨提示：

本文最后更新于2020年02月23日，已超过2317天没有更新，若内容或图片失效，请留言反馈。

要先将源码etree

html = requests.get(=url=headers).text
html = etree.HTML(html)
html = etree.tostring(html=).decode()
html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')

或将html.text转换为选择器对象

import parsel

html = parsel.Selector(html_str)
url = html.xpath('//div').extract()

暂无标签

版权属于： Lan

本文链接： https://www.lanol.cn/post/8.html

作品采用：《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 》许可协议授权

博主关闭了所有页面的评论