python爬虫之xpath的基本使用

Lan
Lan
2020-02-23 / 0 评论 / 648 阅读 / 正在检测是否收录...
温馨提示:
本文最后更新于2020年02月23日,已超过1520天没有更新,若内容或图片失效,请留言反馈。

要先将源码etree

html = requests.get(=url=headers).text
html = etree.HTML(html)
html = etree.tostring(html=).decode()
html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')

或将html.text转换为选择器对象

import parsel

html = parsel.Selector(html_str)
url = html.xpath('//div').extract()


0

评论 (0)

取消