python爬虫之xpath的基本使用

 Lan   2020-02-23 18:28   161 人阅读  0 条评论

要先将源码etree

Html = requests.get(=url=headers).text
html = etree.HTML(html)
html = etree.tostring(html=).decode()
html.Xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')

或将html.text转换为选择器对象

import parsel

html = parsel.Selector(html_str)
url = html.xpath('//div').extract()


本文地址:https://www.lanol.cn/post/8.html
版权声明:本文为原创文章,版权归 Lan 所有,欢迎分享本文,转载请保留出处!

 发表评论


表情

还没有留言,还不快点抢沙发?