python爬虫—使用xpath方法进行数据解析

news/2024/7/19 10:15:40 标签: python, 爬虫, 开发语言

1. 背景信息

爬取安居客二手房源信息
URL地址:https://wuhan.anjuke.com/sale/?from=navigation
在这里插入图片描述

2. 代码实现

python">import requests
from lxml import etree

if __name__ == '__main__':
    # 1.指定URL
    url = "https://wuhan.anjuke.com/sale/?from=navigation"
    # 2.UA伪装(模拟浏览器)
    headers = {
        'User-Agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36'
    }
    # 3.发起请求并获取响应内容
    page_text = requests.get(url=url,headers=headers).text
    # print(page_text)

    # 4.使用etree进行数据解析
    tree = etree.HTML(page_text)
    # 5.存储div标签的对象
    div_list = tree.xpath('//section[@class="list"]/div')
    # print(div_list)
    fp = open('58.txt','w',encoding='utf-8')
    for div in div_list:
        # 局部解析
        title = div.xpath('./a/div[2]/div[1]/div[1]/h3/text()')[0]
        print(title)
        fp.write(title+'\n')

http://www.niftyadmin.cn/n/5137816.html

相关文章

英码科技成功入选《2023边缘计算产业图谱》两大细分领域

近日,业界知名的边缘计算行业研究机构发布了《2023边缘计算产业图谱》,展示了全球边缘计算产业的最新发展态势和前景。在本次发布的图谱中,英码科技作为边缘计算领域的领先者,成功入选边缘计算一体机和智能终端两大细分领域&#…

Flutter——最详细(Map)使用教程

Map简介 键值对的集合,您可以使用其关联的键从中检索值。 普通的 HashMap是无序的(不保证顺序),LinkedHashMap 按键插入顺序迭代,而像 SplayTreeMap 这样的排序映射按排序顺序迭代键。 1,添加元素 addEntri…

视频剪辑达人教您:如何运用嵌套合并技巧制作固定片尾

在视频剪辑的过程中,嵌套合并技巧是一种非常实用的技术,可以帮助您将多个素材叠加在一起,制作出更加丰富多彩的视频。本文将由视频剪辑达人为您详细介绍如何运用云炫AI智剪嵌套合并技巧制作固定片尾,让您的视频剪辑水平更上一层楼…

企业内部外网向内网传输文件如何实现高效安全?

随着信息技术的发展,企业内部外网隔离已成为一种常见的网络安全措施,旨在防止外部攻击者入侵内部网络,保护企业的核心数据和业务系统。然而,企业内外网隔离也带来了一些问题,其中之一就是如何实现内外网之间的文件传输…

2023年05月 Python(二级)真题解析#中国电子学会#全国青少年软件编程等级考试

Python等级考试(1~6级)全部真题・点这里 一、单选题(共25题,每题2分,共50分) 第1题 运行以下程序,如果通过键盘先后输入的数是1和3,输出的结果是?( &#x…

【向生活低头】win7打印机共享给win11使用,win11无法连接问题的解决

打印机是跟win7的电脑连接的,然后试了很多方法,win11都没法添加该打印机去使用。 网上的方法乱七八糟啥都有,但试了以后,发现基本没什么用。 刚刚发现知乎上的一个回答是有用的,这里做记录以备后用。 1.打开控制面板的…

flask socketio 实时传值至html上【需补充实例】

目前版本如下 Flask-Cors 4.0.0 Flask-SocketIO 5.3.6from flask_socketio import SocketIO, emit 跨域问题网上的普通方法无法解决。 参考这篇文章解决 Flask教程(十九)SocketIO - 迷途小书童的Note迷途小书童的Note (xugaoxiang.com) app Flask(__name__) socketio Sock…

【base64加密】js/ts的基础加密

base64的字符串简单加密,主用于网页缓存数据的加密。 适用于常规html、小游戏(egret、cocos、laya)等 原文参考:JS基于base64编码加密解密文本和图片(修订)_js base64加密-CSDN博客 测试:JS实…