《Python网络爬虫从入门到实践》实现深圳租房信息抓取

news/2024/7/19 10:49:06 标签: 爬虫

爬取网站:https://zh.airbnb.com/s/Shenzhen--China?page=1

1.点击下部显示全部按钮,将租房信息全部显示

2.设置循环,一页一页获取

3.查看网页源码,寻找标签

__author__ = 'Administrator'
from selenium import webdriver
import time

driver = webdriver.Chrome(executable_path = r'D:\python3\chromedriver.exe')
#在虚拟浏览器中打开 Airbnb 页面
driver.get("https://zh.airbnb.com/s/Shenzhen--China?page=1")
#time.sleep(1)
#找到页面中所有的出租房
nextpage = driver.find_element_by_css_selector('#site-content > div > div > div:nth-child(4) > div > div > div > div:nth-child(2) > div > div._ttoj70 > a').click()

time.sleep(2)
for i in range(0,5):
    rent_list = driver.find_elements_by_css_selector('div._8ssblpx')

    for eachhouse in rent_list:
        #print(eachhouse)
        price = eachhouse.find_element_by_css_selector('div._qg0ydb')
        price = price.text[4:].replace('\n','')

        #找到名称
        name = eachhouse.find_element_by_css_selector('div._qhtkbey')
        name = name.text

        #找到房屋类型,大小
        details = eachhouse.find_elements_by_css_selector('span._fk7kh10')
        #print(details[0].text)
        details = details[0].text
        house_type = details.split(" · ")[0]
        bed_number = details.split(" · ")[1]
        print (price, name, house_type, bed_number)
    nextpage1=driver.find_elements_by_css_selector('div._1m76pmy')
    time.sleep(2)

38每晚 【十二微邸】14J-KKmall楼上的城市微魔方 整套公寓 1室1.5卫1床
45每晚 [Misa’s house] ‘想‘老街地铁口/kkmall万象城罗湖口岸/ins风商务房/直达香港 整套公寓 1室1卫2床
37每晚 【宫遇】17-KKmall楼上一房一厅--【Loft时代】 整套公寓 1室1卫1床
50每晚 LADYMA |原宿 摩洛哥风格 福田CBD会展中心#家庭影院CocoPark福田皇岗口岸岗厦地铁口 整套公寓 1室1卫1床
41每晚 【GAO's Home】福田中心区设施齐备的品质温馨小家(近市中心、会展中心、福田口岸) 整套公寓 1室1卫1床
34每晚 [Studio Q-Cozy]KKmall楼上/大剧院站/京基100/Luohu/深圳罗湖 整套公寓 单间1卫1床
22每晚 深圳北站 大床房 直达香港口岸/出差首选 1.8米超大床房 温馨舒适北欧风公寓 独立房间 1室2卫1床
38每晚 【十二微邸】32Q-KKmall楼上的天空微城堡 整套公寓 1室1卫1床
61每晚 燈塔·時光 Clean warm and cozy place 整套公寓 1室1.5卫1床
67每晚 【沿线】大梅沙180°海景工业风大床房,海滩旁,近东部华侨城 整套公寓 1室1卫1床
41每晚 【猫薄荷】近罗湖/福田口岸|美食街道|loft公寓|巨幕投影|泡泡吊椅 整间LOFT 1室1卫1床
26每晚 暖空调 马赛克浴缸 溜达家英式 一房里的精致生活 整租 3号线地铁口 龙岗中心城大运中心万


http://www.niftyadmin.cn/n/944567.html

相关文章

基于贝叶斯分类器的手写字判别

项目介绍: 使用贝叶斯分类器进行手写字体判别,数据为mnist.pkl.gz,下载地址https://pan.baidu.com/s/1I9GRg-wLEDvt-JmZ2_Os4A 数据分为训练数据,训练标签,测试数据,测试标签。 from sklearn import preprocessing i…

最速下降法(附Python代码)

import numpy as np from sympy import * import math import matplotlib.pyplot as plt import mpl_toolkits.axisartist as axisartist# 定义符号 x1, x2, t symbols(x1, x2, t)#sympy 符号数学相当于代数式def func():# 自定义一个函数return 2*pow(x1, 2) pow(x2, 2)def …

多项式曲线拟合

拟合的定义:形象的说,拟合就是把平面上一系列的点,用一条光滑的曲线连接起来。 因为这条曲线有无数种可能,从而有各种拟合方法。 拟合的曲线一般可以用函数表示,根据这个函数的不同有不同的拟合名字。------百度百科 多…

Python网络编程基础源码下载地址(莫迟译)

https://github.com/apress/foundations-of-python-network-programming-04

线性回归梯度下降

梯度下降:一种最优化算法,就是沿着函数的梯度方向寻找函数的最小值 线性回归模型: 最终的目标就是利用 (梯度下降法) 求出使 (误差函数) 最小的线性函数的系数值 梯度下降算法有两种 …

电话号码的字母组合(Python)

给定一个仅包含数字 2-9 的字符串,返回所有它能表示的字母组合。 给出数字到字母的映射如下(与电话按键相同)。注意 1 不对应任何字母。 示例: 输入:"23" 输出:["ad", "ae", "af…

UDP聊天小程序+多线程(Python)

本程序使用了网络测试工具作为另一端聊天工具,自己写程序实现与网络测试工具的聊天,使用的是本地地址127.0.0.1,也可开一虚拟机。 本项目主要 使用Socket进行信息传输 网络测试工具下载 下载地址 import socketdef send_msg(udp_socket):d…

TCP客户端服务器(Python)

TCP客户端程序: import socketdef main():# 创建tcptcp_client_socketsocket.socket(socket.AF_INET,socket.SOCK_STREAM)# 链接套接字# sever_ipinput("输入对方ip:")# sever_portint(input("输入对方端口:"))# seve…