爬虫项目(九):实时抓取csdn热榜数据

news/2024/7/19 11:28:04 标签: 爬虫, python, 开发语言

一、书籍推荐

推荐本人书籍《Python网络爬虫入门到实战》 ,详细介绍见👉: 《Python网络爬虫入门到实战》 书籍介绍

二、完整代码

# 使用selenium爬取热榜
# 热榜地址:https://blog.csdn.net/rank/list
# 获取标题、浏览量、评论数量、收藏数量


from selenium import webdriver
import time
import csv
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

def get_data(url):
    driver = webdriver.Chrome()
    driver.get(url)
    # 添加等待
    wait = WebDriverWait(driver, 10)
    try:
        # 等待直到页面加载完成
        wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, "div.hostitem.floor")))

        # 滚动页面以加载更多数据
        for _ in range(4):
            driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
            time.sleep(5)


        # 获取所有的文章元素
       

http://www.niftyadmin.cn/n/5075895.html

相关文章

高级深入--day29

入门案例 学习目标 创建一个Scrapy项目定义提取的结构化数据(Item)编写爬取网站的 Spider 并提取出结构化数据(Item)编写 Item Pipelines 来存储提取到的Item(即结构化数据)一. 新建项目(scrapy startproject) 在开始爬取之前,必须创建一个新的Scrapy项目。进入自定义的项目目…

Python元组解密:不可变的数据之美

更多资料获取 🤓 作者主页:涛哥聊Python 📚 个人网站:涛哥聊Python 元组是Python中一种有用的数据类型,用于存储不可变的有序集合。 本文将带您深入了解Python元组,包括定义、特点、创建、基本操作、不可…

node.js知识系列(2)-每天了解一点

目录 11. 执行子进程(child processes)12. Express.js 中的 WebSocket 库13. 请求体解析14. 包装回调函数(Promisify)15. 事件发射器(EventEmitter)模式16. Event Loop 阶段17. 大规模文件上传和下载18. 可…

代码之美:注释的艺术与重要性

当代的软件开发是一项复杂的任务,通常需要多人合作,涉及大量的代码编写和维护。在这个过程中,代码的可读性和可维护性变得至关重要。而其中一个关键因素就是注释,这是代码中的小而强大的艺术。 注释的定义 首先,让我…

<dependencyManagement>的作用

1.简介 dependencyManagement是一个 Maven 项目中的元素&#xff0c;它的作用是集中管理项目的依赖版本 2.为什么要使用dependencyManagement&#xff1f; 在 Maven 中&#xff0c;项目的依赖管理可以在 <dependencies>元素中配置&#xff0c;但是这些依赖的版本可能会…

cuda核函数编程小结

文章目录 一、环境配置二、核函数代码书写格式三、小结 一、环境配置 几个注意事项先写在前面&#xff1a; 环境问题&#xff1a;一定要VS2019以上的&#xff01;&#xff01;&#xff01;切记注意&#xff0c;目前VS2019以下已经不更新了&#xff0c;这里我就是用的2019&…

优思学院|零库存:丰田精益管理的成功之道(CLMP)

在如今竞争激烈的商业世界中&#xff0c;企业需要不断寻求新的方法来提高效率、降低成本&#xff0c;并确保产品的高质量。其中一种成功的策略是实施零库存管理&#xff0c;而日本汽车制造巨头丰田公司就以其独特的零库存策略而闻名全球。优思学院在本文中将会深入探讨什么是零…

【轻松玩转MacOS】安全隐私篇

引言 这一篇将介绍如何保护MacOS的安全&#xff0c;包括如何设置密码&#xff0c;使用防火墙&#xff0c;备份数据等重要环节&#xff0c;避免因不慎操作或恶意攻击带来的安全风险&#xff0c;让你的MacOS之旅更安心、更放心。 一、设置密码&#xff1a;保护你的MacOS的第一道…