利用人工智能模型学习Python爬虫

news/2024/7/19 11:28:01 标签: python, 爬虫, 学习

爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。 网络爬虫(又称为网页蜘蛛,网络机器人)是其中一种类型。 爬虫可以自动化浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则进行,这些规则我们称之为网络爬虫算法。
——使用讯飞星火认知大模型提问“爬虫是什么?”

文章目录

  • 前言
  • 一、ChitGPT学习Python爬虫
    • (一)ChitGPT介绍
    • (二)爬虫代码初体验
  • 二、讯飞星火认知大模型学习Python爬虫
    • (一)讯飞星火认知大模型介绍
    • (二)爬虫代码初体验
  • 总结


前言

本文是参加新星计划Python编程基础及爬虫入门学习笔记,感谢爱吃饼干的小白鼠老师的Python知识分享。下面主要介绍本人利用几个人工智能模型学习Python爬虫的过程,供各位小伙伴参考。


一、ChitGPT学习Python爬虫

(一)ChitGPT介绍

ChitGPT是CSDN自带的人工智能模型,是一个纯文本AI模型,可以回答我的很多问题,也会编写、优化代码。
在这里插入图片描述

(二)爬虫代码初体验

  1. 使用ChitGPT提问:“python爬虫代码”
    在这里插入图片描述
  2. 代码测试
python">import requests

url = "http://www.example.com"  # 指定要爬取的网页地址
response = requests.get(url)  # 发送请求获取网页内容
html = response.text  # 获取网页 HTML 代码
print(html)  # 打印 HTML 代码
  1. 执行结果
    如下图所示,打印出网页。
    在这里插入图片描述

二、讯飞星火认知大模型学习Python爬虫

(一)讯飞星火认知大模型介绍

讯飞星火认知大模型
在这里插入图片描述

(二)爬虫代码初体验

  1. 使用讯飞星火提问:“python爬虫代码”
    在这里插入图片描述

  2. 代码测试

python">import requests

from bs4 import BeautifulSoup


url = 'https://www.example.com'

response = requests.get(url)

soup = BeautifulSoup(response.text, 'html.parser')

title = soup.find('h1').text

print(title)
  1. 执行结果
    在这里插入图片描述

总结

爬虫是一种自动化程序,可以代替人们自动地在互联网中进行数据信息的采集与整理。在大数据时代,信息的采集是一项重要的工作,如果单纯靠人力进行信息采集,不仅低效繁琐,搜集的成本也会提高。此时,我们可以使用网络爬虫对互联网上的信息进行自动化采集和整理。

爬虫可以用于很多方面,例如:搜索引擎、数据分析、舆情监测、电商平台、金融市场等等。在这些领域中,爬虫可以帮助我们快速获取大量的数据,并且可以自动化地进行处理和分析 。


http://www.niftyadmin.cn/n/434649.html

相关文章

chatgpt赋能python:Python怎样使用断言?

Python怎样使用断言? 在Python中,断言是一种在程序执行中自动检查程序是否具有给定条件的方法。在程序的开发和调试过程中,通过正确使用断言,可以增强代码的可靠性并提升编程效率。 Python中的断言语法 Python中的断言语法非常…

printf 和 println 是 Java 中用于输出的两种不同的方法

【以下为ChatGPT输出】 printf 和 println 是 Java 中用于输出的两种不同的方法,它们之间有以下几点差异: 格式控制:printf 方法允许你使用格式字符串来控制输出的格式,你可以指定变量的类型、字段宽度、精度等。而 println 方法…

PostgreSQL数据库分区裁剪——predicate_refuted_by_recurse

bool relation_excluded_by_constraints(PlannerInfo *root, RelOptInfo *rel, RangeTblEntry *rte)predicate_refuted_by(safe_restrictions, safe_restrictions, true) // 表上谓词相互refutepredicate_refuted_by(safe_constraints, rel->baserestrictinfo, false) // CH…

IIC总线实验

IIC总线实验 一、IIC总线基础概念 1、I2C总线是PHLIPS公司在八十年代初推出的一种同步串行半双工总线,主要用于连接整体电路。 2、I2C总线为两线制,只有两根双向信号线 3、一根是数据线SDA,另一根是时钟线SCL 4、I2C硬件结构简单&#xf…

高并发架构设计方法

我们知道,“高并发”是现在系统架构设计的核心关键词。一个架构师如果设计、开发的系统不支持高并发,那简直不好意思跟同行讨论。但事实上,在架构设计领域,高并发的历史非常短暂,这一架构特性是随着互联网,…

【MySQL数据库 | 第十八篇】索引分类与语法

前言: 在上一篇我们讲解了什么是索引以及索引的结构,这一篇我们将更进一步的讲解索引的分类以及语法介绍,大家准备好了嘛? 索引分类: 1. 主键索引 主键索引是一种特殊的唯一索引,它强制保证某列的值…

2023/6/14总结

JS的学习: JavaScript是一种运行在客户端(浏览器)的编程语言,实现人机交互的效果 主要作用: 网页特效表单验证数据交互 JS的组成 ECMAScript 规定了js基础的语法核心知识 Web APIs DOM:操作文档,对页面…

photoscan(metashape)跑GPS辅助的无人机影像SfM(空三)教程

刚打开的photoscan界面如下图所示:   然后,点击工作区左上角的添加堆块选项:   可以看到新增了一个名为“Chunk 1”的堆块,然后,右击“Chunk 1”,依次选择add、添加照片:   即可弹出照…