【数据库】听故事的故事人

news/2024/7/19 11:08:01 标签: 爬虫, 人工智能, json
<div "="" id="js_content" style="margin: 0px; padding: 0px; overflow: hidden; font-size: 17px; overflow-wrap: break-word; hyphens: auto; text-align: justify; position: relative; z-index: 0;">

 美好的故事,不仅要听,也要记!

 

经过上次对《故事FM》进行爬虫爬虫】听故事的故事人,我们得到了我们想要对评论数据,格式化的数据给人一种很舒心的感觉,但是,数据得到了,那我们总得保存它吧!用看的没法进行下一步的操作呀~

 

 

 

01

 

 

储存方式选择

 

 

在数据储存方式有很多种,我们需要根据数据的格式、类型、数据量和后期的数据处理设想来选择适合我们的储存方式。在数据量较小,数据后期可能直接提供给他人查看使用的情况下,通常使用便于非编程人员使用的csv、txt或者json等易于操作的储存格式;在数据结构化,且数据量一般的情况下,可使用数据库储存;如最常用的mysql、轻量级数据库sqlite、文本型数据库mongoDB等;数据量太大的话,可以考虑hdfs分布式储存使用。

这里由于评论数据文本短、数据量不大、后期需要数据处理的缘故,我们选择轻量级数据库SQLite储存评论数据。

SQLite是一个进程内的库,实现了自给自足的、无服务器的、零配置的、事务性的 SQL 数据库引擎。它是一个零配置的数据库,这意味着与其他数据库一样,您不需要在系统中配置。

 

 

02

那就干!

 

设计数据库:

根据爬虫所得数据,我们可以建立两个数据库:歌名--ID映射的菜单数据库和评论爬虫格式化数据库

 

数据库语句:

1
2
3
4
5
6
7
8
9
10
11
12
-- 注:语句为python执行语句
-- 创建菜单数据库
CREATE TABLE music_dic (music_id real, music_name text, time text);

-- 菜单信息,有则更新,无则插入
REPLACE INTO music_dic VALUES(?,?,?);

-- 新建评论数据库
CREATE TABLE IF NOT EXISTS music + str(music_id) + (music_name text, comment_id real ,user_id text,user_name text,avatar_url text,comment_time real,liked_count real,comment text);

-- 插入爬虫数据
INSERT INTO music"+str(music_id)+" VALUES(?,?,?,?,?,?,?,?);

 

这样我们想要的评论爬虫数据就被我们收入囊中了,嘻嘻~

 

 

关注微信公众号:正版乔,一起和我探索Coding的乐趣~

 

 

推荐阅读:

  • NES像素风格的Raspberry

  • dalao自动报表邮件2.0

  • 我给大佬写自动报表邮件系统

  • 网速问题?更换国内源吧!

  • SQL行列乾坤大挪移

  • 呵呵气象台

  • 爬虫】听故事的故事人

 

 

 


一个学统计的程序员

喜欢Coding

喜欢硬件

喜欢树莓派

喜欢深度学习

喜欢你

 

 
 
 

转载于:https://www.cnblogs.com/qiaohaoforever/p/10264855.html


http://www.niftyadmin.cn/n/1696421.html

相关文章

Node.js知识梳理(一)——基础

以下内容来自对《从前端到全栈》一书的学习记录~ 学习的时候用的是V16.20.0&#xff0c;18之后的语法差别还是有的~ 什么是Node.js Node.js 是运行在操作系统中的 JavaScript 运行时环境&#xff0c;和浏览器的运行环境不太一样&#xff1a; 不具备浏览器提供的DOM API&#…

Eclipse更新了Eclipse公共许可(EPL)

Eclipse基金会发布了新版的Eclipse公共许可&#xff08;Eclipse Public License&#xff0c;EPL&#xff09;&#xff0c;简称EPLv2。EPL是Eclipse基金会默认使用的软件许可。此次更改涉及了部分特性&#xff0c;但主要目的是为了在保持和开放源代码促进会&#xff08;Open Sou…

常用Jquery的一些函数

获取一组radio被选中项的值 var item $(input[nameitems][checked]).val(); 获取select被选中项的文本 var item $("select[nameitems] option[selected]").text(); select下拉框的第二个元素为当前选中值 $(#select_id)[0].selectedIndex 1; radio单选组的第二个…

JSP 页面缓存以及清除缓存

一、概述 缓存的思想可以应用在软件分层的各个层面。它是一种内部机制&#xff0c;对外界而言&#xff0c;是不可感知的。 数据库本身有缓存&#xff0c;持久层也可以缓存。&#xff08;比如&#xff1a;hibernate&#xff0c;还分1级和2级缓存&#xff09; 业务层也可以有缓存…

二维数组中的查找-剑指 offerP38

题目&#xff1a; 在一个二维数组中&#xff0c;每一行都按照从左到右递增的顺序排序&#xff0c;每一列都按照从上到下递增的顺序排序。请完成一个函数&#xff0c;输入这样的一个二维数组和一个整数&#xff0c;判断数组中是否含有该整数。 解题思路&#xff1a;《剑指 offer…

jquery判断显示剩下可输入内容字数

<script>$(function(){//先选出 textarea 和 统计字数 dom 节点var wordCount $("#wordCount"),textArea wordCount.find("textarea"),word wordCount.find(".word");//调用statInputNum(textArea,word);});/** 剩余字数统计* 注意 最大…

python 为元组的每个元素命名

访问元组的信息时&#xff0c;我们使用索引&#xff08;index&#xff09;访问&#xff0c;会大量降低程序可读性&#xff0c;所以用以下两种方式可以解决这个问题。定义类似于其他语言的枚举类型&#xff0c;也就是定义一系列数值常量使用标准库中 collections.namedtuple 替代…

oracle 几个用户的默认密码及修改

太久没用sys登陆数据库 用默认密码登陆不想 记不清密码了 可以通过以下方式修改sys用户密码使用sqlplus可以这样登陆 sqlplus / as sysdba 进入后你show user看一下就是sys用户,因为sys用户登录默认使用操作系统验证,并不检查密码. 不过你要修改的话,可以进入sqlplus后这样执…