谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

news/2024/7/19 12:02:40 标签: 数据库, 爬虫
谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

百度

因为检索结果大量出现百家号的内容,百度又被摆在风口浪尖。批判百度仿佛又成了“言论正确”,但是,我必须要说但是,网络孤岛难道都是百度的错?

通过检索fgo的手办,使用谷歌在首页就可以得到大量的亚马逊结果。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

谷歌fgo手办的检索结果

百度能得到淘宝的结果吗?不能!淘宝早在2008年就屏蔽了百度的搜索,从百度早就已经无法得到具体的淘宝的商品信息。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

百度搜索结果

除了百度之外,美丽说和蘑菇街也在2013年遭到了淘宝的先后封杀。但如果要说影响力,2013年11月淘宝封杀彼时还比较弱小的微信可以说将这种巨头间的对立上升到了最高潮,从此之后两大巨头基本是泾渭分明,淘宝和微信再也无法共通,在微信强大之后反过来把淘宝又封杀了。而淘宝不得不弄出一个淘口令来。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

淘口令

其实中文互联网企业之间互相屏蔽对方早就开始了,当年被QQ封杀后,四处喊冤的360忘了自己之前不久封杀了金山的网页保镖。加害者与受害者的角色转换往往就在一息之间。

在诸多网民看来不过只是一出出闹剧而已,却从未想到自己的网络体验正在变得越来越糟。对于只用抖音或者各种app刷新闻的普通人来说可能还不明显,但对经常需要查询各种资料的人群来说,这种恶化显而易见。

以笔者个人为例,今天在Oracle 12c遇到了一个问题。开发者都知道,Oracle12版本进行了重大的变化,以前正确执行的程序也会遇到各种各样奇形怪状的问题。【LRM-00104】,之前好用的程序突然出现了这个错误。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

百度搜索结果

从百度来检索,检索不到。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

谷歌搜索结果

从谷歌来检索,选中文环境,依然检索不到,只能搜索到英文结果。

谷歌可以检索出亚马逊,百度却无法收录淘宝,信息孤岛是谁的错?

日语检索结果

从谷歌选择默认地区语言环境(笔者目前在日本工作),找到了结果,第一个就是解决方案。在Oracle中,errors的参数不能为负数,必须为正数。之前的-1改为足够大的正数就可以解决这个问题。

英语结果暂且不论,日语能找到结果,反而中文找不到,这说明什么?难道日本的软件从业者数目远远超过中国?如果是技术原因,为什么谷歌也检索不到中文结果?这只能说明很多网站选择禁止抓取内容,不但百度检索不到,谷歌也检索不到。这种情况恶化到一定程度会怎么样?当我们真的遇到需要搜索解决问题的方案时,会发现根本就找不到。不是没有,而是找不到。所有的解决方案都被截留在一个个信息孤岛中,而你根本就无法找到。

了解爬虫原理的同学都知道,只要在robots文进行设定,就可以禁止搜索引擎抓取内容。所以淘宝的商品抓不到,微信的各种文章抓不到,头条再加上各种各样的新闻app的各种专属文章依然抓不到,百度能抓取到的变得越来越少,我们能看到的也就是今天这种千疮百孔的样子。

不要再说什么远见伟大之类的,小农意识在看起来包容的互联网依然无比盛行,我的就是我的,凭什么给你抓取到?思想上的落后,规模再大依然称不上伟大。


http://www.niftyadmin.cn/n/1117812.html

相关文章

mysql 添加备份列_mysql增删改查备份基本操作

删除A表中的ID 中的开头以B* 的数据库。复制代码 代码如下:delete FROM tablename WHERE id like B%单独删除 A 表中的ID B复制代码 代码如下:delete FROM tablename WHERE id B您可能感兴趣的文章:连接:mysql -h主机地址 -u -p增:建库:create database…

64 位 win7 使用PLSQL Developer

原文路径:http://www.cnblogs.com/chuyuhuashi/archive/2012/03/22/2411481.html由于 PLSQL Developer 没有64位版本,所以在64位系统上运行该程链接64位Oracle时就会报错,笔者为这个问题纠结了好几天,后来通过请教Google 动手实践…

澳大利亚南部气温飙至49摄氏度 蝙蝠热得掉下树

中新网1月25日电 据新加坡《联合早报》报道,澳大利亚南部的气温24日突破49摄氏度,打破过去80年的纪录。一些州属的温度预计一天下来平均达到50摄氏度,紧急服务部门已做好准备应对酷热天气。 80年来“最热一天” 据报道,近来几天&a…

python学习_14

exec(str) 可以执行多行语句,语句块,没有返回值 command """... a [1,2,3]... for i in a:... print(i)... """exec(command)123 a [1,2,3]for i in a:... exec("print(" str(i) &qu…

git怎么操作会丢失自己的代码_每天3分钟玩转Git——08 – 救命的后悔药(找回丢失的代码)...

08 - 救命的后悔药(找回丢失的代码)“ 新来的实习生把自己做了一个月的功能给覆盖了,向我求救,要不要帮他?——编程三分钟”新来的实习生【悲郭】因为不太熟悉git的使用,总是把自己的代码给弄丢了,这次好了&#xff0c…

【leetcode】LRU Cache

题目简述: Design and implement a data structure for Least Recently Used (LRU) cache. It should support the following operations: get and set. get(key) - Get the value (will always be positive) of the key if the key exists in the cache, otherwise…

pip install scrapy报错:error: Unable to find vcvarsall.bat解决方法(python scrapy安装windows下)...

2019独角兽企业重金招聘Python工程师标准>>> 使用python的爬虫框架scrapy,在windows上搭建环境时候,使用pip install scrapy 命令安装Scrapy爬虫框架时,出现了很让人头疼的错误,错误截图如下: 在网上查找解…

Redhat镜像下载

5.4版本 server版本 32位DVD安装镜像 http://rhel.ieesee.net/uingei/rhel-server-5.4-i386-dvd.iso MD5校验值 7a12ec6599527e4f3d1790b51eadbfed rhel-server-5.4-i386-dvd.iso server版本 64位DVD安装镜像 http://rhel.ieesee.net/uingei/rhel-server-5.4-x86_64-dvd.iso…