CentOS 7 安装 TinyProxy 代理服务器

news/2024/7/19 10:58:41 标签: 爬虫, php, 网络

为什么80%的码农都做不了架构师?>>>   hot3.png

米扑科技,是一家专注互联网金融和大数据挖掘的初创互联网公司,正式注册成立于2016年9月,总部位于北京市海淀区中关村核心功能区。

米扑团队,成员来自百度、小米、阿里、创新工场等一线互联网公司,核心技术研发,实战经验丰富,具有浓厚的极客精神和精益的工匠品质。

 

米扑代理,是米扑科技旗下的一款用于网页抓取、数据采集的代理产品,作为全球代理服务的领导品牌,产品优势如下:

1. 五年来,已经积累超过2000多万的海量代理库,每天可用代理5000个左右

2. 覆盖全球120多个国家,中国34个省市,支持国家批量筛选

3. 支持http、https、socks4、socks5等协议,总能满足您的需求

4. 拥有完全自主研发的代理检测核心引擎,技术研发实力雄厚

5. 拥有几十台云服务器,完全自主搭建的代理服务器,分布于全球十多个国家

6. 作为全球代理的企业级领导品牌,服务于全球5000多家企业客户,日均代理提取数超过10亿个

米扑代理官网:https://proxy.mimvp.com

 

米扑代理案例

杨小米,最近在公司做爬虫工作,采集股票金融数据,写程序抓取数据的过程并不像平常我们用浏览器打开网页那么简单!

大多数的金融数据网站为了自己站点的性能和数据安全都设置了各种反爬策略。最常见的反爬虫策略有输入验证码、需要用户登陆、单个IP设置次数和频率、访问网页轨迹等等!所以广大的爬虫工程师,在抓取数据之前一般都会先调研目标网站是否设置了反爬策略。当不能正常访问网站时,可以在程序中设置代理IP来判断网站是不是封禁了我们的IP,或者使用海量的代理IP来爬取网页采集数据,推荐使用米扑代理:https://proxy.mimvp.com

 

CentOS 7 搭建 TinyProxy 代理

TinyProxy 和 Squid 都是比较优秀的代理软件

TinyProxy比较小众,虽然没有Squid的功能丰富,但是小巧简单,也能满足普通用户的需求。

Squid 是一款优秀的代理软件,有很丰富的ACL管理功能,虽然squid很强大,但配置比较繁琐。

 

1. 安装 TinyProxy

yum -y install tinyproxy

 

2. 配置 TinyProxy

vim /etc/tinyproxy/tinyproxy.conf

修改 Port 端口,默认为 8888

Port 8888

注释掉 Allow,表示允许所有人访问代理

#Allow 127.0.0.1

隐藏掉Via请求头部,去掉下面的注释

DisableViaHeader Yes

更多配置项,下面是列举一些配置文件默认的,不需要配置:

PidFile "/var/run/tinyproxy/tinyproxy.pid"
LogFile "/var/log/tinyproxy/tinyproxy.log"
LogLevel Info
MaxClients 100
MinSpareServers 5
MaxSpareServers 20
StartServers 10

 

3. 启动 TinyProxy

systemctl start tinyproxy.service 

更多命令如下:

systemctl restart tinyproxy.service 
systemctl stop tinyproxy.service 
systemctl status tinyproxy.service 
systemctl enable tinyproxy.service 

 

4. 关闭防火墙或开放端口访问

方式1:关闭防火墙

/etc/init.d/iptables stop

方式2:开放端口访问

iptables -A INPUT -p tcp --dport 8888 -j ACCEPT

重启防火墙

/etc/init.d/iptables restart

注意:若采用的阿里云、腾讯云、AWS等云服务器,记得要在安全策略里开放端口号

 

5. 验证生效

1)命令行测试验证

curl 和 wget 测试使用代理,请参考米扑代理的使用示例,总结的非常全面!强烈推荐!

这里,直接使用米扑代理的最简单示例:

curl -m 30 --retry 3 -x http://58.87.90.149:8888 http://proxy.mimvp.com/exist.php | grep 'color="red"'
                             
   <font color="red">58.87.90.149</font>
curl -m 30 --retry 3 -x http://58.87.90.149:8888 -k https://proxy.mimvp.com/exist.php | grep 'color="red"'
                            
    <font color="red">58.87.90.149</font>

tinyproxy 支持 http 和 https 两种协议,经米扑代理测试,成功!

 

2)Firefox 插件测试

首先,安装 Proxy Switcher

其次,配置代理,如下图:

centos-7-an-zhuang-tinyproxy-dai-li-fu-wu-qi-01

然后,访问米扑代理网站,验证代理

https://proxy.mimvp.com/exist.php

centos-7-an-zhuang-tinyproxy-dai-li-fu-wu-qi-02

上图里,http_via 带有参数,要隐藏需要修改配置文件

vim /etc/tinyproxy/tinyproxy.conf

隐藏掉Via请求头部,去掉下面的注释

DisableViaHeader Yes

重启 tinyproxy

systemctl restart tinyproxy.service

 

 

网友评价

非常棒的总结,按照米扑代理的配置步骤,都配置成功了!分享米扑代理的测试方法:

curl 和 wget 测试使用代理,请参考米扑代理的使用示例,总结的非常全面!强烈推荐!

米扑代理的使用示例:https://proxy.mimvp.com/demo2.php

这里,直接使用米扑代理的最简单示例:

curl -m 30 --retry 3 -x http://58.87.90.149:8888 http://proxy.mimvp.com/exist.php | grep 'color="red"'
                             
   <font color="red">58.87.90.149</font>
curl -m 30 --retry 3 -x http://58.87.90.149:8888 -k https://proxy.mimvp.com/exist.php | grep 'color="red"'
                            
    <font color="red">58.87.90.149</font>

 

 

转载于:https://my.oschina.net/mimvp/blog/1549896


http://www.niftyadmin.cn/n/994079.html

相关文章

验证码识别原理浅谈--图像二值化[转载]

二值化实现方法有 1.1图像灰度化-中值滤波等&#xff0c;同时可以实现背景的去除 1.2图像灰度化-根据灰度值 1.3根据图像色系范围进行二值化处理 图像二值化的意思就是将图像的有效点给分离出来&#xff0c;然后将图片用0和1两个值进行表示&#xff0c;因为我们没必要知道他…

简单介绍以下几个宏: 1

简单介绍以下几个宏&#xff1a; 1) __VA_ARGS__ 是一个可变参数的宏&#xff0c;这个可变参数的宏是新的C99规范中新增的&#xff0c;目前似乎只有gcc支持&#xff08;VC6.0的编译器不支持&#xff09;。宏前面加上##的作用在于&#xff0c;当可变参数的个数为0时&#xff0c;…

(十)T检验-第一部分

介绍T分布、T检验、Z检验与T检验、P值、相依样本以及配对样本的非独立T检验。 T分布 在到目前为止举的所有例子中&#xff0c;我们都假设我们知道总体参数 μ 和 σ&#xff0c;但很多时候&#xff0c;我们并不知道&#xff0c;我们通常只有样本&#xff0c;然后只能通过样本得…

ALAsset,ALAssetsLibrary,ALAssetsgroup常见属性及用法

​ALAssetsgroup --------------------------------------------------------------------------- Enumerating Assets&#xff08;遍历资源&#xff09; – enumerateAssetsUsingBlock:&#xff08;用一个block来遍历组里的资源&#xff09;– enumerateAssetsWithOptions:u…

永远年轻的人---阿诺德·施瓦辛格

永远年轻的人---阿诺德施瓦辛格1962年&#xff0c;当他15岁时&#xff0c;身高已达到l&#xff0e;88米&#xff0c;体重75公斤&#xff0c;上臂围30厘米&#xff0c;胸围94厘米&#xff0c;腰围76厘米&#xff0c;大腿围51厘米&#xff0c;小腿围38厘米。开始时由于缺乏专人指…

RadioButtonList实现选择切换效果

这个虽然有点简单&#xff0c;但是希望把学习中的点点滴滴积累下来&#xff0c;有可能就滴水成河了。首先&#xff0c;有个RadioButtonList&#xff0c;通过单击button切换不同的画面 代码 <tr><td class"tbcaption">处理类型</td><td><…

jsoup抓取网页数据

java项目有时候我们需要别人网页上的数据&#xff0c;怎么办&#xff1f;我们可以借助第三方架包jsou来实现&#xff0c;jsoup的中文文档&#xff0c;那怎么具体的实现呢&#xff1f;那就跟我一步一步来吧 最先肯定是要准备好这个第三方架包啦&#xff0c;下载地址&#xff0c;…

采用struts + hibernate 碰到的问题

采用struts hibernate 碰到的问题tomcat配置如下&#xff1a; Java代码 <Context path"/struts_hibernate" reloadable"true" docBase"D:\eclipse2.1.3\workspace\struts_hibernate" workDir"D:\eclipse2.1.3\workspace\struts_hiberna…