您的位置:企达软件 >> 疯狂刷新 >> 疯狂刷新使用教程 >> 疯狂刷新之代理服务器原理与设置教程

疯狂刷新之代理服务器原理与设置教程

来源:原创 | 作者:企达软件 | 日期:2016-06-26 20:26:43 | 浏览:

疯狂刷新是一款网页自动刷新软件,通过自动分配代理服务器来达到以不同IP访问网站之目的,所以代理服务器是软件中非常重要的一个环节,本文将对代理服务器的原理、来源、分配以及相关参数的设置做详细介绍。

关于代理服务器的通俗解释

代理服务器英文全称是Proxy Server(以下简称代理),其功能就是代理网络用户去取得网络信息。形象的说:它是网络信息的中转站。在一般情况下,我们使用网络浏览器直接去连接其他Internet站点取得网络信息时,是直接联系到目的站点服务器,然后由目的站点服务器把信息传送回来。代理服务器是介于浏览器和Web服务器之间的另一台服务器,有了它之后,浏览器不是直接到Web服务器去取回网页而是向代理服务器发出请求,信号会先送到代理服务器,由代理服务器来取回浏览器所需要的信息并传送给你的浏览器。

疯狂刷新正是一款通过自动更换代理达到以不同IP访问网站的效果,程序会自动搜索全球免费的HTTP代理服务器,并对这些代理进行智能调度,所以您在使用疯狂刷新时完全不用为代理担心,因为这一切都由程序自动处理了。

通俗一点来说,代理就是一个中间人,不用你亲自出面,由别人帮你完成预定的任务。

比方说我是一个黄牛党公司,专门倒买火车票。我让本公司的A员工去买票,这个A员工怕买多了被人发现,所以到市场上找了一个农民工去给他买票,那么这个农民工就是代理。

目前疯狂刷新搜索到的代理都是免费的,就是这些农民工不要你的钱。这就有一个问题:不要钱的事不能要求太高,你没给钱人家,不能要求人家一定能买到票。这就是启用了代理失败率会比较高的原因。

代理服务器的类型

代理分为三种,透明代理,匿名代理和超级匿名代理。

★透明代理:

这个农民工比较脸熟,卖火车票的一看他就知道是谁让他来买的。就是说网站知道你用了代理,并且知道你的真实IP。这类代理比较多。

★匿名代理:

这个农民工口很紧,卖火车票的知道他是代理,但是不知道是谁让他来的。就是说网站知道你用了代理,但是不知道你的真实IP。这类代理比较少。

★超级匿名:

这个农民工很老练,买火车票的不知道他是代理,也不知道是谁让他来的。就是说网站不知道你用了代理,也不知道你的真实IP。这类代理最少。

注意:我所说的网站知道用了代理,并且知道你的真实IP是理论上来说有这个可能性,有些经验比较丰富的售票员(网站)可能知道,更多的没经验的售票员(网站)还是不知道或者人家想不想查。

疯狂刷新代理的来源

疯狂刷新在默认情况下是每4小时自动搜索一次代理,根据需要你可以调整到最低每30分钟检查一次。另外软件还会在代理小于300时自动搜索(不受间隔限制),同时你也可以选择“工具”菜单下的“立即搜索代理”来手工运行搜索程序。

疯狂刷新的代理都是从其它网站(劳务市场)搜索代理(农民工),目前已收录了国内国外绝大多数的网站,搜索的过程如下:

1.先到各大劳务市场(提供代理的网站)找到所有的农民工(代理);

2.去除重复报名的农民工(重复代理);

3.开始验证代理是否有效,如果有效就加入到软件的人才库中(代理库);

4.在刷新过程中会跟踪这个农民工的业绩(代理的有效性),如果这个农民工累计失败一定次数,就认为他是无效的代理,以后再分配代理时就不安排他了。

代理并不是永远有效的,这与提供代理的网站或服务商有直接关系。同一个代理,可以前一分钟正常,后一分钟就不能用了,所以在刷新过程中代理会越来越少。没办法,你没给钱人家,人家想干就干,不想干你也没招。

常规设置

选择“工具”菜单下的“设置代理服务器”或点击工具条上的“代理”按钮可以进入到代理设置窗口(见下图),您可以设置自动搜索代理的参数、管理代理库中的数据以及自行添加代理搜索任务。

疯狂刷新-代理设置

1.搜索间隔

设定自动搜索代理的间隔时间,拖到最左边表示关闭自动搜索(如果你没有自己找到代理来源,请不要关闭自动搜索功能)。最小间隔时间是0.5小时即30分钟,最长间隔为12小时,因代理搜索自其它网站(一般更新频率为4到8小时),所以设置过低的间隔并无实际意义,因为网站上不更新,你就算30分钟搜索一次也没用。

2.搜索线程

搜索代理用的线程数,有效值50-100,线程越多速度越快,同时对系统资源的占用也越大。

3.验证线程

验证代理有效性的线程数,有效值50-200,过高的线程将增加系统资源占用。

4.验证超时

验证某代理是否有效的最长等待时间(秒),有效值20-60,如果验证时超过该时间值,则认为该代理无效。

5.代理底限

当可用代理小于该值时系统将自动搜索代理(不受更新间隔限制)。比如这个值是300,在刷新时,如果有效代理总数小于300时,程序将自动搜索代理,而不管有没有到设置的间隔时间。

6.失败上限

如果某代理累计失败次数超过此值即认为该代理无效,会被程序自动丢弃不再分配使用。

7.验证间隔

疯狂刷新定期对代理库中的代理进行二次验证的间隔时间,合理配置此值可保证代理库中代理数据的有效性,建议设置为12小时。

8.验证方式

提供两各验证方式,用于检查代理是否有效,两者的区别是快速验证只检查一次,而深度验证会检查两次。

9.搜索来源

指定代理搜索任务的来源,三个选项:1.内置任务+用户任务、2.搜索软件内置任务、3.搜索用户添加任务。通过这三个选项您可以自由控制代理抓取的来源,请谨慎使用第三选项,如果你自行添加的搜索任务无效时,软件就无法找到任何代理了。

10.入库范围

指定代理数据的入库范围,范围之外的代理数据会被自动过滤掉,此项请尽量保持默认值即全部代理,其它选项请谨慎使用,因为会导入代理数量的减少。

11.双击事件

指定在主窗口状态条“代理数量”区双击时所触发的程序事件。

代理IP库

本列表中显示当前疯狂刷新中使用的有效代理以及代理的位置,你可以对这些代理数据进行导入、删除、清空等操作。

疯狂刷新-代理IP库

本选项的各按钮用途无需多作解释,只说说最常用的导入代理的操作方法:

在疯狂刷新使用过程中,如果要刷新的网站对代理IP要求很严,需要很多代理,而疯狂刷新自动搜索的代理又不够用时,就需要您自行寻找代理了。

将自己找到的代理,写到一个文本文件中保存,然后点击“导入”按钮,选择这个文件即可导入。文本文件的格式: 代理IP:端口 一行一个代理,只要包含标准的代理格式,程序会自动提取,并且会自动去除重复代理。

搜索任务

本项用来管理代理搜索任务,如果您懂正则表达式,您可以自行添加搜索任务,以搜索更多代理供程序使用。任务列表中只显示用户自行添加的任务,如果您看到任务列表为空,也不用担心,这并不表示软件没有搜索任务。自带的任务已经加密,在疯狂刷新运行时会自动添加作者设置好的任务。

疯狂刷新-搜索任务

点击“添加任务”按钮可自行添加代理来源,支持多数提供API的代理网站直接抓取。指定链接地址,然后点击右下角测试按钮即可进行抓取测试,如果测试可以正确抓取代理,保存本任务即可。

如果您发现了新的代理搜索网站,而自己又不会添加任务,可以联系作者,由作者代为添加。

要添加的代理网站必须具备以下要求:

1.目前疯狂刷新使用的代理服务器均为HTTP代理,不支持SOCK代理;

2.页面地址固定不变,也就是说同一个地址,不管是今天、还是明天,甚至一个月以后访问,都有效;

3.网站代理内容会自动更新。如果你找到的是一个文章地址,或者帖子地址,那么这个文章或帖子里的代理服务器永远不变,就算你找到的是最新的代理,一个月以后呢?一年以后呢?那时这些代理早就无效了;

4.最重要的一点:代理是最新的,最低也是近一星期内更新过的内容。如果你现在找到几年前的代理有什么用呢?那些代理早就失效了。

人性化功能介绍

代理服务器的搜索和验证是非常费时的,搜索和验证短则三五分钟长则半个小时,所以对于代理服务器的搜索和验证疯狂刷新软件是放在后台运行的,并不影响前台的操作。即软件在执行搜索和验证的时候可以同时启动刷新任务,搜索和验证有效后的代理会实时加入到代理库中供程序使用,所以您无须等待验证完毕后再启动刷新任务。简单来说代理服务器这一块你根本不用操心,只要您启动了疯狂刷新软件中的刷新任务,代理服务器是会自动更新的。

特别提示

作者已经竭尽所能的搜集了国内国外的免费代理发布站点,所以基本上免费的代理都找尽了,如果您还是觉得代理不够用,请自行购买收费的代理然后导入到软件中供程序使用。