您的位置:企达软件 >> 疯狂IE >> 疯狂IE使用教程 >> 疯狂IE代理设置详解

疯狂IE代理设置详解

来源:原创 | 作者:企达软件 | 日期:2014-09-03 11:03:48 | 浏览:

疯狂IE在刷新过程中可以自动更换IP地址,达到使用不同IP访问页面的效果,所以代理服务器是软件中有一个重要组成部分,本文将就代理服务器的基础知识及各参数设置做详细介绍。

代理服务器的通俗解释

代理服务器英文全称是Proxy Server(以下简称代理),其功能就是代理网络用户去取得网络信息。形象的说:它是网络信息的中转站。在一般情况下,我们使用网络浏览器直接去连接其他Internet站点取得网络信息时,是直接联系到目的站点服务器,然后由目的站点服务器把信息传送回来。代理服务器是介于浏览器和Web服务器之间的另一台服务器,有了它之后,浏览器不是直接到Web服务器去取回网页而是向代理服务器发出请求,信号会先送到代理服务器,由代理服务器来取回浏览器所需要的信息并传送给你的浏览器。

服务服务器工作示意图

疯狂IE正是一款通过自动更换代理达到以不同IP访问网站的效果,程序会自动搜索全球免费的HTTP代理服务器,并对这些代理进行智能调度,所以您在使用疯狂IE时完全不用为代理担心,因为这一切都由程序自动处理了。

通俗一点来说,代理就是一个中间人,不用你亲自出面,由别人帮你完成预定的任务。

比方说我是一个黄牛党公司,专门倒买火车票。我让本公司的A员工去买票,这个A员工怕买多了被人发现,所以到市场上找了一个农民工去给他买票,那么这个农民工就是代理。

目前疯狂IE搜索到的代理都是免费的,就是这些农民工不要你的钱。这就有一个问题:不要钱的事不能要求太高,你没给钱人家,不能要求人家一定能买到票。这就是启用了代理失败率会比较高的原因。

代理分为三种,透明代理,匿名代理和超级匿名代理。

★透明代理:这个农民工比较脸熟,卖火车票的一看他就知道是谁让他来买的。就是说网站知道你用了代理,并且知道你的真实IP。这类代理比较多。

★匿名代理:这个农民工口很紧,卖火车票的知道他是代理,但是不知道是谁让他来的。就是说网站知道你用了代理,但是不知道你的真实IP。这类代理比较少。

★超级匿名:这个农民工很老练,买火车票的不知道他是代理,也不知道是谁让他来的。就是说网站不知道你用了代理,也不知道你的真实IP,这类代理最少。

注意:我所说的网站知道用了代理,并且知道你的真实IP是理论上来说有这个可能性,有些经验比较丰富的售票员(网站)可能知道,更多的没经验的售票员(网站)还是不知道或者人家想不想查。

疯狂IE代理的来源及搜索流程

疯狂IE在默认情况下是每4小时自动搜索一次代理,根据需要你可以调整到最低每1小时检查一次。另外软件还会在代理小于200时自动搜索(不受间隔限制),同时你也可以选择“工具”菜单下的“立即搜索代理”来手工运行搜索程序。

疯狂IE的代理都是从其它网站(劳务市场)搜索代理(农民工),目前已收录了国内国外绝大多数的网站,搜索的过程如下:

1.软件启动之后首先对之前入库的代理进行二次验证,去除无效代理;

2.到各大劳务市场(提供代理的网站)找到所有的农民工(代理);

3.去除重复报名的农民工(重复代理);

4.开始验证代理是否有效,如果有效就加入到软件的人才库中(代理库);

在刷新过程中会跟踪这个农民工的业绩(代理的有效性),如果这个农民工累计失败一定次数,就认为他是无效的代理,以后再分配代理时就不安排他了。

代理并不是永远有效的,这与提供代理的网站或服务商有直接关系。同一个代理,可以前一分钟正常,后一分钟就不能用了,所以在刷新过程中代理会越来越少。没办法,你没给钱人家,人家想干就干,不想干你也没招。

常规设置

疯狂IE代理设置-常规设置

1.启用自动搜索代理:是否启用自动搜索代理,选中即启用,取消则禁用;

2.搜索间隔(小时):代理搜索间隔时间,有效范围0.5-12,因代理都是从第三方网站抓取的,如果网站上没有更新过低的间隔并无实际意义;

3.搜索代理线程数:从网站抓取代理的线程总数,越多速度越快,但对系统资源的占用越高;

4.验证代理线程数:验证代理有效性的线程总数,有效范围20-100;

5.验证代理超时值:单位是秒,验证代理时如果所用时间超过此值则认为该代理无效;

6.有效代理数底限:如果当前有效代理数量小于此值,则自动立即搜索代理,不受间隔时间限制;

7.代理失败数上限:代理业绩跟踪临界值,如果某代理连续失败次数超过此值即认为代理失效,后续分配代理时尽量不再分配该代理;

8.启用代理库二次验证及验证间隔:是否启用代理库二次验证以及验证间隔时间,启用之后软件会定时对当前代理库中的已有代理进行二次验证,去除无效代理让代理库中的代理更加高效,从而加快刷新速度;

9.代理搜索来源:根据需要自由切换代理搜索来源;

10.状态条代理区域双击事件:在状态条代理区域双击时是否启用快捷操作;

疯狂IE代理设置-状态条快捷操作

11.恢复默认设置:点击之后将当前常规参数都恢复为默认设置。

代理列表

疯狂IE代理设置-代理列表

代理列表中会显示当前代理库中的代理信息详情,如果正在搜索/验证代理或疯狂IE中有任务正在工作,代理库中的内容会实时变化,这里显示的代理数量可能和软件状态条上的代理数量稍有差异,这是正常现象,大概五分钟左右会自动同步一次。

在这里您可以自行导入代理数据,类型为TXT文本文件,一行一条代理数据,常见的代理数据格式软件都可以自动提取,在导入时软件会自动过滤重复代理。其它几个按钮的用途很好理解,不再逐一介绍。

搜索任务

疯狂IE代理设置-搜索任务

搜索任务模块只显示用户添加的内容,软件内置的搜索任务不会显示,所以即便这里是空白的,软件依然可以自动抓取代理。

疯狂IE代理设置-添加搜索任务

点击【添加】按钮将进入添加代理任务窗口,您需要提供一个代理来源网址,这个页面您需要自己获取或由您的代理提供商为你提供,唯一需要保证的是这个链接打开之后就是结果页面,不需要登录或其它验证。

表达式值是从上述页面源码中抓取代理用的,分为两组:第一组提取代理IP,第二组提取代理端口。默认的表达式可以应付绝大多数网站代理的抓取,如果您添加的来源页面没有问题但是软件抓取不到代理,可能是因为该网站的代理格式软件未能识别,你可以自行修改表达式值或联系作者为您设计表达式。

为了应对有多个页面的情况,来源链接中支持页码变量,可以将多链接合并成一个任务,来源链接框最右边有一个小按钮,点击即可插入页码变量。比如某代理网站有十个页面,链接如下(注意红字):

http://www.proxy.com/list-1.htm

http://www.proxy.com/list-2.htm

...

http://www.proxy.com/list-10.htm

常规的方法是需要分别添加十个搜索任务,如果用上页码变量一个任务就可以搞定:

http://www.proxy.com/list-[$1,10$].htm

收费代理

疯狂IE代理设置-收费任务

疯狂IE内置了众多的代理搜索任务,收录了国内外知名的代理网站,获取的都是免费的HTTP代理。因这些代理IP都是公开发布的,使用的人很多,所以时效性及速度都不太理想,日有效IP大概在2000左右。

如果这些免费代理不能满足要求,请考虑使用收费代理,价格是每天一元,不限数量提取。淘宝上的收费代理是什么价格您可以自行比较,目前的行情是一块钱1000至6000IP,用完为止。此收费代理由企达软件向第三方代理提供商集中采购,每日不限次数提取,日有效IP至少在5000左右(可能因提供商的问题导致代理数量不足,此属于不可抗力,企达软件会选择多家代理提供商,尽量避免此问题)。

收费代理模块目前尚未推出,等功能完善之后会适时上线,目前软件中的收费代理模块只是演示并不可用。