中国开发网: 论坛: 程序员情感CBD: 贴子 860366
haitao
论坛防火墙封住了负责内容监控的爬虫——上了传统媒体了。。。。。。。。
论坛防火墙封住了负责内容监控的爬虫
程序员论坛JavaEye被关闭
类别:国内新闻 浏览量:671 版次:AA42 版名:网眼 稿源:南方都市报 2010-11-24
作者:张书舟

南都讯 记者张书舟 22日13时左右,国内著名的程序员论坛JavaEye被关闭,网站一度提示“网站因有违规内容而被关闭,具体事宜请联系您的接入商”,而后再也法访问。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)

JavaEye创始人范凯22日下午在微博上表示,JavaEye被封是因为他为JavaEye编写的防火墙代码太智能,把电信负责内容监控的爬虫给封了,并感叹说:“这年头,代码写得好也是杯具啊。”范凯还透露,这个爬虫“可能是在W indow s机器上跑的一个程序,自动调用IE内核不停地扫描网页”。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)

据IT业人士透露,现在的ID C(接入服务商)或者电信部门,都会要求虚拟主机安装主动式监控软件,同时还会有一些扫描工具“用来做内容监控”,这些软件会自动扫描所有网页和链接,国外称为“机器人”,国内称为“爬虫”。范凯编写的防火墙正是为了针对这种内容监控扫描。范凯还公布了自己的防火墙技术原理,在这篇文章中他称编写此防火墙的原因是因为爬虫“会导致网站访问速度缓慢,甚至无法访问,而且侵犯了网站的版权”。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)

在微博中,范凯还透露了JavaEye被关的细节,他说他的防火墙封爬虫时会要求填注册码,如果不填注册码才封。“刚才查了一下日志,发现网段被封之后,该网段都有IP登录上来填注册码解封、被封,然后填注册码解封、再被封,几次三番下来,把监管人员逗急了,就下手了。”(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)

22日下午,范凯曾表示“把监控爬虫加入白名单了,争取下午恢复网站访问”,并一度宣布下午6—7点可恢复访问,晚上7点11分又宣布23日上午可恢复访问,但直到23日晚,JavaEye依然无法访问。
我的blog:http://szhaitao.blog.hexun.com & http://www.hoolee.com/user/haitao
--以上均为泛泛之谈--
不尽牛人滚滚来,无边硬伤纷纷现 人在江湖(出来的),哪能不挨刀(总归是要的)
网络对话,歧义纷生;你以为明白了对方的话,其实呢?

您所在的IP暂时不能使用低版本的QQ,请到:http://im.qq.com/下载安装最新版的QQ,感谢您对QQ的支持和使用

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录