haitao:
论坛防火墙封住了负责内容监控的爬虫——上了传统媒体了。。。。。。。。
[阅读: 272] 2010-11-24 03:28:34
论坛防火墙封住了负责内容监控的爬虫
程序员论坛JavaEye被关闭
类别:国内新闻 浏览量:671 版次:AA42 版名:网眼 稿源:南方都市报 2010-11-24
作者:张书舟
南都讯 记者张书舟 22日13时左右,国内著名的程序员论坛JavaEye被关闭,网站一度提示“网站因有违规内容而被关闭,具体事宜请联系您的接入商”,而后再也法访问。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)
JavaEye创始人范凯22日下午在微博上表示,JavaEye被封是因为他为JavaEye编写的防火墙代码太智能,把电信负责内容监控的爬虫给封了,并感叹说:“这年头,代码写得好也是杯具啊。”范凯还透露,这个爬虫“可能是在W indow s机器上跑的一个程序,自动调用IE内核不停地扫描网页”。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)
据IT业人士透露,现在的ID C(接入服务商)或者电信部门,都会要求虚拟主机安装主动式监控软件,同时还会有一些扫描工具“用来做内容监控”,这些软件会自动扫描所有网页和链接,国外称为“机器人”,国内称为“爬虫”。范凯编写的防火墙正是为了针对这种内容监控扫描。范凯还公布了自己的防火墙技术原理,在这篇文章中他称编写此防火墙的原因是因为爬虫“会导致网站访问速度缓慢,甚至无法访问,而且侵犯了网站的版权”。(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)
在微博中,范凯还透露了JavaEye被关的细节,他说他的防火墙封爬虫时会要求填注册码,如果不填注册码才封。“刚才查了一下日志,发现网段被封之后,该网段都有IP登录上来填注册码解封、被封,然后填注册码解封、再被封,几次三番下来,把监管人员逗急了,就下手了。”(南方都市报 www.nddaily.com SouthernMetropolisDailyMark 南都网)
22日下午,范凯曾表示“把监控爬虫加入白名单了,争取下午恢复网站访问”,并一度宣布下午6—7点可恢复访问,晚上7点11分又宣布23日上午可恢复访问,但直到23日晚,JavaEye依然无法访问。