中国开发网: 论坛: 程序员情感CBD: 贴子 109621
李战: 就是从打开一个网页开始,然后收集所有可以到达的网页,再逐一去打开。如此递归,当然...
爬行路径是可以通过url格式模板来控制。打开的网页会交给不同的处理程序去处理,实现需要的搜索功能。
就算是网络爬虫引擎吧。
目前,我是在TWebBrowser基础上实现的,会看到网页自己疯狂跳转的过程,非常有意思,所以起名叫“走马观花”。
哈哈哈
李战(leadzen)

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录