CNDEV
CNDEV.ORG
当前在线
论坛
CBD
程序员情感CBD
程序员见面交流会
CBD开发区
Java/J2ME
.NET/C#
数据库
Delphi/BCB
Visual C
其它
修真养身
中国象棋
纪念日
谈钱太俗,还是投机吧
听音乐
iCosta
资源共享
一隅
好文共赏
看电影看美剧
待定
狗屎
雪域召唤
工作流
专业显摆区
语录
情感
批评与自我批评
爱情故事
发牢骚
看三点区
游戏
CNDEV-CS/WOW
浩宇长空
生活
家有XPH
我爱学英语
美食天地ORG
半调子体育迷
观澳园友邻
搞笑奇文
拍照片
我读书我存在
论坛系统
超级垃圾站
系统建议及BUG
系统测试
中国开发网
: 论坛:
程序员情感CBD
: 贴子 293606
Water-E
:
很早以前用delphi写过一个这么样的玩意,专门用来搜索email地址的。CJF好像也干过
[阅读: 462] 2006-03-10 04:24:37
<空>
相关信息:
技术贴
(66字)
(
ysb_ysb_ysb
[551]
2006-03-10 03:18
)
不能垮下去!
(空) (
ysb_ysb_ysb
[387]
2006-03-10 03:27
)
你又想搞么事?,帮你顶
(空) (
C007
[434]
2006-03-10 03:28
)
网页爬虫程序加网页结构化提取程序
(空) (
李战
[1501]
2006-03-10 03:34
)
恩,先搜寻这方面的资料看看
(空) (
ysb_ysb_ysb
[414]
2006-03-10 03:39
)
那个baidu
(空) (
ysb_ysb_ysb
[438]
2006-03-10 03:43
)
那个baidu是怎么搜寻的阿 ?
(空) (
ysb_ysb_ysb
[418]
2006-03-10 03:43
)
这个爬爬虫还蛮有用的,呵呵
(空) (
ysb_ysb_ysb
[387]
2006-03-10 03:52
)
爬虫程序比较好做,一般有两种:一种是自行解析HTML中的后续链接,爬行速度快,只能解析静态链接;一种是基于浏览器的DOM来解析或获得静态或动态后续链接,爬行缓慢。
(空) (
李战
[756]
2006-03-10 05:11
)
而网页内容提取可能需要根据不同的网址模式来定义提取模式。内容项的定位往往需要先找到特征的标题文字再提取随后的内容。这个比较复杂点
(空) (
李战
[519]
2006-03-10 05:16
)
网站总有默认页吧?用 http 去取那一页。取到后,分析那个页里的链接,把每个链接指向的页面也抓下来。每个页面里又有链接....你想抓多深?
(空) (
pcplayer
[471]
2006-03-10 03:40
)
我只要把这个网站的客户资料抓下来就可以了
(空) (
ysb_ysb_ysb
[392]
2006-03-10 03:44
)
客户资料是以什么形式进行保存的,是连续的HTML页面么?
(空) (
Apache
[409]
2006-03-10 04:18
)
很早以前用delphi写过一个这么样的玩意,专门用来搜索email地址的。CJF好像也干过
(空) (
Water-E
[461]
2006-03-10 04:24
)
欢迎光临本社区,您还没有登录,不能发贴子。请在
这里登录