CNDEV
CNDEV.ORG
当前在线
论坛
CBD
程序员情感CBD
程序员见面交流会
CBD开发区
Java/J2ME
.NET/C#
数据库
Delphi/BCB
Visual C
其它
修真养身
中国象棋
纪念日
谈钱太俗,还是投机吧
听音乐
iCosta
资源共享
一隅
好文共赏
看电影看美剧
待定
狗屎
雪域召唤
工作流
专业显摆区
语录
情感
批评与自我批评
爱情故事
发牢骚
看三点区
游戏
CNDEV-CS/WOW
浩宇长空
生活
家有XPH
我爱学英语
美食天地ORG
半调子体育迷
观澳园友邻
搞笑奇文
拍照片
我读书我存在
论坛系统
超级垃圾站
系统建议及BUG
系统测试
中国开发网
: 论坛:
程序员情感CBD
: 贴子 783560
Apache
: 模板这种太麻烦了,需要给每一类都做一个模板
[阅读: 180] 2010-01-05 21:34:01
<空>
相关信息:
如果我想把一个网页的正文(非固定格式,图文) 抓出来,有没有什么好的思路或成熟的方案吗?
(空) (
Apache
[214]
2010-01-05 21:29
)
html parser,我现在能想到的还是需要有解析模板才行,以前干过google的关键字新闻。
(空) (
乌烟
[205]
2010-01-05 21:32
)
codeplex上有c#的实现
(空) (
乌烟
[172]
2010-01-05 21:33
)
模板这种太麻烦了,需要给每一类都做一个模板
(空) (
Apache
[179]
2010-01-05 21:34
)
呵呵,归根到底你还得考虑html tag,我理解还是模板。
(空) (
乌烟
[156]
2010-01-05 21:36
)
找两个开源爬虫看看
(空) (
乌烟
[200]
2010-01-05 21:37
)
我也是这样想的,不过据说坛上某位大牛做过比这个高级多的东西,想听听他的思路
(空) (
Apache
[200]
2010-01-05 21:39
)
调用Word的存为文本功能
(空) (
sealw
[216]
2010-01-05 21:39
)
这个办法不错.
(空) (
bjwf
[191]
2010-01-05 21:44
)
欢迎光临本社区,您还没有登录,不能发贴子。请在
这里登录