中国开发网: 论坛: 程序员情感CBD: 贴子 701362
sealw
如果是做爬虫,用一个HTML parser可能好一点
如果是针对很有规律的页面抓内容,用正则可能好一点

Any way,把你想做什么和怎么做分开来,例如:

interface LinkExtractor;
class LinkExtractorRegImpl;
class LinkExtractorParserImpl;

先做个最简单的实现,不满意再做更高级的实现。

相关信息:


欢迎光临本社区,您还没有登录,不能发贴子。请在 这里登录