广告联盟网

 找回密码
 注册
查看: 1264|回复: 4
打印 上一主题 下一主题

采集别人的站是一个苦差事

[复制链接]
跳转到指定楼层
1#
发表于 2005-9-2 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
最近心血来潮采别人的一个站,60万条数据昨天采了一夜才下来10万条,空间占了2G多
不知道入库要多少时间,生成还要多少时间,想想就怕
5#
发表于 2005-9-12 | 只看该作者
采集可以自动完成吗
4#
发表于 2005-9-8 | 只看该作者
要是页面结构良好就比较容易,要是比较烂可真麻烦。
有的时候用正则,有的时候就干脆截字符
没找到合用的采集程序
以前看到过国外的一个程序,可以选择页面内容,然后生成WEBSERVICE,很牛
3#
 楼主| 发表于 2005-9-2 | 只看该作者
QUOTE:

Originally posted by BingQ at 2005-9-2 01:40 PM:
哪个采集程序好点,动易的那次看了一下好复杂,没有弄

如果你想用某个现成的采集程序就算了,因为一般的好点的信息站点都有防采集的设置
程序得自己写,采完以后还得分析代码和入库再生成
2#
 楼主| 发表于 2005-9-2 | 只看该作者
没什么用途,也不是针对搜索引擎
只是看到那么多人在采集,也是一个站长吹牛B说没有人可以采集他的站我们才干的
纯粹好玩和练手
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|广告联盟网  

GMT, 2024-11-24 , Processed in 0.070400 second(s), 20 queries .

Powered by Discuz! X3.2

© 2005-2021 www.ggads.com GGADS 广告联盟网

快速回复 返回顶部 返回列表