广告联盟网

 找回密码
 注册
查看: 1058|回复: 13
打印 上一主题 下一主题

今天做了数据采集, 感想很深

[复制链接]
跳转到指定楼层
1#
发表于 2007-2-11 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
今天做了数据采集,那真是超级累.
最后我发现原来这个站点做了防采集.KAO.
可以说,PCLADY是做得最好的防采集网站了.
如果你的数据不想被人采集,你们可以学学PCLADY.
13#
发表于 2007-2-13 | 只看该作者
对于文章的版权。现在国家管得如何?
12#
发表于 2007-2-12 | 只看该作者
注意:

“转载并加工过的”文章违反署名-非商业性使用-禁止演绎 2.5 中国大陆(http://creativecommons.org/licenses/by-nc-nd/2.5/cn/deed.zh)之“禁止演绎. 您不得修改、转换或者以本作品为基础进行创作。”的规定。
11#
 楼主| 发表于 2007-2-12 | 只看该作者
如果采集后,归个类,还是有作用的。
也不能算是垃圾。
10#
发表于 2007-2-12 | 只看该作者


QUOTE:
原帖由 davidyin 于 2007-2-12 06:50 发表


对于采集来说,数据加工很重要.
而原创的内容毫无用处,同意你的意见.

我的博客一共100多篇文章,20%的是原创,其它的是转载并加工过的,每天带来的ip比较客观
9#
发表于 2007-2-11 | 只看该作者


QUOTE:
原帖由 91free 于 2007-2-11 08:28 发表
采集完后是垃圾数据说明你选择目标时有问题,采集后并不整理筛选及再分类直接用也只能是个COPY,也可以算作垃圾。

如果你的“原创文章”也针对搜索引擎,说实在的,也只能算是垃圾。

对于采集来说,数据加工很重要.
而原创的内容毫无用处,同意你的意见.
8#
发表于 2007-2-11 | 只看该作者


QUOTE:
原帖由 fuda 于 2007-2-11 16:50 发表
今天做了数据采集,那真是超级累.
最后我发现原来这个站点做了防采集.KAO.
可以说,PCLADY是做得最好的防采集网站了.
如果你的数据不想被人采集,你们可以学学PCLADY.

笑一个 ;]
7#
发表于 2007-2-11 | 只看该作者
恩做人要厚道!
6#
发表于 2007-2-11 | 只看该作者


QUOTE:
原帖由 Benxiaohai 于 2007-2-11 19:55 发表
采集没用,开始时我采集了上万条数据,后来直接全部删除了,因为都是垃圾数据

现在开始老老实实的自己改写或原创文章了,虽然量少,但是带来的ip却比那几万篇要多的多

同意,我们的想法和行动是一致的
5#
发表于 2007-2-11 | 只看该作者
采集没用,开始时我采集了上万条数据,后来直接全部删除了,因为都是垃圾数据

现在开始老老实实的自己改写或原创文章了,虽然量少,但是带来的ip却比那几万篇要多的多
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|广告联盟网  

GMT, 2024-11-26 , Processed in 0.069744 second(s), 20 queries .

Powered by Discuz! X3.2

© 2005-2021 www.ggads.com GGADS 广告联盟网

快速回复 返回顶部 返回列表