网站万能信息采集器的是是非非

日前在IT群里说到网站信息采集的问题,了解到北青网的编辑工作方式,完全采用微软的全自动文章提取技术,可以设定是否需要人工审核和关键字过滤。
在设定的网站频道提取文章数据,和在合作的报刊媒体提取最新数据是不同的机制。两套机制均能达到网站频道内容丰富,质量上乘的最终目的。
在设定的网站频道提取文章数据,和在合作的报刊媒体提取最新数据是不同的机制。两套机制均能达到网站频道内容丰富,质量上乘的最终目的。
又想起来,05年5月份的时候报道的新闻,猫扑新推出的“朋友圈”在未经过5460中国同学录网站和用户允许和知晓的情况下使用用户的用户名和密码用程序(从后台查证服务器IP为211.157.106.210)登陆同学录取走用户所有班级所有成员的联系方式,达到迅速扩大“朋友圈”用户数量的目的。(http://tech.sina.com.cn/i/2005-05-28/1404620615.shtml)
诚然,信息采集的功能现在已经被广泛的新闻门户型网站所采用,从技术上一举颠覆传统门户网站,由众多编辑编辑提取审核文章的局面。 把编辑从复制,粘贴中解放出来发挥更大的生产力作用,然而这种高级共享信息的方式真的能够良性发展吗?
看看我找到的一则关于网站万能信息采集器的广告:
网站万能信息采集器可以把各类网站上您想要的信息采集保存到本地数据库中. 有了网站万能信息采集器,别人需要两年才能积累起来的 信息,您只需要一天就可以达到. 有了网站万能信息采集器,就不需 要招聘网站编辑人员 有了网站万能信息采集器,可以实现信息采集添 加全自动智能完成,您睡觉时也可以保持您的网站拥有最新的信息。
四大特色功能: 1.网站登录 2.文件自动下载 3.N级页面采集 4.信息采集添加全自动
相关讨论
- 没有评论
当前位置: 