用PHP写了一个采集程序
作者:不烦恼 发布时间:July 1, 2011 分类:快乐学习 评论:12
采集需求:
1、采集某网站的若干文章和评论,入库
2、本站用户新发布文章、评论(包括对已采集的文章附加评论)
3、定期再将采集网站相关文章最近更新的未采集评论附加入库
比对库:
DROP TABLE IF EXISTS {TABLEPRE_}spiders; CREATE TABLE {TABLEPRE_}spiders ( sid mediumint(8) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '采集ID', mid mediumint(8) UNSIGNED NOT NULL DEFAULT '0' COMMENT '关联消息ID', tid bigint(11) UNSIGNED NOT NULL DEFAULT '0' COMMENT '已采集文章ID', lastcid bigint(11) UNSIGNED NOT NULL DEFAULT '0' COMMENT '已采集最后评论ID', lasttime int(10) UNSIGNED NOT NULL DEFAULT '0' COMMENT '最后采集时间', PRIMARY KEY(sid), KEY tid (tid), KEY mid (mid) ) TYPE=MyISAM;
采集目标:百度贴吧
采集效果:漠河群
采集后果:
也许很严重,待验证后续更新!