发布日期:2013-05-10 00:00:00 来源:管理员
为了进一步建设“西安节能环保科技创新服务网”,增加信息自动收索和更新功能,提高工作效率,现公开征集信息采集系统开发方案,具体如下:
一、开发者资格要求
具备软件开发能力,有信息采集系统开发经历者优先。
二、技术要求
(一)技术开发目标。
1、采集数据。包括采集网址,采集内容。这个过程是获得数据的过程。系统会根据系统中设置的采集规则对数据进行采集,在采集的过程中同时也是对内容做了处理。
2、发布数据。这两个过程都必须实现。将数据发布到自己的论坛,CMS的过程,也是实现数据为己有的过程。可以用WEB在线发布,数据库入库或存为本地文件。具体的发布机制也可以通过系统进行设置(先采集编辑后再发布、边采集边发布)。
(二)技术开发内容
1、采集规则的自定义:通过定义的采集规则可以搜索到所有网站采集几乎任何类型的信息。
2、多任务多线程采集:可以同时进行多个信息的采集,每个人物可以使用多个线程。
3、数据保存:把采集到的数据保存到关系数据库中,并且可以数据结构自适应。
4、断点续采:采集任务可以在停止后从断点开始采集,不用担心任务中断问题。
5、计划任务:使用该功能可以让你的采集任务定时、定量或者一直循环的执行。
6、采集范围限制:根据采集的深度和网址的标示来限制。
7、过滤重复内容:可以根据用户设置和实际情况对重复内容进行自动删除。
8、特殊链接识别:可以通过该功能把用js生成的链接和其他的连接识别开来。
9、数据发布:可以通过自定义接口、把采集到的数据发布到任意的内容管理系统和指定数据库中(支持多种发布方式)。
10、支持所有网站编码:支持采集所有编码格式的网页、程序会自动识别网页编码。
11、文件下载:可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
12、本地编辑:对采集的内容进行可视化编辑。
13、预留程序接口:定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。
(三)数据库格式
能够与“西安节能环保科技创新服务网”数据库(开发语言采用asp.net,数据库采用sql sever 2005)相兼容。
(四)知识产权
所形成的知识产权归西安生产力促进中心所有。
三、开发周期
合同签订后六个月以内。
四、售后服务
质保期为验收合格后1年,常年提供售后服务,对于故障能12小时内派人处理。
五、资料提供
“西安节能环保科技创新服务网”信息采集系统开发方案,方案报价,企业营业执照、税务登记证和组织结构代码证等资格证各一份。
六、中选原则
在符合技术要求前提下,价格最低者入选。
七、截止时间
2013年6月10日15:00
联系人:李先生
电话/传真:029-88417598
西安生产力促进中心
2013年5月9日