设为首页 加入收藏

关于征集信息采集系统开发方案委托开发的通知

发布日期:2013-05-10 00:00:00 来源:管理员

为了进一步建设“西安节能环保科技创新服务网”,增加信息自动收索和更新功能,提高工作效率,现公开征集信息采集系统开发方案,具体如下:

一、开发者资格要求

具备软件开发能力,有信息采集系统开发经历者优先。

二、技术要求

(一)技术开发目标。

1、采集数据。包括采集网址,采集内容。这个过程是获得数据的过程。系统会根据系统中设置的采集规则对数据进行采集,在采集的过程中同时也是对内容做了处理。

2、发布数据。这两个过程都必须实现。将数据发布到自己的论坛,CMS的过程,也是实现数据为己有的过程。可以用WEB在线发布,数据库入库或存为本地文件。具体的发布机制也可以通过系统进行设置(先采集编辑后再发布、边采集边发布)。

(二)技术开发内容

1、采集规则的自定义:通过定义的采集规则可以搜索到所有网站采集几乎任何类型的信息。

2、多任务多线程采集:可以同时进行多个信息的采集,每个人物可以使用多个线程。

3、数据保存:把采集到的数据保存到关系数据库中,并且可以数据结构自适应。

4、断点续采:采集任务可以在停止后从断点开始采集,不用担心任务中断问题。

5、计划任务:使用该功能可以让你的采集任务定时、定量或者一直循环的执行。

6、采集范围限制:根据采集的深度和网址的标示来限制。

7、过滤重复内容:可以根据用户设置和实际情况对重复内容进行自动删除。

8、特殊链接识别:可以通过该功能把用js生成的链接和其他的连接识别开来。

9、数据发布:可以通过自定义接口、把采集到的数据发布到任意的内容管理系统和指定数据库中(支持多种发布方式)。

10、支持所有网站编码:支持采集所有编码格式的网页、程序会自动识别网页编码。

11、文件下载:可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。

12、本地编辑:对采集的内容进行可视化编辑。

13、预留程序接口:定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。

(三)数据库格式

能够与“西安节能环保科技创新服务网”数据库(开发语言采用asp.net,数据库采用sql sever 2005)相兼容。

(四)知识产权

所形成的知识产权归西安生产力促进中心所有。

三、开发周期

合同签订后六个月以内。

四、售后服务

质保期为验收合格后1年,常年提供售后服务,对于故障能12小时内派人处理。

五、资料提供

“西安节能环保科技创新服务网”信息采集系统开发方案,方案报价,企业营业执照、税务登记证和组织结构代码证等资格证各一份。

六、中选原则

在符合技术要求前提下,价格最低者入选。

七、截止时间

2013年6月10日15:00

联系人:李先生

电话/传真:029-88417598

西安生产力促进中心

2013年5月9日