您现在所在的位置:首页>>产业化发展>>成果推荐
基于网页信息采集分析的科技情报辅助工具
发布时间:2018-03-30 14:35

成果图片1

成果图片2

成果图片3

成果研发了我国第一款能够实现融合分析不同来源中文网页数据的科技情报通用工具。成果的研发是在把握创新方向,优化创新决策,提高创新效率,降低创新风险的大背景下,以解决情报界所面临方法手段、时效性、全领域覆盖能力、潜在情报点发现等核心能力缺失问题为总体目标下开展的。成果创建了以“情报判读”为中心的情报3.0工作体系;提出一套网页信息自动抓取、结构化处理及文本实体识别与关联性分析的综合集成方法;开发了一款能够抓取不同来源中文网页数据并进行融合分析的情报通用工具。成果解决了纯人工手段无法胜任大数据情报工作的共性问题,以及所有专业和技术领域科技词库的自动快速构建问题;突破了情报界盛行的以事实型数据为主的情报分析观点,提出了过程型数据的观点。

成果首次以多种抓取策略并行的方式开发网页信息采集系统;构建了我国首个覆盖全领域的动态更新科技词库;研究开发了第一个基于大数据的学术专题情报报告快速生成工具;按照综合集成研讨体系思想,创建了人机协作的情报工作流程;研究设计了以海量数据为基础、以情报判读为中心的分析指标及其理论支撑。成果使传统情报工作效率提高了十几倍,实现了情报工作负荷从以搜索为中心到以判读为中心的转变。

成果已在全国20多家省市级科技情报机构及首都地区30多家高校图书馆获得推广应用。应用单位普遍反映,情报工作效率获得大幅提升,科技决策与政府决策效果更加明显。

(技术转移中心整理提供)