首頁 >> 科研成果

基于大數據智能化處理的情報挖掘系統研究及應用

湖南省科技信息研究所 www.www.nwusd.com     時間:2019月03月20日   [字體: ]

成果名稱:基于大數據智能化處理的情報挖掘系統研究及應用

成果簡介:

大數據時代,決策環境發生巨大變化,龐大而復雜的數據考驗著情報系統的技術體系結構和數據處理能力。本項目面向科技情報研究人員與科技情報服務機構,提出基于大數據智能處理的情報判讀理論、方法,運用人工智能等技術開發輔助情報判讀的情報挖掘系統,并在科技情報工作中得到系統的應用,實現了基于科研項目、論文、企業年報、網頁媒體報道等大數據的科技情報自動采集、抽取、分析以及自動生成報告,通過固化專家思路和直接展示判讀點信息的方法,使情報生產從基于個人能力的生產發展成專家與情報人員協同的標準化生產,改變了情報生產方式,建立了基于情報生產線的情報工作體系。

主要技術內容:一是從理論上提出大數據環境下情報的核心是判讀;情報判讀的目的是通過發現并跟蹤領域關鍵人物、重要機構和熱點主題,對領域發展可能的判讀點做出判斷;提出包括科研項目、學術論文、技術專利、企業年報、媒體報道等情報判讀信息要素結構框架,為情報判讀的規范化作業提供理論與方法上的支持。二是以情報判讀任務需要為導向,從一般情報判讀思維和特點出發,充分發揮判讀人員知識、經驗和主觀能動作用,綜合專業領域知識、情報學方法與信息技術等多學科領域的優勢,研究開發用于情報判讀的基于大數據智能化處理的情報挖掘群系統,具體包括基于科研項目、學術論文、專利、企業年報以及網頁媒體報道共5 個情報挖掘子系統。三是從湖南省科技信息研究所產業競爭情報判讀標志建立、子系統功能應用到群系統功能應用三個層次,研究制定了情報挖掘系統在不同情報判讀任務類型中的應用方法與技術流程。

知識產權情況:取得計算機軟件著作權10 項,著作2 本,論文12 篇(含人大復印資料全文收錄一篇)。

技術經濟指標:該成果建立的發達國家重大科研項目和《財富》500 強企業年報關系型數據庫和全文數據庫,GB 級數據全文檢索響應在毫秒之內;建立的中文科技詞庫收錄科技詞匯382 萬,覆蓋科技情報工作的全部領域和所有專業;中文學術論文數據覆蓋率達98%以上,論文題錄數據抓取工具響應速度為500 毫秒,1 小時平均抓取2000 篇論文,科技詞條分析工具處理速度5 分鐘,平均1 篇論文需要10 毫秒;學術研究情報挖掘描述準確率達95%以上;學術研究概貌描述情報報告完成效率較以前平均提升50%。網頁信息情報挖掘系統響應速度為500 毫秒,1 小時平均抓取20000 條互聯網文本信息,網絡文本信息實體解析速度9 分鐘,平均1 條文本信息需要27 毫秒;聚類精度達98%

應用推廣及效率情況:該成果在廣西有色金屬集團匯元錳業有限公司、中車株洲所研究院產經中心、楚天科技股份有限公司等正式使用,取得良好應用口碑,同時,該成果有效推動了湖南省產業競爭情報研究體系地不斷完善,提升了企業技術創新能力,推動了湖南省經濟建設。除此之外,該成果還在北京、浙江、河北、寧夏、山東省、廣西等10 多個省市級科技情報機構開展推廣應用,提高了科技情報事業的信息化水平,推動了科技情報挖掘分析的自動化。

信息來源:綜合辦公室
TT快3-欢迎您-首页