知識圖譜是以科學知識為對象,顯示科學知識的發展進程與結構關系的一種圖形。科學知識圖譜研究,是以科學學為研究范式,以引文分析方法和信息可視化技術為基礎,涉及數學、信息科學、認知科學和計算機科學諸學科交叉的 領域,是科學計量學和信息計量學的新發展。科學知識圖譜具有“圖”和“譜”的雙重性質與特征:既是可視化的知識圖形,又是序列化的知識譜系,顯示了知識元或知識群之間網絡、結構、互動、交叉、演化或衍生等諸多復雜的關系。借助科學知識圖譜,人們可以透視龐大的人類知識體系中各個領域的結構,理順當代知識大爆炸形成的復雜知識網絡,預測科學技術知識前沿發展的*新態勢。
北京理工大學大數據搜索與挖掘實驗室張華平主任研發的KGB知識圖譜引擎,KGB知識圖譜引擎(Knowledge Graph Builder)是基于自然語言理解、漢語詞法分析,采用KGB語法從結構化數據與非結構化文檔中抽取各類知識,大數據語義智能分析與知識推理,深度挖掘知識關聯,實時高效構建知識圖譜。
KGB知識圖譜引擎功能介紹
一、文檔提取
1、輕松解析多種格式文檔:KGB知識圖譜引擎,可輕松解析多種格式、多種版本文檔:TXT、DOC、EXCEL、PPT、PDF、XML等。對于圖片信息,OCR可自動識別并抽取圖片中的文字信息。
2、結構化表格數據知識抽取:KGB能夠自適應解讀并抽取結構化表格數據,實現知識的快速生成。
3、非結構化文檔知識抽取:KGB知識規則引擎,快速定位非結構化文檔中的關鍵信息(主體、時間、金額等),高效抽取知識。
二、知識關聯
KGB知識圖譜引擎深入挖掘知識關聯,將知識實體鏈接為有意義的知識事實。并具有強大的知識推理能力,推理暗含的知識與結論,豐富知識圖譜。
三、知識推理
KGB具有強大的知識推理能力,推理出暗含的知識,獲取更多知識與結論,豐富知識圖譜。
1、演繹歸納推理(一般—特殊):KGB能夠完成由一般特征到特殊個案的演繹知識推理和由特殊個案到一般特征的歸納知識推理,擴充大量暗含的知識,豐富知識圖譜。
2、知識計算(數值知識的加減乘除計算):對于數值型知識,KGB能夠識別并對數值型知識進行加減乘除的知識計算推理,并可對知識計算的準確性進行核查。
3、知識庫檢查:KGB能夠實時檢查知識庫,糾正知識錯誤與沖突,保證知識圖譜正確性與一致性。 |
|