近年來,隨著移動通信和互聯網技術的快速發展與普及應用,數據挖掘技術得到了越來越多的關注。文本數據挖掘作為自然語言處理、機器學習和數據挖掘等多種技術的交叉研究領域,其研究熱度也逐年提升。在學術界,每年都有大量相關論文發表;在工業界,文本數據挖掘被廣泛地應用于醫療、金融風控、司法和情報分析等各個領域,極大地幫助了人們提高工作效率和分析挖掘相關信息。
而隨著移動互聯網的發展,萬物互聯成為了可能,這種互聯所產生的數據也在爆發式地增長,而且這些數據恰好可以作為分析關系的有效原料。如果說以往的智能分析專注在每一個個體上,在移動互聯網時代則除了個體,這種個體之間的關系也必然成為我們需要深入分析的很重要一部分。在一項任務中,只要有關系分析的需求,知識圖譜就“有可能”派的上用場。
北京理工大學大數據搜索與挖掘實驗室張華平主任研發的KGB知識圖譜引擎,KGB知識圖譜引擎(Knowledge Graph Builder)是基于自然語言理解、漢語詞法分析,采用KGB語法從結構化數據與非結構化文檔中抽取各類知識,大數據語義智能分析與知識推理,深度挖掘知識關聯,實時高效構建知識圖譜。
KGB知識圖譜引擎核心技術與特色
1 、KGB知識抽取
KGB(Knowledge Graph Builder)知識圖譜引擎是我們自主研發的知識圖譜構建與推理引擎,基于漢語詞法分析的基礎上,采用KGB語法實現了實時高效的知識生成,可以從非結構化文本中抽取各類知識,并實現了從表格中抽取指定的內容等。
KGB知識圖譜引擎可以定義不同的動作,增加、刪除、修改、抽取等等。每一類動作還能自定義各類后處理程序。
2 、語義智能分析
NLPIR大數據語義智能分析針對大數據內容采編挖搜的綜合需求,融合了網絡精準采集、自然語言理解、文本挖掘和語義搜索的新研究成果,先后歷時十八年,服務了全球四十萬家機構用戶,是大數據時代語義智能分析的一大利器。
NLPIR大數據語義智能分析十三大功能:精準采集、文檔抽取、新詞發現、批量分詞、語言統計、文本聚類、文本分類、摘要實體、智能過濾、情感分析、文檔去重、全文檢索與編碼轉換。
3 、語義精準搜索
JZSearch大數據語義精準搜索引擎:是靈玖軟件聯合中科院與北理工的信息檢索專家,針對大數據垂直搜索需求的全文智能檢索引擎,融合了自然語言理解、網絡搜索和文本挖掘的技術,通過人機互動、深度機器學習后具有一定的語義推理能 |
 |
|