|
九九信用 大象金服北京科技有限公司
聯(lián)系人:張
先生 (CEO) |
電 話(huà):010-62648216 |
手 機(jī): |
 |
|
 |
|
KGB知識(shí)圖譜實(shí)現(xiàn)金融行業(yè)的結(jié)構(gòu)化信息抽取 |
隨著計(jì)算能力的增強(qiáng)和互聯(lián)網(wǎng)的普及,計(jì)算機(jī)和金融領(lǐng)域的結(jié)合也越來(lái)越密切,現(xiàn)階段在自動(dòng)化交易系統(tǒng)、智能投顧、欺詐識(shí)別等場(chǎng)景下已經(jīng)取得的一定的成果。
在金融領(lǐng)域,迅速、全面、準(zhǔn)確地獲取有價(jià)值的行業(yè)信息是決定一個(gè)企業(yè)成敗的關(guān)鍵。近些年,隨著互聯(lián)網(wǎng)和金融行業(yè)的快速發(fā)展,每天都有大量的金融文本產(chǎn)生,面對(duì)著海量的公司年報(bào)、公告、新聞,其內(nèi)容分散,數(shù)據(jù)稀疏,無(wú)結(jié)構(gòu)化信息等特點(diǎn)逐漸凸顯。如何在數(shù)據(jù)爆炸的信息中高效找到有價(jià)值的知識(shí),將有價(jià)值的無(wú)結(jié)構(gòu)化信息進(jìn)行半結(jié)構(gòu)化或結(jié)構(gòu)化是首先需要解決的問(wèn)題,而信息抽取則是知識(shí)發(fā)現(xiàn)的核心之一。
目前在金融領(lǐng)域中,文本內(nèi)容的知識(shí)抽取主要依靠人工判斷,分析人員一般需要閱讀大量的相關(guān)文檔(如:年報(bào)、公告、行業(yè)分析報(bào)告、新聞等),然后從中獲取關(guān)鍵信息,為決策提供依據(jù)。這種手工作業(yè)的方式效率較低,且依賴(lài)于從業(yè)人員的經(jīng)驗(yàn),學(xué)習(xí)門(mén)檻較高,不利于企業(yè)業(yè)務(wù)進(jìn)一步拓展。
計(jì)算機(jī)領(lǐng)域中的自然語(yǔ)言處理技術(shù)是作為一門(mén)融合語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)等學(xué)科特點(diǎn)于一體的技術(shù),通過(guò)自然語(yǔ)言處理的相關(guān)技術(shù)可以從文本中取得半結(jié)構(gòu)化的知識(shí)描述,然后由半結(jié)構(gòu)化知識(shí)而構(gòu)造的知識(shí)圖譜,在解決金融領(lǐng)域相關(guān)問(wèn)題時(shí)具有重要意義。NLPIR語(yǔ)義智能平臺(tái)KGB知識(shí)圖譜是基于漢語(yǔ)詞法分析,采用KGB語(yǔ)法從結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文檔中抽取各類(lèi)知識(shí),大數(shù)據(jù)語(yǔ)義智能分析與知識(shí)推理,深度挖掘知識(shí)關(guān)聯(lián),實(shí)時(shí)高效構(gòu)建知識(shí)圖譜。
KGB知識(shí)圖譜核心技術(shù)具備以下特色:
KGB知識(shí)抽取
KGB(Knowledge Graph Builder)知識(shí)圖譜是基于漢語(yǔ)詞法分析的基礎(chǔ)上,采用KGB語(yǔ)法實(shí)現(xiàn)了實(shí)時(shí)高效的知識(shí)生成,可以從非結(jié)構(gòu)化文本中抽取各類(lèi)知識(shí),并實(shí)現(xiàn)了從表格中抽取指定的內(nèi)容等。KGB知識(shí)圖譜引擎可以定義不同的動(dòng)作,增加、刪除、修改、抽取等等。每一類(lèi)動(dòng)作還能自定義各類(lèi)后處理程序。
語(yǔ)義智能分析
NLPIR大數(shù)據(jù)語(yǔ)義智能分析融合了網(wǎng)絡(luò)精準(zhǔn)采集、自然語(yǔ)言理解、文本挖掘和語(yǔ)義搜索的*新研究成果,是大數(shù)據(jù)時(shí)代語(yǔ)義智能分析的一大利器。NLPIR大數(shù)據(jù)語(yǔ)義智能分析十三大功能:精準(zhǔn)采集、文檔抽取、新詞發(fā)現(xiàn)、批量分詞、語(yǔ)言統(tǒng)計(jì)、文本聚類(lèi)、文本分類(lèi)、摘要實(shí)體、智能過(guò)濾、情感分析、文檔去重、全文檢索與編碼轉(zhuǎn)換。
語(yǔ)義準(zhǔn)確搜索
JZSearch大數(shù)據(jù)語(yǔ)義搜索融合了自然語(yǔ)言理解、網(wǎng)絡(luò)搜索和文本挖掘的技術(shù),通過(guò)人機(jī)互動(dòng)、深度機(jī)器學(xué)習(xí)后具有一定的語(yǔ)義推理能力,結(jié)合了人工智能技術(shù)的新一代搜索引擎,具有專(zhuān)業(yè)、高擴(kuò)展性和高通用性的特點(diǎn)。NLPIR大數(shù)據(jù)語(yǔ)義智能分析平臺(tái)是針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開(kāi)發(fā)平臺(tái)。 |
 |
|
|
|
 |
|
|