隨著計(jì)算能力的增強(qiáng)和互聯(lián)網(wǎng)的普及,計(jì)算機(jī)和金融領(lǐng)域的結(jié)合也越來越密切,現(xiàn)階段在自動(dòng)化交易系統(tǒng)、智能投顧、欺詐識(shí)別等場(chǎng)景下已經(jīng)取得的一定的成果。
在金融領(lǐng)域,迅速、全面、準(zhǔn)確地獲取有價(jià)值的行業(yè)信息是決定一個(gè)企業(yè)成敗的關(guān)鍵。近些年,隨著互聯(lián)網(wǎng)和金融行業(yè)的快速發(fā)展,每天都有大量的金融文本產(chǎn)生,面對(duì)著海量的公司年報(bào)、公告、新聞,其內(nèi)容分散,數(shù)據(jù)稀疏,無結(jié)構(gòu)化信息等特點(diǎn)逐漸凸顯。如何在數(shù)據(jù)爆炸的信息中高效找到有價(jià)值的知識(shí),將有價(jià)值的無結(jié)構(gòu)化信息進(jìn)行半結(jié)構(gòu)化或結(jié)構(gòu)化是首先需要解決的問題,而信息抽取則是知識(shí)發(fā)現(xiàn)的核心之一。
目前在金融領(lǐng)域中,文本內(nèi)容的知識(shí)抽取主要依靠人工判斷,分析人員一般需要閱讀大量的相關(guān)文檔(如:年報(bào)、公告、行業(yè)分析報(bào)告、新聞等),然后從中獲取關(guān)鍵信息,為決策提供依據(jù)。這種手工作業(yè)的方式效率較低,且依賴于從業(yè)人員的經(jīng)驗(yàn),學(xué)習(xí)門檻較高,不利于企業(yè)業(yè)務(wù)進(jìn)一步拓展。
計(jì)算機(jī)領(lǐng)域中的自然語言處理技術(shù)是作為一門融合語言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)等學(xué)科特點(diǎn)于一體的技術(shù),通過自然語言處理的相關(guān)技術(shù)可以從文本中取得半結(jié)構(gòu)化的知識(shí)描述,然后由半結(jié)構(gòu)化知識(shí)而構(gòu)造的知識(shí)圖譜,在解決金融領(lǐng)域相關(guān)問題時(shí)具有重要意義。NLPIR語義智能平臺(tái)KGB知識(shí)圖譜是基于漢語詞法分析,采用KGB語法從結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化文檔中抽取各類知識(shí),大數(shù)據(jù)語義智能分析與知識(shí)推理,深度挖掘知識(shí)關(guān)聯(lián),實(shí)時(shí)高效構(gòu)建知識(shí)圖譜。
KGB知識(shí)圖譜核心技術(shù)具備以下特色:
KGB知識(shí)抽取
KGB(Knowledge Graph Builder)知識(shí)圖譜是基于漢語詞法分析的基礎(chǔ)上,采用KGB語法實(shí)現(xiàn)了實(shí)時(shí)高效的知識(shí)生成,可以從非結(jié)構(gòu)化文本中抽取各類知識(shí),并實(shí)現(xiàn)了從表格中抽取指定的內(nèi)容等。KGB知識(shí)圖譜引擎可以定義不同的動(dòng)作,增加、刪除、修改、抽取等等。每一類動(dòng)作還能自定義各類后處理程序。
語義智能分析
NLPIR大數(shù)據(jù)語義智能分析融合了網(wǎng)絡(luò)精準(zhǔn)采集、自然語言理解、文本挖掘和語義搜索的*新研究成果,是大數(shù)據(jù)時(shí)代語義智能分析的一大利器。NLPIR大數(shù)據(jù)語義智能分析十三大功能:精準(zhǔn)采集、文檔抽取、新詞發(fā)現(xiàn)、批量分詞、語言統(tǒng)計(jì)、文本聚類、文本分類、摘要實(shí)體、智能過濾、情感分析、文檔去重、全文檢索與編碼轉(zhuǎn)換。
語義準(zhǔn)確搜索
JZSearch大數(shù)據(jù)語義搜索融合了自然語言理解、網(wǎng)絡(luò)搜索和文本挖掘的技術(shù),通過人機(jī)互動(dòng)、深度機(jī)器學(xué)習(xí)后具有一定的語義推理能力,結(jié)合了人工智能技術(shù)的新一代搜索引擎,具有專業(yè)、高擴(kuò)展性和高通用性的特點(diǎn)。NLPIR大數(shù)據(jù)語義智能分析平臺(tái)是針對(duì)互聯(lián)網(wǎng)內(nèi)容處理的全技術(shù)鏈條的共享開發(fā)平臺(tái)。 |
 |
|