投資風險評定及債務履約能力評級報告
投資價值分析報告
上海天元項目數據分析師事務所有限公司
地址:上海市徐匯區天鑰橋路329號B棟9樓
王經理:021-24193019
郵箱:2860763820@qq.com
自去年AlphaGo戰勝李世石以來,AI的熱度一致居高不下,將近期了解知識簡單梳理,供大家學習和討論。
什么是大數據-大數據時代,數據不再僅僅指數字或數字構成的,數據的范疇要大的多。包括:互聯網上的任何內容,比如文字、圖片以及視頻;書籍中的文字內容;醫院里包括醫學影像在內的所有醫學檔案資料;公司里的設計圖紙、設計文檔等;科學研究中的各種觀測數據以及歷史研究成果;甚至我們人類活動本身,也可被看成一種特殊的數據,比如我們在微信朋友圈等社交網絡的行為,瀏覽網絡的記錄,我們每天的出行軌跡、活動范圍等。從以上數據來源的紛繁復雜性,大數據的“大”的特征是不言而喻的,但大數據的特征不僅僅是體量大,還需要具備多維度以及完備性的特點,才足以刻畫出一個立體的事物。
什么是人工智能-學術界將人工智能分為傳統人工智能方法和現代人工智能方法。那么傳統人工智能方法是怎樣的呢-其實簡單地講,傳統人工智能的思路是,首先了解人類是如何產生智能的,然后讓機器按照人的思路去做。這是對人工智能直覺認識,早期科學家也在這個方向上進行了很長時間的研究,到20世紀60年代末實在發展不下去了。
20世紀70年代,人類開始嘗試機器智能的另外一條發展道路,即采用數據驅動和超級計算的方法。該方法首先被康內爾大學的教授賈里尼克用于研究語音識別,在賈里尼克之前,各個大學和研究所得專家們在這個問題上已經花了近20年的時間,主流的研究方法有兩個特點:一是讓計算機盡可能地模擬人的發音特點和聽覺特征,二是利用人工智能的方法理解人所講的完整語句。對于*一項研究,又被稱為特征提取,大家提取特征的方式不一,好壞也不一。對于第二項研究,大家都采用了傳統人工智能方法,基于語法規則和語義規則。但賈里尼克不是語言學專家,而是一位通信專家,在他看來,語音識別其實就是一個通信問題。
通信過程
典型的通信過程如圖1所示。對端是信息源,將所要表達的觀點組織成語言然后表達出來,實際上是信息編碼的過程。信息源發出的語音通過聲道、空氣等媒介傳播到本端,本端對所接收的信息進行解讀,理解對端意思的過程就是信息解碼的過程。既然是通信問題,就采用解決通信問題的方法,為此賈里尼克用兩個數學模型分別表示信源和信道,找到數學模型后,下一步就是采用統計的方法用大數據訓練模型的參數,這就是“機器學習”的過程。在這個過程中,需要有大量的數據和足夠的計算能力。
數據使用的基本流程 |
 |
|