解讀人工智慧、大資料和雲端計算的關係,大佬們賭AI竟都輸了?

2019-09-19 01:18:26

導讀:人工智慧(Artificial Intelligence,AI)、大資料(Big Data)和雲端計算(Cloud Computing)是當前最受關注的技術,業內常常取這三個技術英文名的首字母將其合稱為ABC。


最近10年,資本和媒體對這三種技術的熱度按時間排序依次為:雲端計算、大資料和人工智慧。事實上,若按照技術出現的時間排序,結果正好相反,人工智慧出現最早,大資料其次,雲端計算則出現得最晚。


由於每種技術都能應用於各個領域,因此人們可以從不同的角度分別解讀每種技術。作為同時在研發和使用這三種技術的機構負責人,作者將嘗試從大資料的角度解釋ABC的關係,並且闡述這三種技術對於企業、機構和人類社會的重要性。


作者:馮雷 姚延棟 高小明 楊瑜

如需轉載請聯絡大資料(ID:hzdashuju)



人工智慧是電腦科學的一個分支,它的主要研究目標是用計算機程式來表示人類智慧。這個詞最早是在1956年的達特茅斯會議上正式提出的。在達特茅斯會議正式提出“人工智慧”這個概念之前,圖靈和早期的電腦科學家一般用“機器智慧”這個詞。


需要強調的是,人工智慧是建立在計算機之上。不管人工智慧應用多麼美妙和複雜,在圖靈眼裡都是圖靈機上的一個程式(或者叫作可計算數,具體參考《從圖靈機、圖靈測試到人工智慧:什麼決定了AI能否取代人類?)。


人工智慧課程的主要目的是學習建立在模型之上的演算法。這些演算法和其他計算機領域的演算法並無太大區別,只是這類演算法專注在如圖1-3所示的智慧主體(Intelligent Agent)裡面的模型。在人工智慧領域,電腦科學家們試圖建立模型使得智慧主體能夠觀察周圍環境並做出行動,就像人類的行為那樣。


圖1-3 智慧主體作為AI的主要研究物件


最近5年,由於智慧主體模型在無人駕駛、聊天機器人和計算機視覺識別等應用的準確率的提升,人工智慧的應用熱度也隨之提升。AlphaGo等棋類對弈讓人工智慧被公眾津津樂道,因為計算資源和計算能力的提升,在限定時間內,對弈模型比人類棋手更具優勢,這也引發了很多關於人工智慧的討論。



01 AI的發展史


自遠古時代,人類一直希望能夠創造一種類似於人類智慧的機器,將人類從乏味的重複勞動中解放出來。


直到1936年,電腦科學的鼻祖圖靈發表了名為《論可計算數》的論文,機器模擬人類智慧的哲學話題才轉變成一個可以像數學學科那樣被論證的課題。在論文中,圖靈構造了假想的機器來模仿人類。電影《模仿遊戲》講述的就是圖靈如何構造假想的機器(計算機)來模仿人類的故事。


在那個時代,人工智慧的概念還沒有提出,人們更多地使用“機器智慧”這個詞來討論計算機帶來的智慧。簡單地說,圖靈的論文證明了機器可以模仿人類智慧,所以今天的無人駕駛、聊天機器人、棋類對弈和計算機視覺識別等應用都是圖靈預見的,雖然他那時並沒有足夠的硬體條件測試這些應用。


在圖靈提出圖靈機後,多個機構便開始設計真正意義上的遵循通用圖靈機模型架構的儲存程式計算機(Stored-program Computer)。雖然第一臺儲存程式計算機(後文稱作現代計算機)是誰先發明的至今仍有爭議,但是影響較大的是馮·諾依曼提出的EDVAC(Electronic Discrete Variable Automatic Computer)。馮·諾依曼在後來也確認現代計算機的核心設計思想是受到通用圖靈機的啟發。


現代計算機發明以後,各種應用如雨後春筍一樣蓬勃發展,但是真正把人工智慧作為一個應用方向提出來還是在1956年的達特茅斯會議


在20世紀40年代末現代計算機被髮明後,從20世紀50年代開始,各個領域都開始關於“思考機器”(Thinking Machines)的討論。各個領域的用詞和方法的不同帶來了很多混淆。於是,達特茅斯學院(Dartmouth College)年輕的助理教授麥卡錫(John McCarthy)決定召集一個會議澄清思考機器這個話題。


召集這樣的會議需要贊助,聰明的麥卡錫找到了他在IBM公司的朋友羅切斯特(Nathaniel Rochester)和在普林斯頓大學的朋友閔斯基(Marvin Minsky)以及大師夏農一起在1955年寫了一份專案倡議。在倡議中,他使用了人工智慧(Artificial Intelligence)這個詞,避免和已經有的“思考機器”一詞混淆。


這裡值得一提的是閔斯基,麥卡錫和閔斯基後來在麻省理工學院領導了AI實驗室,成就了麻省理工學院在人工智慧領域首屈一指的地位。


會議在1956年舉行,這裡必須提到另外兩位短期的參會者,來自卡內基·梅隆大學的紐厄爾(Alan Newell)和司馬賀(Hubert Simon)。他們雖然只呆了一個禮拜,但是他們的報告中公佈的一款程式“邏輯理論家”(Logic Theorist)代表了人工智慧的另外一條路線。因為紐厄爾和司馬賀的奠基工作,卡內基·梅隆大學成為人工智慧的另一個重鎮。




02 對AI應用的正確預期


達特茅斯會議的意義在於確立了“人工智慧”(AI)作為電腦科學的一個研究領域,自那以後,AI在機器視覺、自然語言處理、無人駕駛等領域取得了長足發展。但是,“人工智慧”這個概念常常被過度消費。過去,美國的學者用這個概念來申請政府研究經費,今天有不少公司用這個概念來從資本市場募資。


但實際上,AI的進展並不像很多人預言的那樣樂觀。


  • 就棋類對弈而言,司馬賀在20世紀50年代末就預言計算機能打敗人類,但沒有實現;20世紀60年代末,麥卡錫打賭說計算機將在10年內打敗人類,結果他輸了;國際象棋程式深藍在“限定時間內”勝出人類直到20世紀90年代末才實現。圍棋程式AlphaGo在“限定時間內”勝出人類則是在2017年實現的。

  • 閔斯基在20世紀80年代末預言,二十年內可以解決自然語言處理問題,時至今日,各種AI應用在自然語言處理方面尚有極大差距。

  • 如今的“無人駕駛”在商用中實際上更多起到“輔助駕駛”的作用,因為在實際的使用中仍出現過意外情況,從保證行車安全的角度,尚不能實現真正的“無人駕駛”。


人工智慧最近一次的持續升溫是被包括大資料和雲端計算在內的軟硬體技術持續發展使得很多應用得以落地而驅動的(我們將在下一節中討論ABC的關係)。從歷史經驗來看,也許是由於大眾媒體和科幻電影的影響,AI界有種過於樂觀的傾向。


但實際上,我們對於AI模型的精度應該抱有十分謹慎的態度,因為我們構建的神經網路在內的很多AI模型本質上還是經驗模型,並不是一個嚴格的邏輯證明。這些模型的精度比起古典力學模型精度還差了很多。即使是古典力學模型,在微觀量子世界也是失效的,所以對於這些模型的使用範圍也要持謹慎態度。


當然,我們也不能對建立在經驗模型上的AI應用持過度懷疑的態度,因為我們的大部分知識來自經驗,事實證明,這些知識也是實用的。所以,AI是一個在不斷前進的領域。


人工智慧另外一個層面的討論是機器能否超越人類?這個問題是令我們對於人工智慧感到不安的原因。從計算機發明的第一天,圖靈和其他偉大的數學家們就已經對這個話題進行過深入的討論。


與大眾傳媒不同,數學家和電腦科學家們對這個問題的討論是深層次的數學和邏輯層面的討論。從圖靈機、圖靈測試到人工智慧:什麼決定了AI能否取代人類?著重討論AI和人的關係,有決心探究這一問題的讀者可以參考這篇文章。




03 ABC之間的關係


前面已經解釋了ABC的概念,這裡我們來討論一下ABC之間的重要內在關係以及這些內在關係帶來的可以賦能於商業的巨大技術產能。從技術角度上看,ABC之間有以下兩層重要關係:


  1. 大量資料輸入到大資料系統,從而改善大資料系統裡建立的機器學習模型。

  2. 雲端計算提供的算力使得普通機構也可以在今天用大資料系統計算大量資料從而獲得AI能力。


先看第一層關係。谷歌研究院的F. Pereira、P. Norvig和A. Halevy發表了一篇文章《資料的奇效》,解釋瞭如何通過大量資料提高機器學習模型的準確率。早在谷歌之前,微軟研究院的Michele Banko和Eric Brill在他們的論文《擴充套件到非常非常大文字來去除自然語言歧義》中,展示了使用海量資料後各個機器模型的準確率都有大幅度提高,如圖1-6所示。


這一結論為機器學習和人工智慧的問題求解指出了一個新方向:用大量資料和大資料計算來提高人工智慧。對比一下自然語言翻譯在最近10年因為利用大資料和計算所帶來的進展,讀者就能感覺到這種力量。


▲圖1-6 用海量資料後各個機器模型的準確率都有大幅度提高


再看第二層關係。雲端計算帶來的巨大好處就是提供商品化的計算資源,以前只有政府機構和大型企業才能擁有的巨大計算資源,現在可以被一個創業公司所擁有。這個從量變到質變的過程使得我們可以重新審視一些計算機行業的難題。


計算資源的豐富使得大資料技術能夠以更低的門檻被使用。雲端計算平民化了大資料技術,使得大資料技術被企業廣泛採用,企業也利用大資料養成了保管資料的習慣,把資料當作未被開採的資源。大資料的普及給人工智慧的分支——機器學習帶來了意想不到的驚喜。


綜合前面討論的ABC的內在含義,當前的機器學習、人工智慧可以朝著以下兩個方向前進:


  1. 設計新的機器學習模型,在前人的模型上有所創新,改進模型效果。

  2. 使用已有的機器學習模型,但是利用前人所沒有的資料量和雲端計算帶來的計算能力來改進模型效果。


谷歌公司的Norvig曾經說過“我們沒有更好的演算法,但是有更多的資料”。顯然,Norvig鼓勵按第二種方法進行創新,當然,這不意味著用第一種方法創新不重要。但需要指出的是,第一種方法的創新門檻要遠高於第二種,除了世界頂級的機構,普通機構很難擁有相應的資金、人才及配套的管理和文化來支撐第一種創新方法。


第二種方法對於傳統的機構也是可以重複和實踐的,按照已經有的方法論、成功案例和人才培訓可以實現基於大資料和機器學習的高階數字化轉型。


前面討論的ABC的關係可以總結成圖1-7。雲端計算從量變到質變帶來前所未有和平民化的計算資源。企業和網際網路在數字化應用方面產生了大量的資料。這些資料和計算能力使得大資料技術普及到普通機構,而這些機構利用大資料來建立和改善現有的機器學習模型,帶來更好的人工智慧成效。


▲圖1-7 ABC之間的關係


AI帶來的社會影響可能超過前三次技術革命。隨著科技和商業不斷推動AI技術前進,AI和人之間的關係是技術領袖、商業領袖和政策制定者們不得不思考的問題。


前面關於AI和人的關係的大部分討論都沒有系統化和邏輯化,因而不是一個學術討論,從圖靈機、圖靈測試到人工智慧:什麼決定了AI能否取代人類?則會在邱奇和圖靈的學術討論上回顧並延伸到AI和人的討論。這部分討論非常硬科學但是對於那些有興趣深入思考AI技術和人類關係的讀者或者希望跳出AI框架內應用創新而成為系統創新者的讀者,啃啃這根硬骨頭定有“會當凌絕頂,一覽眾山小”的感覺。


本文摘編自Greenplum:從大資料戰略到實現,經出版方授權釋出。


延伸閱讀《Greenplum:從大資料戰略到實現》

點選上圖瞭解及購買
轉載請聯絡微信:DoctorData


推薦語:本書由Greenplum核心研發團隊精心編寫,融入了團隊十餘年來對雲端計算、大資料和人工智慧驅動的企業數字化轉型、先進技術發展趨勢以及產品研發的深刻思考,對Greenplum這款快速成長的開源大資料平臺進行了全方位深度解讀,無論是企業決策者,還是大資料相關的技術人員,都能從本書中獲益。



「大資料」內容合夥人之「鑑書小分隊」上線啦!


最近,你都在讀什麼書?有哪些心得體會想要跟大家分享?


資料叔最近搞了個大事——聯合優質圖書出版商機械工業出版社華章公司發起鑑書活動。


簡單說就是:你可以免費讀新書,你可以免費讀新書的同時,順手碼一篇讀書筆記就行。詳情請在大資料公眾號後臺對話方塊回覆合夥人檢視。



有話要說👇


Q: ABC中哪一個對人類的影響最大?

歡迎留言與大家分享


猜你想看👇


  • 身高2m,體重2kg,這樣的資料“看上去很好”?

  • 資料分析必備:掌握這個R語言基礎包1%的功能,你就很牛了

  • 包教包會,7段程式碼帶你玩轉Python條件語句

  • 學霸們在假期裡“偷著學”,看的是這些書


更多精彩👇


在公眾號對話方塊輸入以下關鍵詞

檢視更多優質內容!


PPT | 報告 | 讀書 | 書單 | 乾貨 

大資料 | 揭祕 | Python | 視覺化

AI | 人工智慧 | 5G | 區塊鏈

機器學習 | 深度學習 | 神經網路

合夥人 1024 | 段子 | 數學 | 高考


據統計,99%的大咖都完成了這個神操作

👇



覺得不錯,請把這篇文章分享給你的朋友

轉載 / 投稿請聯絡:baiyu@hzbook.com

更多精彩,請在後臺點選“歷史文章”檢視

點選閱讀原文,瞭解更多

已同步到看一看
在看



熱點新聞