從微軟亞洲研究院到金山,再到上周退休,張宏江博士可以說見證了中國企業(yè)服務市場發(fā)展,今日他也來到了36氪Wise2016企業(yè)服務年會現(xiàn)場,在現(xiàn)場獲得企業(yè)服務終身成就獎的同時,張宏江博士也為我們分享了他對企業(yè)服務未來的一些看法。
首先是人工智能,張宏江博士分享了他在Alpha GoVS李世石期間贏錢的趣事,這場舉世矚目的比賽也讓大眾對AI的能力有了初步的認知,“差不多在20年前,人工智能的機器贏過俄羅斯的國際象棋,但是這20年,人工智能走了非常長的路?!?張宏江博士表示這背后其實是大數(shù)據(jù)、新算法和強計算的支撐。
在大數(shù)據(jù)方面,張宏江拿Alpha Go舉例,它的訓練數(shù)據(jù)遠遠超過人類大師一輩子的數(shù)據(jù),再加上它900多個CPU,2800個GPU的計算能力,它的段位已經(jīng)非常接近人類的大師了?!斑@是在比賽之前,沒有考慮過其他的因素在里面,它的數(shù)據(jù)已經(jīng)非常領先了?!倍趪逯?,全球數(shù)據(jù)以40%的增長速率增加,沃爾瑪每4小時會產(chǎn)生2.5PB的數(shù)據(jù)量,推特每天有5億條帖子更新。
關于AI是否會取代人類,張宏江博士也給出了跟李開復類似的觀點,人工智能的應用是有局限的,必須具備大數(shù)據(jù)、邊界清晰、外部反饋、頂尖數(shù)據(jù)科學家和計算資源五個條件。
張宏江認為AI+大數(shù)據(jù)的應用會成為企業(yè)的標配,“過去是分析、現(xiàn)在是預測、未來是認知。”而在AI和數(shù)據(jù)方面,都離不開云計算,它已經(jīng)成為IT主流技術,云也成為了成長最快的2B產(chǎn)業(yè)。
在給出AI+大數(shù)據(jù)+云=企業(yè)服務的未來的結論后,創(chuàng)業(yè)公司該怎么做?張宏江博士也給出了建議:
AI+大數(shù)據(jù)+云會跟所有新技術出現(xiàn)后,帶來的商業(yè)機會稍縱即逝,創(chuàng)業(yè)者需要前瞻性眼光
需要很快的積累起我們的技術能力、工程能力,產(chǎn)生技術壁壘
需要有工匠精神,能夠不斷的改善我們的算法和分析能力,為企業(yè)提供更好的服務
以下為張宏江博士演講實錄:
我今天講的題目企業(yè)服務的三個階段是緊扣的,可以把它叫做3.0+或者是企業(yè)服務4.0。如果我們回憶一下2016年有什么樣的主題始終貫穿著互聯(lián)網(wǎng)、整個企業(yè)服務軟件的市場、整個IT的市場,一定是三個主題:人工智能,大數(shù)據(jù)和云計算。
為什么這么說?
人工智能是我做過很多年的領域,那今天就從人工智能談起,2016年的一件大事是在3月份AlphaGOvs李世石,很多人不知道AI這個詞是什么,也不知道AI到底有多厲害,但AlphaGo贏了韓國的圍棋大師,這具有里程碑的意義。
差不多在20年前,AI贏過俄羅斯的國際象棋大師,這20年間,人工智能走了非常長的路,在這個事情發(fā)生以后,很多人都認為人工智能將會統(tǒng)治世界。我不知道在座大家在這比賽前有沒有人知道人工智能到底是怎么回事,有沒有人跟你的同事下過賭,到底是機器贏還是人能贏,我下了賭,而且贏了錢。
這塊有很重要的原因在里面,我為什么認為AlphaGo可以戰(zhàn)勝人類的圍棋大師,很重要的是背后的深層支撐,實際上今天終于有足夠的計算能力,今天終于有足夠多的數(shù)據(jù),今天有人工智能算法(機器學習算法)。
我尤其要強調(diào)的是在數(shù)據(jù)和算法這塊,人類大師一輩子能下好幾千場真正的高質(zhì)量的比賽,但是AlphaGo在它的有限的生命中間,和人類的6到9段的選手下過1.6萬次,同時3000萬次的機器對局,因為它本身沒有所謂的感性的因素,所以自己可以跟自己下,所以這兩個數(shù)據(jù)使得它的訓練數(shù)據(jù)遠遠超過人類大師一輩子的數(shù)據(jù)。
再加上它的非常強的計算資源,900多個CPU,2800個GPU這樣的資源,它的段位已經(jīng)非常接近人類的大師了。這是在大師比賽之前,沒有考慮過其他的因素,也就是說它的數(shù)據(jù)量比人類大師領先很多了。
所以真正的在AlphaGo背后隱藏的動力,其實是我們所說的大數(shù)據(jù)和強計算加上新的算法。這是今年發(fā)生的最熱的一件事情背后真正的原因。
那么我們談到大數(shù)據(jù),在過去的幾年中間談得非常多,也有人發(fā)出大數(shù)據(jù)時代是不是已經(jīng)過去的疑問,其實不是,而是剛剛開始,而且隨著人工智能的發(fā)展,大數(shù)據(jù)的應用將會越來越廣泛。
過去的幾年間隨著移動互聯(lián)網(wǎng)的發(fā)展,人類的數(shù)據(jù)其實在爆炸性的增長,根據(jù)IDC的調(diào)查,整個人類所創(chuàng)造的數(shù)據(jù)大概是4.4Z,到了2020年這個數(shù)字會再增長10倍,如果你用一個標準的蘋果的Ipad,里面有128G的內(nèi)存,你把這44個Z存進去的話,可以從地球到月亮來回走9次。
比如說沃爾瑪在2013年每4個小時產(chǎn)生的數(shù)據(jù)到了2.5PB,今天推特每天推的文字就5億條,微信一天在朋友圈分享的照片就是10億張,今天中國的存量照片是300億張,但是企業(yè)界的數(shù)據(jù)增長的速度同樣非常快。
我還是用移動互聯(lián)網(wǎng)的例子,現(xiàn)在手機上非常普遍的應用就是照片,這種照片越來越多以后,你在手機上發(fā)現(xiàn)管理照片是個問題,所以兩年前大部分的手機都開始出現(xiàn)叫做照片自動分類的云服務,包括根據(jù)人臉進行分類,當你看到這些照片的時候,你以前只能根據(jù)地點和時間進行分類,今天就可以知道根據(jù)人的面孔,把你的朋友、家人進行分類。假如我的手機上有雷軍的照片,我就點一下他的照片,你發(fā)現(xiàn)所有他出現(xiàn)的照片全部都幫你找出來了,這背后用的技術是人工智能人臉識別的技術,這個技術今天在所有第一線的平臺上都已經(jīng)出現(xiàn)了。
這件事情在AI的歷史上走了幾十年,以我的專利為證,這是我1997年在惠普實驗室申請的專利,這個專利基本的核心是:當照片進來以后我做一個人臉檢測、人臉特征的提取,從而進行比對,而且我20年前就已經(jīng)預測到這個體系很難在一個體系上實現(xiàn),而需要一個分布的體系,所以它是一個分布式的數(shù)據(jù)庫系統(tǒng),今天看來這個東西就是手機。
這個專利是在2000年批準的。但是這件事兒至少在我看到走了20年,20年前這件事兒是非常難做的,除了算法沒有今天這么先進之外,更重要的是我們的數(shù)據(jù)不夠。所以以我來看過去20多年,計算機對人臉識別的發(fā)展就是一個數(shù)據(jù)庫和計算能力的擴張。90年代初的時候你用的訓練數(shù)據(jù)就是幾百張、幾十人,到了十年前,已經(jīng)到了幾萬張或者是幾十萬張,我們能夠用的人數(shù)也是到了幾千個,真正到了過去的三五年,計算機或者是人工智能開始超過人的數(shù)量,一個典型的情況就是谷歌和Facebook在2015年年初的時候開始用大量的數(shù)據(jù),包括著2億張照片,800萬人,因為有這么多數(shù)據(jù)所以能支撐起非常龐大的深度學習的網(wǎng)絡,從而能夠訓練出識別準確率超過99.63%的算法和人臉識別系統(tǒng)。
當我們訓練數(shù)據(jù)用了260萬張的時候,識別率大概在76%,用了2.6萬張的時候,識別率增長了10%,這是沒有經(jīng)過仔細的調(diào)優(yōu)的情況下你可以看到數(shù)據(jù)對于識別精度的影響,同樣當你用到算法的復雜度和計算能力之間也一樣,只有當計算能力不斷提高復雜度和精確度才能支撐起來。我的觀點還是說數(shù)據(jù)和計算能力是AI背后的主要推動力。
在過去的兩年中國企業(yè)在這方面異軍突起,領先了國際市場,也領先了國際的學術的領域,這些從微軟研究院衍生出來的這些公司,他們都做到了世界上最好的人臉識別系統(tǒng),原因是他們都和微軟研究院也許,更重要的是今天他們都有大量的數(shù)據(jù),中國人口最多,中國的攝象頭最多,攝象頭密度最高。這一系列的數(shù)據(jù)使得我們能夠做到最好的識別系統(tǒng)。
除了人臉之外,我們知道只要你做了壞事兒,只要在路上任何一個角落拍了你一張照以后,你基本上插翅難逃了,除了人臉識別以外,AI在什么領域會超過人類,這是我們今天講的核心內(nèi)容,AI已經(jīng)在一系列的領域會替代人工,除了在人臉識別、下棋以外,在翻譯、新聞記者的采編,尤其是財經(jīng)記者的采編,在行政助理、警察、出租車、股票交易員、會計,包括保姆都會在今后的5到10年內(nèi)很大的程度上被AI所取代。
為什么?你問自己幾個問題,你可不可以像AlphaGo一樣一天下幾百萬盤旗,人類能不能像特斯拉那樣每天從路上超過20萬輛跑的車上收取數(shù)據(jù),能不能像所有遍布于各個機場、各個火車站的攝象頭那樣見到那么多人。正是因為這些無窮無盡的數(shù)據(jù)使得AI有越來越強的能力,從而他們不光是能夠識別出人,而且比人類聽懂更多的語言。
所以我們也同樣相信這一切也會改變我們今后的企業(yè)服務的形態(tài)。你會問一個問題,是不是AI能取代所有的行業(yè)、所有的工種,所有的任務,很重要的一點,一定是在有大數(shù)據(jù)的情況下才能做到很好的AI系統(tǒng),一定要有一撥很好的頂尖的科學家才能把這些數(shù)據(jù)形成很好的體系,從而有很好的算法,也需要有大量的計算機的資源。
其實在這里面我們也知道,無論是計算機資源,還是科學家這些你都能找打到,對于創(chuàng)業(yè)企業(yè)來說,但是大數(shù)據(jù)對創(chuàng)業(yè)企業(yè)是個挑戰(zhàn),你從哪能夠獲取這么多數(shù)據(jù)。
大家會問一個問題,到底多少數(shù)據(jù)足夠多?在大數(shù)據(jù)的分析里面,我們從來說沒有太多的數(shù)據(jù),數(shù)據(jù)從來不夠,因為很重要的。用傳統(tǒng)AI的方式,性能也是隨著數(shù)據(jù)的增加而不斷的增加的,用最新的算法增加的數(shù)會更快,或者是飽和的速度會更慢。這是很重要的一點,當你沒有數(shù)據(jù)的時候,用的最新的算法你的性能也只會在這兒,不會在這兒,尤其是我們今天碰到的越來越復雜的場景,你所需要的數(shù)據(jù)會越來越多。重要的是說當你的覆蓋度、數(shù)據(jù)精度這兩點達到一定程度以后,對于傳統(tǒng)模型的依賴才會減少,缺少數(shù)據(jù)的時候才會做出一個模型來。
今天我們看大數(shù)據(jù)對于企業(yè)有什么影響,我想用美國一個調(diào)查的數(shù)據(jù)舉例,大數(shù)據(jù)的應用已經(jīng)非常廣泛了,60%的IT公司里面,大數(shù)據(jù)已經(jīng)成為日常中間開始使用,在商業(yè)和專業(yè)服務的公司里面也有將近一半的公司在用,金融47%的公司,最傳統(tǒng)的制造業(yè)和零售業(yè)這個數(shù)字也在逐漸的上升,所以我們知道今天在我們的企業(yè)服務行業(yè)里面,數(shù)據(jù)已經(jīng)變成下一個新的宗教。
過去傳統(tǒng)對大數(shù)據(jù)的依賴使用它來做統(tǒng)計,我們知道過去發(fā)生了什么,我們很快用它來做分析,我們想知道這是為什么發(fā)生,今天更多大家在用到預測,未來會發(fā)生什么,未來我想我們會用到它,最大的會是認知,我們對于任何一個商業(yè)決策的反饋,從簡單的知識到智能的演化過程,這個是今天大數(shù)據(jù)開始在企業(yè)服務里面發(fā)揮作用的一個核心原因。
當你有了大數(shù)據(jù),有了先進的算法,像一開始演示的,在手機上做人臉識別,你可能認為手機本身有如此強大的功能,但是我想告訴你所有的計算都是在云端進行的,你的照片拍完以后是把它送到云端去,在云端進行了人臉的檢測和識別,在云端搜索了聯(lián)系人的數(shù)據(jù)庫,從而返回到照片的人臉的信息,也就是說如果沒有后端,沒有云端的大規(guī)模的存儲、大規(guī)模的計算、大規(guī)模的數(shù)據(jù)分析一系列的計算的功能,今天做不到我們說的智能。
云計算已經(jīng)成為主流技術,今天已經(jīng)不像三年前,你談云計算別人會認為你談在云里霧里是在忽悠,今天云計算已經(jīng)成為IT真正的主流,今天創(chuàng)辦一家公司,你需要大量的計算資源的時候,你想到的不是自己再去并購一個數(shù)據(jù)中心,再去買大量的服務器,而是利用今天已經(jīng)有的大量的云服務的提供商他們所能提供的云計算。
中國的云計算能力這個市場是非常廣大的,潛力是無限的,因為我再分享一個數(shù)據(jù),IDC在去年年底做了中國公有云市場的報告,中國公有云市場,包括SaaS、IaaS,所有的公有云的市場收入的總量只占美國同類收入總量的3%多。但
但中國的互聯(lián)網(wǎng)市場哪個領域我們只是美國的3%多?要么是跟美國同樣的檔次,要么比美國還要大。就算再小一點,我們至少是美國的一半,當你看到一個迅速成長的市場,今天市場的整個規(guī)模只有美國的3%的時候,你知道這個市場有多大,所以中國的云市場潛力無限。
最后我想總結一下,在我們談企業(yè)服務的時候,尤其在談新時代的企業(yè)服務,有三點我們要進行充分的考慮:
首先人工智能、大數(shù)據(jù)和云計算能力,會像以前所有的技術一樣,任何一個新的技術出現(xiàn),它的機會稍縱即逝,對于AI、大數(shù)據(jù)、云這樣的現(xiàn)象級的技術的爆發(fā),需要的是有非常前瞻的眼光,順勢而為的能力;需要很快的積累起我們的技術能力、工程能力;我們也需要有工匠精神,能夠不斷的改善我們的算法和分析能力,從而我們能夠真正的為企業(yè)提供最好的新時代的企業(yè)服務。謝謝大家!