2016年12月5日,清華大數(shù)據(jù)技術(shù)·前沿系列講座——“工業(yè)大數(shù)據(jù)的技術(shù)趨勢(shì)與應(yīng)用場(chǎng)景”在清華大學(xué)FIT樓多功能廳成功舉辦,本期講座邀請(qǐng)到了阿里巴巴集團(tuán)副總裁、阿里云業(yè)務(wù)總經(jīng)理劉松、航天科工集團(tuán)航天云網(wǎng)科技發(fā)展有限公司副總經(jīng)理祝守宇和阿里云事業(yè)群數(shù)據(jù)業(yè)務(wù)總架構(gòu)師周衛(wèi)天來(lái)為大家介紹工業(yè)大數(shù)據(jù)的建設(shè)背景、發(fā)展現(xiàn)狀、國(guó)家戰(zhàn)略、發(fā)展趨勢(shì)、競(jìng)爭(zhēng)對(duì)手、發(fā)展啟示及建設(shè)意義。
一、數(shù)據(jù)技術(shù)(Data Technology)的發(fā)展趨勢(shì)作。目前數(shù)據(jù)成為互聯(lián)網(wǎng)平臺(tái)企業(yè)的關(guān)鍵技術(shù),包括蘋(píng)果、谷歌、亞馬遜等全球十大科技公司都逐漸演變成數(shù)據(jù)化、智能化的平臺(tái)公司。數(shù)據(jù)技術(shù)的(DT)發(fā)展將對(duì)各行各業(yè)產(chǎn)生影響,新一代信息技術(shù)的優(yōu)化使得全球的軟件定義、數(shù)據(jù)驅(qū)動(dòng)的商業(yè)模式逐步明顯,數(shù)據(jù)智能也會(huì)在各個(gè)傳統(tǒng)行業(yè)得以應(yīng)用。
二、中國(guó)工業(yè)互聯(lián)網(wǎng)的路徑選擇。德國(guó)公司發(fā)展工業(yè)4.0的原因是害怕谷歌、facebook等互聯(lián)網(wǎng)平臺(tái)公司對(duì)消費(fèi)互聯(lián)網(wǎng)數(shù)據(jù)的控制,提出工業(yè)4.0與其抗衡;而美國(guó)以GE為代表推出了predix平臺(tái),但仍然采用著將軟件工程作為工業(yè)附屬的操作模式,這種模式目前看來(lái)可行,但是橫向擴(kuò)展有限,而美國(guó)東西海岸的科技界對(duì)此仍處于不合作狀態(tài)。目前在中國(guó),基于良好的移動(dòng)互聯(lián)網(wǎng)經(jīng)濟(jì),如果將互聯(lián)網(wǎng)的平臺(tái)模式和傳統(tǒng)工業(yè)(包括汽車(chē)、飛機(jī)、機(jī)床、能源互聯(lián)網(wǎng))等產(chǎn)業(yè)結(jié)合起來(lái),探索出新的跨界重混模式,會(huì)因?yàn)榫薮蠡パa(bǔ)效應(yīng)而產(chǎn)生化學(xué)反應(yīng),中國(guó)制造業(yè)可能會(huì)走上一條換道升級(jí)的路徑。
三、中國(guó)工業(yè)大數(shù)據(jù)的挑戰(zhàn)與機(jī)遇。目前中國(guó)的工業(yè)生產(chǎn)模式很重,通過(guò)數(shù)據(jù)智能改進(jìn)的產(chǎn)業(yè)機(jī)會(huì)非常大。除了技術(shù)和產(chǎn)品層,中國(guó)工業(yè)大數(shù)據(jù)要解決的非技術(shù)挑戰(zhàn)主要有兩點(diǎn):一是文化的問(wèn)題。工業(yè)企業(yè)文化和互聯(lián)網(wǎng)企業(yè)文化差異很大,要解決work together的問(wèn)題;二是人才的問(wèn)題。這個(gè)領(lǐng)域需要的人才非常廣泛,要有對(duì)工業(yè)本身理解的人才,需要了解具體的生產(chǎn)工藝,要有工業(yè)軟件人才、要有數(shù)據(jù)處理的人才,這個(gè)領(lǐng)域是一個(gè)絕對(duì)跨界融合的產(chǎn)業(yè),難點(diǎn)在于跨界合作的人才集成。工業(yè)大數(shù)據(jù)的推進(jìn)問(wèn)題,我們首先考慮的是能不能把人才高效地積聚起來(lái)。人的要素、文化的要素是推進(jìn)工業(yè)大數(shù)據(jù)兩個(gè)最重要的因素。
那么如何看待工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)呢?通過(guò)與消費(fèi)互聯(lián)網(wǎng)對(duì)比,我們可以得到更好的理解。消費(fèi)互聯(lián)網(wǎng)時(shí)代是以人的連接為主,主要形式實(shí)際上是手機(jī)和PC,手機(jī)數(shù)據(jù)量又遠(yuǎn)遠(yuǎn)超過(guò)PC。它的數(shù)據(jù)產(chǎn)生于三個(gè)方面,PC、手機(jī)、消費(fèi)型智能硬件(手環(huán)、手表)。工業(yè)互聯(lián)網(wǎng)以機(jī)器生產(chǎn)系統(tǒng)為主,數(shù)據(jù)來(lái)源主要有三項(xiàng)。第一個(gè)是復(fù)雜裝備,第二是生產(chǎn)體系,第三個(gè)是工業(yè)級(jí)的智能硬件,比如說(shuō)空調(diào)、充電裝置、路燈等等小型的裝備,大的復(fù)雜裝備包括航空發(fā)動(dòng)機(jī)等等。全球的物聯(lián)網(wǎng),連接進(jìn)網(wǎng)的設(shè)備,預(yù)計(jì)到2019年大概是250億個(gè),PC和手機(jī)大概八九十億。從設(shè)備鏈接的數(shù)量來(lái)看,工業(yè)設(shè)備的聯(lián)網(wǎng)要遠(yuǎn)超消費(fèi)聯(lián)網(wǎng)。
我們來(lái)分析一下消費(fèi)互聯(lián)網(wǎng)的產(chǎn)業(yè)鏈條。消費(fèi)互聯(lián)網(wǎng)的產(chǎn)業(yè)鏈條是通過(guò)手機(jī)和PC產(chǎn)生數(shù)據(jù),通過(guò)基礎(chǔ)平臺(tái)運(yùn)營(yíng)商為鏈接(移動(dòng)、聯(lián)通等),在運(yùn)營(yíng)商之上產(chǎn)生BAT類(lèi)似的應(yīng)用,這一類(lèi)應(yīng)用從運(yùn)營(yíng)商的角度來(lái)講叫OTT。整個(gè)產(chǎn)業(yè)的推動(dòng)實(shí)際上是通過(guò)運(yùn)營(yíng)商來(lái)完成的,向下來(lái)推動(dòng)手機(jī)和智能硬件的發(fā)展,向上推動(dòng)應(yīng)用的發(fā)展,當(dāng)然最有價(jià)值的就是這個(gè)行業(yè)的推動(dòng)者。
同樣的,工業(yè)互聯(lián)網(wǎng)中采用的數(shù)據(jù)不一樣但數(shù)據(jù)設(shè)備仍然是最頂層的基礎(chǔ),往上一層是現(xiàn)代的云計(jì)算大數(shù)據(jù)平臺(tái),是像航天云網(wǎng)和阿里這樣的企業(yè)等等,再上面的是一些工業(yè)級(jí)的應(yīng)用,所以從產(chǎn)業(yè)推動(dòng)來(lái)講,跟消費(fèi)互聯(lián)網(wǎng)很類(lèi)似。最終價(jià)值和重要性,需要靠中間的平臺(tái)層去推動(dòng)整個(gè)產(chǎn)業(yè)的發(fā)展。借助業(yè)界的大拿講的話,“遠(yuǎn)景清晰可見(jiàn),工業(yè)互聯(lián)網(wǎng)”是變革的真正機(jī)遇,這將遠(yuǎn)遠(yuǎn)超越“消費(fèi)互聯(lián)網(wǎng)”。
相比于大數(shù)據(jù)技術(shù)在消費(fèi)級(jí)互聯(lián)網(wǎng)中的應(yīng)用,我們的工業(yè)大數(shù)據(jù)是大家更應(yīng)該投入的產(chǎn)業(yè),這是一件舉足輕重的大事,我們也能夠在更大的舞臺(tái)上,做出更多對(duì)人類(lèi)發(fā)展有巨大貢獻(xiàn)的事?!百Y源共享、能力協(xié)同、開(kāi)放合作、互利共贏”是航天云網(wǎng)人的企業(yè)內(nèi)涵和精神理念,作為國(guó)家的戰(zhàn)略性平臺(tái),歡迎大家加入我們的隊(duì)伍,也歡迎大家跟我們合作。
周衛(wèi)天老師通過(guò)融合一些案例對(duì)整個(gè)大數(shù)據(jù)領(lǐng)域的技術(shù)發(fā)展趨勢(shì)與工業(yè)大數(shù)據(jù)的技術(shù)驅(qū)使向在場(chǎng)的觀眾進(jìn)行分享。
DT時(shí)代已經(jīng)來(lái)臨。數(shù)據(jù)取代石油,成為全球經(jīng)濟(jì)基礎(chǔ)要素。IT技術(shù)成為重要生產(chǎn)力,云計(jì)算成為基礎(chǔ)設(shè)施,互聯(lián)網(wǎng)+物聯(lián)網(wǎng)構(gòu)成萬(wàn)物互聯(lián)的信息交互渠道,全球市值TOP5第一次全部都是科技公司:Apple,Google,微軟,Amazon,F(xiàn)acebook全部是云化、數(shù)據(jù)化、智能化的公司。
2009年,馬云先生講了阿里巴巴是一家數(shù)據(jù)公司,在2010年的時(shí)候,馬云先生反復(fù)強(qiáng)調(diào)要做云計(jì)算,堅(jiān)持發(fā)展云計(jì)算。數(shù)據(jù)平臺(tái)的核心是軟件能力,未來(lái)五年,大數(shù)據(jù)的發(fā)展趨勢(shì)就包括延伸軟件平臺(tái),把傳感的技術(shù)、芯片的技術(shù)集成起來(lái)。
阿里在實(shí)戰(zhàn)中的阿里大數(shù)據(jù)是怎么來(lái)的?首先體現(xiàn)在支付能力上。剛剛過(guò)去的“雙十一”,阿里有兩個(gè)驚人的數(shù)據(jù),12萬(wàn)筆/秒支付的頂峰; 峰值支持能力10分鐘,30分鐘壓測(cè)能力,10.5億筆總支付的記錄,電商平臺(tái)、螞蟻支付拉高了整個(gè)阿里體系的技術(shù)能力。這類(lèi)金融系統(tǒng)每秒十幾萬(wàn)筆是非常了不起的數(shù)據(jù)。
阿里在數(shù)據(jù)處理上的經(jīng)驗(yàn)總結(jié)為兩點(diǎn)。第一,是數(shù)據(jù)處理,第二,是人工智能。阿里有一個(gè)天池平臺(tái),由于支持大量多業(yè)務(wù),今天阿里已經(jīng)有了幾百萬(wàn)張表。在我們國(guó)家,比如一些大的部委,十幾萬(wàn)張或者是幾十萬(wàn)張表已經(jīng)很大了,當(dāng)我們處理百萬(wàn)張表的時(shí)候,建模就不能用傳統(tǒng)的方式來(lái)做。按照我的主要業(yè)務(wù)營(yíng)銷(xiāo)、財(cái)務(wù)、實(shí)踐模塊,把表與表之間的關(guān)系,設(shè)計(jì)地非常圓滿,然后基于這個(gè)之上再來(lái)開(kāi)發(fā)應(yīng)用。在阿里,因?yàn)榛ヂ?lián)網(wǎng)的快速增長(zhǎng)、野蠻增長(zhǎng),來(lái)一個(gè)業(yè)務(wù)就建一個(gè)表,一個(gè)表拉幾個(gè)字段,每晚會(huì)對(duì)增量數(shù)據(jù)進(jìn)行對(duì)比,這是阿里本身的一套技術(shù)體系。所有元數(shù)據(jù)表,每一個(gè)字段都有一個(gè)開(kāi)發(fā)的同學(xué)認(rèn)領(lǐng),對(duì)主要的所有字段都會(huì)按照數(shù)據(jù)的級(jí)別、按照業(yè)務(wù)的重要程度、調(diào)用的頻率排重要度進(jìn)行排列。數(shù)據(jù)之后會(huì)經(jīng)平臺(tái)的甄別來(lái)判定數(shù)據(jù)的可信程度。確保了數(shù)據(jù)質(zhì)量的準(zhǔn)確性、唯一性,數(shù)據(jù)的準(zhǔn)確性對(duì)數(shù)據(jù)分析至關(guān)重要。
第二,今天,阿里云后面有一支比較大的團(tuán)隊(duì)做視覺(jué)智能、語(yǔ)音智能。將數(shù)據(jù)打通,包括線上線下的數(shù)據(jù),網(wǎng)上的虛擬身份的ID,怎么跟電話號(hào)碼、身分證號(hào)碼怎么打通,把數(shù)據(jù)進(jìn)行有效的利用。阿里擁有一個(gè)天池眾智平臺(tái),所有涉及到高級(jí)算法、智能算法的問(wèn)題,通過(guò)眾智平臺(tái),由阿里自己的科學(xué)家把問(wèn)題的目標(biāo)、問(wèn)題進(jìn)行分解,平臺(tái)上五萬(wàn)名科學(xué)家和算法愛(ài)好者提供一個(gè)最好的方案。正是因?yàn)檫@樣一個(gè)大數(shù)據(jù)智能平臺(tái)才支撐了阿里形形色色的業(yè)務(wù)。
阿里在2013年開(kāi)啟登月工程,把原來(lái)很多的業(yè)務(wù)、支付寶、小貸、集團(tuán)的B2B,以及后來(lái)已經(jīng)開(kāi)始有收購(gòu)的業(yè)務(wù),做到統(tǒng)一的平臺(tái)上來(lái)。
階段一:阿里啟動(dòng)前約2到3個(gè)月進(jìn)行了全面的工作準(zhǔn)備,進(jìn)行了公共平臺(tái)和服務(wù)層的建設(shè)搭建;數(shù)據(jù)規(guī)范、指標(biāo)體系、數(shù)據(jù)安全、質(zhì)量控制的流程制度及工具的開(kāi)發(fā);成立了登月數(shù)據(jù)委員會(huì)(全職同學(xué)不同時(shí)期約七到十人左右;虛擬團(tuán)隊(duì)的同學(xué)每個(gè)主要業(yè)務(wù)團(tuán)隊(duì)都規(guī)定了對(duì)接接口的同學(xué))
階段二:2014年正式啟動(dòng)從云梯1遷移到云梯2的過(guò)程,最終分解為幾十個(gè)登月項(xiàng)目。云梯2中開(kāi)發(fā)、調(diào)度、質(zhì)量控制和元數(shù)據(jù)管理Meta是全新的、不一樣的一套體系。比如:DQC和ODPS底層的大數(shù)據(jù)統(tǒng)計(jì)分析功能、計(jì)量功能的演化。光是元數(shù)據(jù)Meta管理和統(tǒng)計(jì)分析的模式和云梯1里面的Oracle庫(kù)、GP庫(kù)、開(kāi)源Hadoop庫(kù)很不一樣。2015年6月所有老系統(tǒng)全部接管,完成了新舊系統(tǒng)的并除。
對(duì)于大數(shù)據(jù)的技術(shù)走向和趨勢(shì),周總提到了三點(diǎn):
一、智能化
所謂智能化本質(zhì)上是計(jì)算機(jī)化,不是固定僵硬的系統(tǒng),而是能自動(dòng)執(zhí)行程序、可編程可演化的系統(tǒng),更高的要求是具有自學(xué)習(xí)和自適應(yīng)功能。無(wú)人自動(dòng)駕駛汽車(chē)是智能化的標(biāo)志性產(chǎn)品,它融合實(shí)時(shí)感知、 導(dǎo)航、 自動(dòng)駕駛、 聯(lián)網(wǎng)通信等技術(shù),比有人駕駛更安全、更節(jié)能。
二、個(gè)性化
個(gè)性化的背后是大數(shù)據(jù)和視覺(jué)識(shí)別技術(shù)的發(fā)展。人臉識(shí)別、語(yǔ)音智能、OCR證件的認(rèn)證,這是個(gè)性化很早的一面。最新的語(yǔ)音識(shí)別的數(shù)據(jù)是利用深層的神經(jīng)網(wǎng)絡(luò),正是由于現(xiàn)在數(shù)據(jù)的爆發(fā),以及計(jì)算處理能力的提升,也就是GPU很多的能力,今天生成的神經(jīng)網(wǎng)絡(luò)已經(jīng)能夠計(jì)算到12層、13層了。
個(gè)性化的數(shù)據(jù)庫(kù)。以某衣服制造廠商的數(shù)據(jù)庫(kù)為例,其版型數(shù)據(jù)庫(kù)能做到3000+版型/天,而如果使用手工打版,每天生產(chǎn)1200多套西服的紅領(lǐng),至少需要500多個(gè)打版師傅??钍綌?shù)據(jù)庫(kù),這是實(shí)現(xiàn)客戶(hù)訂單提交、產(chǎn)品設(shè)計(jì)、生產(chǎn)制造、采購(gòu)營(yíng)銷(xiāo)、物流配送、售后服務(wù)一體化的開(kāi)放性互聯(lián)網(wǎng)平臺(tái),做到了個(gè)性化和融合化的完美契合。
個(gè)性化的搜索引擎-千人千面。實(shí)時(shí)預(yù)測(cè)用戶(hù)對(duì)物品偏好,個(gè)性化推薦,千人千面,支持定制推薦算法。
三、融合化
大數(shù)據(jù)跟工業(yè)制造當(dāng)中的特征工程是可以結(jié)合的,讓大數(shù)據(jù)去完善、加強(qiáng)原來(lái)特征工程中對(duì)于工業(yè)制造的質(zhì)量控制、質(zhì)量改善、良品率的提升,同時(shí)大數(shù)據(jù)的分析能做傳統(tǒng)特征工程不能做的事情。
智能工廠、貨運(yùn)列車(chē)故障檢測(cè)需求分析、重型的設(shè)備公司等等,這些重型機(jī)械企業(yè)都在轉(zhuǎn)型,通過(guò)大數(shù)據(jù)可以預(yù)測(cè)出最有價(jià)值的客戶(hù),甚至在融資、將來(lái)設(shè)備的租賃方面等都有貢獻(xiàn)。
我們的大數(shù)據(jù)跟工業(yè)的特征工程、傳統(tǒng)經(jīng)驗(yàn)融合起來(lái),產(chǎn)生更多的智能,從而讓大數(shù)據(jù)能夠真正地為智能制造、互聯(lián)網(wǎng)+的華麗轉(zhuǎn)身做一點(diǎn)貢獻(xiàn)、做一點(diǎn)力量。