2016年12月5日,清華大數據技術·前沿系列講座——“工業(yè)大數據的技術趨勢與應用場景”在清華大學FIT樓多功能廳成功舉辦,本期講座邀請到了阿里巴巴集團副總裁、阿里云業(yè)務總經理劉松、航天科工集團航天云網科技發(fā)展有限公司副總經理祝守宇和阿里云事業(yè)群數據業(yè)務總架構師周衛(wèi)天來為大家介紹工業(yè)大數據的建設背景、發(fā)展現狀、國家戰(zhàn)略、發(fā)展趨勢、競爭對手、發(fā)展啟示及建設意義。
一、數據技術(Data Technology)的發(fā)展趨勢作。目前數據成為互聯(lián)網平臺企業(yè)的關鍵技術,包括蘋果、谷歌、亞馬遜等全球十大科技公司都逐漸演變成數據化、智能化的平臺公司。數據技術的(DT)發(fā)展將對各行各業(yè)產生影響,新一代信息技術的優(yōu)化使得全球的軟件定義、數據驅動的商業(yè)模式逐步明顯,數據智能也會在各個傳統(tǒng)行業(yè)得以應用。
二、中國工業(yè)互聯(lián)網的路徑選擇。德國公司發(fā)展工業(yè)4.0的原因是害怕谷歌、facebook等互聯(lián)網平臺公司對消費互聯(lián)網數據的控制,提出工業(yè)4.0與其抗衡;而美國以GE為代表推出了predix平臺,但仍然采用著將軟件工程作為工業(yè)附屬的操作模式,這種模式目前看來可行,但是橫向擴展有限,而美國東西海岸的科技界對此仍處于不合作狀態(tài)。目前在中國,基于良好的移動互聯(lián)網經濟,如果將互聯(lián)網的平臺模式和傳統(tǒng)工業(yè)(包括汽車、飛機、機床、能源互聯(lián)網)等產業(yè)結合起來,探索出新的跨界重混模式,會因為巨大互補效應而產生化學反應,中國制造業(yè)可能會走上一條換道升級的路徑。
三、中國工業(yè)大數據的挑戰(zhàn)與機遇。目前中國的工業(yè)生產模式很重,通過數據智能改進的產業(yè)機會非常大。除了技術和產品層,中國工業(yè)大數據要解決的非技術挑戰(zhàn)主要有兩點:一是文化的問題。工業(yè)企業(yè)文化和互聯(lián)網企業(yè)文化差異很大,要解決work together的問題;二是人才的問題。這個領域需要的人才非常廣泛,要有對工業(yè)本身理解的人才,需要了解具體的生產工藝,要有工業(yè)軟件人才、要有數據處理的人才,這個領域是一個絕對跨界融合的產業(yè),難點在于跨界合作的人才集成。工業(yè)大數據的推進問題,我們首先考慮的是能不能把人才高效地積聚起來。人的要素、文化的要素是推進工業(yè)大數據兩個最重要的因素。
那么如何看待工業(yè)互聯(lián)網產業(yè)呢?通過與消費互聯(lián)網對比,我們可以得到更好的理解。消費互聯(lián)網時代是以人的連接為主,主要形式實際上是手機和PC,手機數據量又遠遠超過PC。它的數據產生于三個方面,PC、手機、消費型智能硬件(手環(huán)、手表)。工業(yè)互聯(lián)網以機器生產系統(tǒng)為主,數據來源主要有三項。第一個是復雜裝備,第二是生產體系,第三個是工業(yè)級的智能硬件,比如說空調、充電裝置、路燈等等小型的裝備,大的復雜裝備包括航空發(fā)動機等等。全球的物聯(lián)網,連接進網的設備,預計到2019年大概是250億個,PC和手機大概八九十億。從設備鏈接的數量來看,工業(yè)設備的聯(lián)網要遠超消費聯(lián)網。
我們來分析一下消費互聯(lián)網的產業(yè)鏈條。消費互聯(lián)網的產業(yè)鏈條是通過手機和PC產生數據,通過基礎平臺運營商為鏈接(移動、聯(lián)通等),在運營商之上產生BAT類似的應用,這一類應用從運營商的角度來講叫OTT。整個產業(yè)的推動實際上是通過運營商來完成的,向下來推動手機和智能硬件的發(fā)展,向上推動應用的發(fā)展,當然最有價值的就是這個行業(yè)的推動者。
同樣的,工業(yè)互聯(lián)網中采用的數據不一樣但數據設備仍然是最頂層的基礎,往上一層是現代的云計算大數據平臺,是像航天云網和阿里這樣的企業(yè)等等,再上面的是一些工業(yè)級的應用,所以從產業(yè)推動來講,跟消費互聯(lián)網很類似。最終價值和重要性,需要靠中間的平臺層去推動整個產業(yè)的發(fā)展。借助業(yè)界的大拿講的話,“遠景清晰可見,工業(yè)互聯(lián)網”是變革的真正機遇,這將遠遠超越“消費互聯(lián)網”。
相比于大數據技術在消費級互聯(lián)網中的應用,我們的工業(yè)大數據是大家更應該投入的產業(yè),這是一件舉足輕重的大事,我們也能夠在更大的舞臺上,做出更多對人類發(fā)展有巨大貢獻的事?!百Y源共享、能力協(xié)同、開放合作、互利共贏”是航天云網人的企業(yè)內涵和精神理念,作為國家的戰(zhàn)略性平臺,歡迎大家加入我們的隊伍,也歡迎大家跟我們合作。
周衛(wèi)天老師通過融合一些案例對整個大數據領域的技術發(fā)展趨勢與工業(yè)大數據的技術驅使向在場的觀眾進行分享。
DT時代已經來臨。數據取代石油,成為全球經濟基礎要素。IT技術成為重要生產力,云計算成為基礎設施,互聯(lián)網+物聯(lián)網構成萬物互聯(lián)的信息交互渠道,全球市值TOP5第一次全部都是科技公司:Apple,Google,微軟,Amazon,Facebook全部是云化、數據化、智能化的公司。
2009年,馬云先生講了阿里巴巴是一家數據公司,在2010年的時候,馬云先生反復強調要做云計算,堅持發(fā)展云計算。數據平臺的核心是軟件能力,未來五年,大數據的發(fā)展趨勢就包括延伸軟件平臺,把傳感的技術、芯片的技術集成起來。
阿里在實戰(zhàn)中的阿里大數據是怎么來的?首先體現在支付能力上。剛剛過去的“雙十一”,阿里有兩個驚人的數據,12萬筆/秒支付的頂峰; 峰值支持能力10分鐘,30分鐘壓測能力,10.5億筆總支付的記錄,電商平臺、螞蟻支付拉高了整個阿里體系的技術能力。這類金融系統(tǒng)每秒十幾萬筆是非常了不起的數據。
阿里在數據處理上的經驗總結為兩點。第一,是數據處理,第二,是人工智能。阿里有一個天池平臺,由于支持大量多業(yè)務,今天阿里已經有了幾百萬張表。在我們國家,比如一些大的部委,十幾萬張或者是幾十萬張表已經很大了,當我們處理百萬張表的時候,建模就不能用傳統(tǒng)的方式來做。按照我的主要業(yè)務營銷、財務、實踐模塊,把表與表之間的關系,設計地非常圓滿,然后基于這個之上再來開發(fā)應用。在阿里,因為互聯(lián)網的快速增長、野蠻增長,來一個業(yè)務就建一個表,一個表拉幾個字段,每晚會對增量數據進行對比,這是阿里本身的一套技術體系。所有元數據表,每一個字段都有一個開發(fā)的同學認領,對主要的所有字段都會按照數據的級別、按照業(yè)務的重要程度、調用的頻率排重要度進行排列。數據之后會經平臺的甄別來判定數據的可信程度。確保了數據質量的準確性、唯一性,數據的準確性對數據分析至關重要。
第二,今天,阿里云后面有一支比較大的團隊做視覺智能、語音智能。將數據打通,包括線上線下的數據,網上的虛擬身份的ID,怎么跟電話號碼、身分證號碼怎么打通,把數據進行有效的利用。阿里擁有一個天池眾智平臺,所有涉及到高級算法、智能算法的問題,通過眾智平臺,由阿里自己的科學家把問題的目標、問題進行分解,平臺上五萬名科學家和算法愛好者提供一個最好的方案。正是因為這樣一個大數據智能平臺才支撐了阿里形形色色的業(yè)務。
阿里在2013年開啟登月工程,把原來很多的業(yè)務、支付寶、小貸、集團的B2B,以及后來已經開始有收購的業(yè)務,做到統(tǒng)一的平臺上來。
階段一:阿里啟動前約2到3個月進行了全面的工作準備,進行了公共平臺和服務層的建設搭建;數據規(guī)范、指標體系、數據安全、質量控制的流程制度及工具的開發(fā);成立了登月數據委員會(全職同學不同時期約七到十人左右;虛擬團隊的同學每個主要業(yè)務團隊都規(guī)定了對接接口的同學)
階段二:2014年正式啟動從云梯1遷移到云梯2的過程,最終分解為幾十個登月項目。云梯2中開發(fā)、調度、質量控制和元數據管理Meta是全新的、不一樣的一套體系。比如:DQC和ODPS底層的大數據統(tǒng)計分析功能、計量功能的演化。光是元數據Meta管理和統(tǒng)計分析的模式和云梯1里面的Oracle庫、GP庫、開源Hadoop庫很不一樣。2015年6月所有老系統(tǒng)全部接管,完成了新舊系統(tǒng)的并除。
對于大數據的技術走向和趨勢,周總提到了三點:
一、智能化
所謂智能化本質上是計算機化,不是固定僵硬的系統(tǒng),而是能自動執(zhí)行程序、可編程可演化的系統(tǒng),更高的要求是具有自學習和自適應功能。無人自動駕駛汽車是智能化的標志性產品,它融合實時感知、 導航、 自動駕駛、 聯(lián)網通信等技術,比有人駕駛更安全、更節(jié)能。
二、個性化
個性化的背后是大數據和視覺識別技術的發(fā)展。人臉識別、語音智能、OCR證件的認證,這是個性化很早的一面。最新的語音識別的數據是利用深層的神經網絡,正是由于現在數據的爆發(fā),以及計算處理能力的提升,也就是GPU很多的能力,今天生成的神經網絡已經能夠計算到12層、13層了。
個性化的數據庫。以某衣服制造廠商的數據庫為例,其版型數據庫能做到3000+版型/天,而如果使用手工打版,每天生產1200多套西服的紅領,至少需要500多個打版師傅??钍綌祿?,這是實現客戶訂單提交、產品設計、生產制造、采購營銷、物流配送、售后服務一體化的開放性互聯(lián)網平臺,做到了個性化和融合化的完美契合。
個性化的搜索引擎-千人千面。實時預測用戶對物品偏好,個性化推薦,千人千面,支持定制推薦算法。
三、融合化
大數據跟工業(yè)制造當中的特征工程是可以結合的,讓大數據去完善、加強原來特征工程中對于工業(yè)制造的質量控制、質量改善、良品率的提升,同時大數據的分析能做傳統(tǒng)特征工程不能做的事情。
智能工廠、貨運列車故障檢測需求分析、重型的設備公司等等,這些重型機械企業(yè)都在轉型,通過大數據可以預測出最有價值的客戶,甚至在融資、將來設備的租賃方面等都有貢獻。
我們的大數據跟工業(yè)的特征工程、傳統(tǒng)經驗融合起來,產生更多的智能,從而讓大數據能夠真正地為智能制造、互聯(lián)網+的華麗轉身做一點貢獻、做一點力量。