寄云科技,是國內工業(yè)互聯(lián)網領域的一方新銳勢力。
眾所周知,工業(yè)處于第四次工業(yè)革命的時期。負責設備連接的物聯(lián)網公司聚焦工業(yè)似乎成了趨勢,但從云計算和大數據領域切入工業(yè)的公司實數不多。而這其中,寄云科技是特點鮮明的一家。
寄云科技,成立于2013年9月,最初專注于跨云的部署交付與自動化編排。隨后,業(yè)務聚焦在PaaS平臺層,做開發(fā)者引擎和一系列外圍服務,把數據庫服務、MQTT服務整合到ADP上,將工具組合變成可交付的應用,此時的寄云PaaS平臺從屬性上更偏于集成平臺iPaaS,但方向上已開始聚焦物聯(lián)網和工業(yè)。
在訪談中,創(chuàng)始人時培昕介紹,寄云科技成立時的目標是用新技術改變傳統(tǒng)行業(yè),4年中,寄云在發(fā)展到一個階段的高度后,都有新團隊并進來,不僅包括大數據,還包括工業(yè)網關和數據采集,通過優(yōu)勢互補,解決了之前做不到的問題。
如今的寄云科技,戰(zhàn)略布局從設備端到云端,以數據為主線,為工業(yè)企業(yè)提供設備連接、數據采集、數據存儲、分析建模、構建交互式應用等完整的工業(yè)互聯(lián)網解決方案。
在工業(yè)領域,數據來自于IT和OT兩個系統(tǒng),一部分涉足工業(yè)的數據服務商更側重于做經營類分析,主要對接企業(yè)IT系統(tǒng),包括ERP、OA、CRM等數據庫。然而,工業(yè)企業(yè)中,IT系統(tǒng)建設相對薄弱,在數據種類、數據量級、數據價值等方面稍顯遜色,在做IT業(yè)務系統(tǒng)的數據分析時,對客戶業(yè)務的理解要求不多,門檻較低。
相比之下,來自OT系統(tǒng)的設備相關數據復雜度高、價值點大。在數據分析時不僅要解決實時、海量的數據存儲和分析的問題,還需要對客戶業(yè)務的深刻理解,搭建特定場景下的精準模型。
寄云科技選擇后者,做企業(yè)的業(yè)務類分析,以對接設備的控制系統(tǒng)為主,聚焦在生產制造和設備運維兩個方向。據時培昕介紹,寄云科技長處在于,第一,從生產數據出發(fā),做質量和效率的分析;第二,從設備運行數據出發(fā),做設備的健康管理故障預測和遠程運維。
工業(yè)各細分領域專業(yè)性差異大,壁壘深,對于擅長數據分析而匱于業(yè)務理解的第三方數據服務商而言,做深單一市場的戰(zhàn)略,比做覆蓋多行業(yè)的打法更加行之有效。目前階段,寄云數據聚焦在電力能源、軌道交通、智能制造等三大領域,已取得像上海城建、大唐電力、國家電網、中車等行業(yè)頭部企業(yè),獲客能力不容小覷。
在訪談中,時培昕介紹,寄云科技的下一步戰(zhàn)略是將在平臺的基礎上,把這三類垂直行業(yè)做深,打造精細化的垂直行業(yè)解決方案;對于其它工業(yè)行業(yè),和合作伙伴共同搭建工業(yè)互聯(lián)網生態(tài)平臺,為更多專業(yè)客戶輸出寄云的平臺能力,利用平臺上開放的工具、模型和微服務實現快速的應用開發(fā)和數據分析,同合作伙伴共同幫助工業(yè)客戶實現數字化轉型。
近日,愛分析對寄云科技創(chuàng)始人兼CEO時培昕進行專訪,現將精彩內容分享如下。
愛分析:在整合云計算、大數據、工業(yè)網關三支團隊時,嘗試過哪些探索?
時培昕:寄云起步于云計算服務,在大數據、工業(yè)網關團隊并進來之后,我們有了數據源頭,能夠采數據、做數據分析,于是我們開始探索整合方式,把云加大數據的IT能力與工業(yè)能力結合起來,打造了現在的NeuSeer工業(yè)互聯(lián)網平臺。
在工業(yè)設備端通過寄云的工業(yè)網關,可以接入各種工業(yè)設備數據,包括工業(yè)設備的運行、工況和作業(yè)數據等;這些實時數據和批量數據分別通過物聯(lián)網協(xié)議和抽取工具發(fā)送到NeuSeer平臺之后,NeuSeer平臺會提供精細化的數據轉化和治理,并針對不同數據類型提供包括文件存儲、結構化數據庫、對象存儲以及時序數據庫在內的多種基礎數據存儲能力,為應用開發(fā)和數據分析提供歷史存儲的能力。
NeuSeer平臺提供了以數據為核心的工業(yè)數據分析平臺和應用開發(fā)平臺。工業(yè)數據分析平臺不僅能夠提供大量增強的工業(yè)算法和機器學習算法,還提供包括故障診斷、性能評估以及性能預測在內的工業(yè)模型,工業(yè)客戶利用平臺的模型訓練和發(fā)布工具,基于歷史數據快速生成新的故障診斷和預警模型;同時,NeuSeer平臺還提供了基于微服務架構的開發(fā)套件,并且內置了大量包括物聯(lián)網、安全和權限管理、數據庫、消息在內的服務組件,以及開源的應用框架,工業(yè)客戶可以快速的開發(fā)各種復雜的工業(yè)應用。
愛分析:在工業(yè)領域解決了哪些需求?
時培昕:我們看到工業(yè)三大趨勢,需求定制化、生產智能化、收入服務化。以數據為導向的智能制造,主要是集中在設計、制造、運維三個方向。目前階段,我們主要做制造和運維。制造是根據產線數據做質量、能效分析;運維是做健康管理、故障預測、性能優(yōu)化。
市場上大部分工業(yè)物聯(lián)網以連接為目的,大部分是數據采集到平臺上做一個遠程監(jiān)控就截止了。我們是關注以數據為主線的工業(yè)互聯(lián)網,關注的環(huán)節(jié)包括數據采集、存儲、分析、做預測、構建交互式應用等一個完整過程。
愛分析:在大數據技術之前,有SCADA系統(tǒng)也可以做遠程監(jiān)控,接入云之后的遠程監(jiān)控與它有怎樣的區(qū)別?
時培昕:本質區(qū)別是在于目標的不同。原來SCADA以控制為目的,基于短期數據可以實現簡單的、少維度的、靜態(tài)的告警。
但我們做的遠程監(jiān)控不只要看實時的數據,還要基于歷史數據做評估和預測,比SCADA內容更豐富,數據量、數據維度、實時性都更多。包括故障診斷、性能評估和故障預測在內,都是新引入的功能。
愛分析:網關數采層面有哪些主要關鍵點?對于不開放的數據如何處理?
時培昕:工業(yè)網關的要涵蓋各種協(xié)議,包括通用的Modbus、Profibus等,以及一些特定場合下需要使用的,像安川的伺服、愛德華的真空泵等。有時候還需要抓包分析,需要從HMI里面讀相應的點表。
愛分析:工業(yè)應用中,邊緣計算用在哪些地方?
時培昕:邊緣計算在網關層面,做執(zhí)行,在無法把網關數據傳上云時,如果想提前實現一些本地基礎算法,如異常檢測等,就可以基于網關里存的數據,分析歷史分布和趨勢,評估當前狀態(tài),所以要在本地做一些算法的能力。
目前還沒有標準的邊緣計算規(guī)范,我們是在網關層面提供執(zhí)行開放程序和數據分析的框架能力。我們是一個開放系統(tǒng),系統(tǒng)里的算法和模型都可以根據云端的能力推到網關上執(zhí)行。
愛分析:工業(yè)的制造和運維兩個需求點有哪些特點?實施中存在哪些挑戰(zhàn)?
時培昕:生產制造過程我們采集不同的人、機、料、法、環(huán)的數據,采完之后分析的主題有質量、效率和調度。對于運維而言,原來是做巡檢、更換,成本高,一些關鍵的故障也難以避免。我們基于狀態(tài)、傳感器變量去建模型分析,實現對設備生命周期的預測和管理。
工業(yè)數采協(xié)議多、數據量大、封閉情況非常多。此外,原有控制系統(tǒng)以控制為目標,沒有長期存儲的能力。控制信息只需存若干個月,分析要看若干年。分析出發(fā)的數采更看重多維存儲,這與控制不一樣。
愛分析:從數據分析出發(fā)的存儲要注意哪些點?
時培昕:一個是實時性,對工業(yè)數據的處理方式,時序數據是主要的,差異化存儲、壓縮方式都要關注。另一個是靈活性,在不同階段要存不同的數據,邊緣計算有過濾能力,決定要采什么樣的數據。要做的足夠靈活,才能支持在云上的最優(yōu)存儲。
愛分析:實時數據庫除了在現有基礎上增加了時間維度以外,主要難點在哪些地方?
時培昕:有時間標簽處理起來就不一樣,采樣頻率可能是1kHz,存的點可能是一個時間標簽后面有幾十個不同維度,在處理的引擎機制上與傳統(tǒng)數據庫不太一樣。我們首先要批量、實時的存儲;其次是構建分析,針對實際數據的高性能BI,可以秒級查詢;最后是展示構建分析報表、故障分析熱點圖等。
基礎的統(tǒng)計分析不需要構建模型就可以實現,我們在此之上有大數據分析,需要寫算法和模型。我們做了兩塊,一個是算法包,一個是特定場景下的模型。工業(yè)的算法很多,需要做基于時間的預處理,差值、抽樣填充、時頻變換、清洗、時序變換、平滑處理、對齊,濾波等。傳統(tǒng)的數據分析就是關聯(lián)、分類、回歸等。
愛分析:構建的模型有哪些種類?
時培昕:我們提供通用和專業(yè)模型,第一類是歷史數據的模型,包括伴隨概率的關聯(lián)分析和故障路徑分析。第二類是當前的性能評估模型,基于歷史數據來訓練模型,用當前數據驗證是否偏離模型的輸出。第三類是未來預測,基于變量的歷史數據實現對未來趨勢的預測。
我們做模型訓練的時候,會要求根據建模的目的來針對性選擇很多設備的變量,如果很清楚地知道哪一個變量是對模型輸出是有貢獻,就把它加進來,如果加入沒有貢獻的數據會影響模型的精確度。
愛分析:這塊主要是憑借行業(yè)專家完成?
時培昕:對,行業(yè)專家。
愛分析:開發(fā)一個可以使用的模型,大概需要多少樣本量?
時培昕:如果只需要做一個基于歷史數據的異常檢測和預測,直接調用平臺現有的模型框架就可以,非常快。如果要做一個非常精準的模型,必須弄清楚設備的工作原理,有時候可能需要拿到很多現場實測數據后才能完成模型。
愛分析:底下的模型開發(fā)和訓練都是寄云在做?
時培昕:我們提供模型的開發(fā)框架,而合作伙伴可以基于這些框架,通過實例化實現特定場景下的模型開發(fā)。
愛分析:通常情況下,以怎樣的方式交付客戶?
時培昕:客戶分兩種,第一,對于中小型的工業(yè)客戶,我們會跟之簽基于平臺的云服務托管合同,客戶把數據放到我的平臺上實現存儲和分析。第二,對于大型的客戶,基本上是要求私有化部署,現場定制化交付,我們會以項目方式進入,提供產品加服務。
愛分析:寄云科技的平臺采用開放的方式,具備哪些特點?
時培昕:寄云NeuSeer平臺是一個開放的平臺,用戶可以通過各種開放的接口,以訂閱的方式使用我們平臺上的貨架類服務,包括MQTT、Kafka、時序數據庫以及大數據分析等,根本不用關心服務怎么部署、擴展和運維,而只需要訂閱,這是我們平臺服務的優(yōu)勢。
同時,大量的算法都提供了開源的示例代碼,多種工業(yè)模型都可以直接通過API實現測試和應用。而且,我們會建議客戶開發(fā)應用采用微服務架構,把每個服務開發(fā)成模塊,用API Gateway實現集成,以實現更大程度的擴展性和可靠性。
我們平臺的服務接口也會集成一些第三方的能力,像工業(yè)3D模型、對象存儲等,第三方服務提供商只需要按照寄云NeuSeer平臺相應接口進行少量的開發(fā),就可以跟NeuSeer平臺實現結合。
愛分析:微服務的理念對于客戶的滲透率如何?
時培昕:在互聯(lián)網領域比較常見,在工業(yè)領域還需要時間滲透,但我們給客戶交付的工業(yè)應用多數都已經是微服務的架構。
愛分析:處于怎樣的考慮把平臺要做成生態(tài)的模式?
時培昕:我們雖然提供了一個很強的平臺,但是由于工業(yè)實在太分散,如何在具體場景下利用各種工具達到分析目標和構建應用,不是寄云一家能夠完成的,所以我們也非常希望構建這樣的生態(tài),有更多的開發(fā)者和分析人員參與進來,共同使用和貢獻,通過這種社區(qū)的寫作,解決很多原本他們無法單獨解決的問題?,F在有很多合作伙伴、科研機構都已經在平臺上面做應用開發(fā)和數據分析。
愛分析:對合作伙伴的開發(fā)服務是否需要收取一定費用?
時培昕:現在是免費,到年底會按實際的資源使用量收取費用?,F有平臺上的客戶有集成商、有工業(yè)設備的原廠商和服務商,也有做工控系統(tǒng)和工業(yè)網關的廠商。我們希望為他們提供一個開放的平臺,只要跟我們平臺實現連接,把數據傳上來,就可以快速利用我們平臺的各種存儲、分析、模型和應用開發(fā)能力,實現對工業(yè)設備數據的實時監(jiān)控、數據分析、故障診斷和性能預測。而這些能力,原來是需要非常高的門檻和代價才能實現的,我們的目標就是需要把這些門檻和代價盡量降低。
愛分析:數據來源有哪些?是否接入第三方數據?
時培昕:主要是客戶的設備數據和業(yè)務系統(tǒng)數據。暫時還沒有考慮第三方數據的接入,未來會引入一些開放的第三方數據源。
愛分析:目前切了哪些行業(yè)?
時培昕:主要行業(yè)包括軌道交通、電力能源和智能制造。軌道交通客群包括造車、建設、運營三類,合作的有唐車和四方等。電力能源行業(yè)我們服務像大唐、中電投和國家電網等發(fā)電企業(yè),搭建開放式平臺實現設備健康管理、健康監(jiān)測,和合作伙伴共同開發(fā)眾多全新的工業(yè)應用。制造領域有京東方、彩虹集團、陜鼓等,從產線數據采集、生產經營分析、質量追蹤,一直到設備的遠程運維等。
愛分析:服務大型企業(yè)時,是以怎樣的方式進入?
時培昕:從單一需求切入,逐步做大。數據成熟的企業(yè),可能先從分析和應用開發(fā)切入,但有時候不得不從數據采集和存儲切入。不斷解決客戶現有需求,并且?guī)椭蛻粢?guī)劃新的建設需求。。
愛分析:前期理解業(yè)務需要多久?定制化部分有哪些要點?
時培昕:根據客戶不同,有幾天的,也有可能需要幾個星期,都會有調研。很多定制化是對具體場景下特定主題或者應用的分析和開發(fā),由于我們提供了比較多的微應用,我們可以通過模塊化的方式實現快速組合,實現快速集成。
愛分析:通常情況下,項目周期需要多久?
時培昕:大項目的交付往往需要幾個月或半年以上,POC時間很短。
愛分析:采用怎樣的定價方式?客戶的續(xù)單能力如何?
時培昕:對于中小客戶,采用云的方式提供服務,按年收費;對于大客戶,我們提供產品+定制化服務。項目一般是持續(xù)性的,每年有不同的建設主題。
愛分析:后續(xù)搭配的服務有哪些?
時培昕:偏分析的服務會一直持續(xù),安裝部署是一次性的,還包括產品的運維服務。
愛分析:項目通常在什么量級?
時培昕:從幾十萬開始,到上千萬不等。
愛分析:種子或標桿客戶有哪些?
時培昕:平臺推出的時間不長,所以基于我們平臺開發(fā)的客戶還不太多,但是已經有一部分在線的設備廠商在使用。但平臺是多個獨立產品的整合,這些獨立產品,包括時序數據庫、大數據分析平臺、數倉和數據分析以及PaaS平臺,包括上海城建、大唐、國網、中車這些客戶都已完成部署。
愛分析:大客戶如何定義?
時培昕:大客戶的收入規(guī)模百億級以上。幾億到幾十億是中小型客戶。
愛分析:原來通用型平臺現在還在推嗎?這部分業(yè)務未來如何考慮?
時培昕:目前我們首先會集中在電力能源、軌道交通這些重點行業(yè),而在其他行業(yè),我們會把通用平臺的能力開放出來,與合作伙伴一起共同構建行業(yè)云平臺。。
愛分析:工業(yè)領域,產品的可復制性較低,這個如何考慮?
時培昕:需要更多的合作伙伴。我們能做的是關注的幾大行業(yè),盡量把接口和能力開放出來,合作伙伴解決不了這些問題的時候,可以用我們平臺實現一個相對完整的解決方案。我們相信很多行業(yè)里,合作伙伴比我們更專業(yè)。
愛分析:目前切的三個行業(yè)考慮繼續(xù)做深?
時培昕:是的,繼續(xù)做深。其他行業(yè)歸在智能制造里,我們會給一些基礎能力,像通用的故障診斷、通用的質量分析,尋找合作伙伴。工業(yè)太散了,每一個客戶需求都不一樣。
愛分析:整體團隊結構如何?
時培昕:一共80多人,技術占了七成。
愛分析:采用怎樣的銷售方式?
時培昕:直銷為主,做大客戶。中國的商業(yè)環(huán)境是只有技術肯定不行,必須有自己的大客戶能力,我們的銷售團隊都是非常資深的行業(yè)銷售,有非常豐富的行業(yè)經歷。
愛分析:核心團隊背景。
時培昕:主要來自Teradata、IBM、HP、Oracle、GE和PTC等各大外企的管理層,有豐富的企業(yè)市場經驗。
愛分析:團隊擴張與營收是否正相關?
時培昕:不是,我們已經過了技術儲備的最大擴張階段,接下來擴充在業(yè)務和行業(yè)專家。因此業(yè)務的增長可能有一個滯后階段。
愛分析:與入場的各類玩家相比,寄云的優(yōu)勢有哪些?
時培昕:如果跟國外巨頭比較,我們優(yōu)勢在本地理解和支持能力。國內市場中,很多廠商是以連接為主線,我們最強的地方是以數據為主線。我們希望國內企業(yè)更多的是合作,包括一些做專門數據分析的廠商,我們也希望可以合作。
愛分析:國內廠家跑出的不多,這是出于什么原因?
時培昕:幾十年以來,中國95%的工業(yè)軟件系統(tǒng)都掌握在國外工業(yè)廠商手里。一方面這是巨大的國家安全隱患,一方面壓制了大量工業(yè)軟件人才的培養(yǎng),所以一直以來都沒有很好的國內工業(yè)軟件廠商。國家政策就是要我們把這些工業(yè)軟件、工控系統(tǒng)控制在自己的手里,自主可控,這就是國內軟件企業(yè)的機會點。
愛分析:目前看來,大數據公司很難真正明白工業(yè)的業(yè)務場景。
時培昕:這個得學,我們不認為一個做消費類大數據公司能夠進入工業(yè),最大問題就是不理解工業(yè)。我們也不認為一個工業(yè)企業(yè)能夠獨立把這個事情做好,因為他沒有很好的工具、分析能力和開發(fā)能力。我們是正好有這方面能力,但是現在我們還不足以覆蓋到每個方面。
愛分析:實際對接的客戶部門是業(yè)務部門?
時培昕:業(yè)務部門為主。
愛分析:市場空間您如何判斷?
時培昕:GE Digital一年的revenue是60億美金,2020年要達到150億美金。我認為中國市場中,工業(yè)占GDP的35%以上,所以這才是中國最大的軟件市場。
愛分析:下一步整體公司的戰(zhàn)略是什么?
時培昕:第一,我們已經有不錯的平臺,基于我們平臺把行業(yè)做深,更多面向垂直行業(yè)的具體應用,把行業(yè)能力和平臺能力結合。
第二,與更多的合作伙伴共同搭建平臺生態(tài)。讓更多做控制系統(tǒng)、應用開發(fā)的企業(yè),可以在平臺上解決自己原來沒有辦法解決的問題。
未來我們可能會參與到幾個行業(yè)級別的工業(yè)互聯(lián)網平臺的建設中,和合作伙伴共同打造細分行業(yè)的工業(yè)互聯(lián)網平臺。