數(shù)據(jù)服務產(chǎn)業(yè)鏈初現(xiàn),數(shù)據(jù)應用機會最大

愛分析ifenxi 2017-01-13 08:13:28

隨著大數(shù)據(jù)概念深入人心,越來越多的企業(yè)開始認可數(shù)據(jù)存在價值。挖掘自身數(shù)據(jù)價值、獲取外部數(shù)據(jù)是企業(yè)兩大需求。但在實踐中,企業(yè)發(fā)現(xiàn)兩大需求存在同樣問題,不論是自身數(shù)據(jù)還是外部數(shù)據(jù),原始數(shù)據(jù)與有價值數(shù)據(jù)之間存在鴻溝,自身缺乏填平鴻溝的技術(shù)手段。

大數(shù)據(jù)

新興大數(shù)據(jù)公司成為解決問題的答案,他們具備處理數(shù)據(jù)的經(jīng)驗和技術(shù),可以將原始數(shù)據(jù)轉(zhuǎn)化成能為業(yè)務提供支持的數(shù)據(jù)。數(shù)據(jù)服務產(chǎn)業(yè)鏈就此形成。

整個數(shù)據(jù)服務產(chǎn)業(yè)鏈可以分為三個部分,從上游的數(shù)據(jù)源到中游的數(shù)據(jù)服務商,再到下游的企業(yè)級用戶。因為大數(shù)據(jù)公司大多成立時間較短,自身業(yè)務產(chǎn)生數(shù)據(jù)有限,一般是作為數(shù)據(jù)源和企業(yè)級用戶的橋梁,處于整個產(chǎn)業(yè)中游。做數(shù)據(jù)加工和數(shù)據(jù)應用,挖掘原始數(shù)據(jù)的價值,為企業(yè)業(yè)務提供數(shù)據(jù)支持。

在整個大數(shù)據(jù)產(chǎn)業(yè)生態(tài)中,數(shù)據(jù)服務是生態(tài)中重要一環(huán),下接底層技術(shù)平臺,上接頂層應用。

數(shù)據(jù)源眾多,有價值數(shù)據(jù)源在巨頭手中

政府的數(shù)據(jù)大部分還尚未被挖掘,目前應用比較多的是公安數(shù)據(jù),明略數(shù)據(jù)、中奧科技等公司在與公安合作,挖掘數(shù)據(jù)價值。其他政府機關(guān)的數(shù)據(jù)多數(shù)還處于沉睡階段,九次方等公司正與地方政府合作,推進政府機關(guān)大數(shù)據(jù)發(fā)展。

傳統(tǒng)企業(yè)的數(shù)據(jù)應用程度與該行業(yè)的信息化程度有關(guān),像金融、電信等行業(yè)信息化程度較高,其數(shù)據(jù)源價值很大。像醫(yī)療、制造業(yè)等行業(yè)的企業(yè)內(nèi)部數(shù)據(jù)庫尚未實現(xiàn)互聯(lián),大數(shù)據(jù)尚處于起步階段。這點可以從大數(shù)據(jù)公司重點涉足的行業(yè)看出,多數(shù)大數(shù)據(jù)公司選擇將銀行、運營商作為切入點,醫(yī)療、工業(yè)大數(shù)據(jù)公司相對較少,而且體量較小。

互聯(lián)網(wǎng)數(shù)據(jù)乍一看是開放程度最高,應用范圍最廣的數(shù)據(jù)源,但實際上互聯(lián)網(wǎng)數(shù)據(jù)中最具價值的部分都被BAT等互聯(lián)網(wǎng)巨頭所擁有,目前幾乎不對外開放。通過爬蟲等方式獲取的數(shù)據(jù)價值非常有限。不過隨著移動互聯(lián)網(wǎng)興起,移動設備承載的用戶行為數(shù)據(jù)價值被挖掘出來。

目前來看,最有價值的數(shù)據(jù)源是政府、運營商和BAT,BAT的數(shù)據(jù)完全不開放,政府的數(shù)據(jù)同樣開放程度有限,而運營商的數(shù)據(jù)開放程度最高,有十幾家大數(shù)據(jù)公司與運營商合作,可以接觸到運營商的數(shù)據(jù)。

大數(shù)據(jù)公司承上啟下

數(shù)據(jù)加工是指將數(shù)據(jù)源的數(shù)據(jù)進行清洗、整理,而數(shù)據(jù)應用是將清洗后的數(shù)據(jù)賦予行業(yè)屬性,使其能直接為下游客戶提供幫助。

目前,數(shù)據(jù)堂、聚合數(shù)據(jù)等公司專注于數(shù)據(jù)加工,而TalkingData、集奧聚合等公司同時在做數(shù)據(jù)加工和數(shù)據(jù)應用。 

數(shù)據(jù)堂、聚合數(shù)據(jù)的業(yè)務比較類似,他們將不同渠道的數(shù)據(jù)進行清洗、整理,將數(shù)據(jù)進行分類,做成標準化API接口,提供給做數(shù)據(jù)應用的公司,一般來說,他們并不直接面對企業(yè)級客戶。工作有點類似于將小麥加工成面粉,做面包的工作交給下一層公司去完成。

TalkingData、集奧聚合不僅僅做數(shù)據(jù)加工,還在探索數(shù)據(jù)的場景應用。他們直接服務企業(yè)級客戶,他們在處理數(shù)據(jù)的過程中就需要考慮客戶的需求,從場景應用層面考慮數(shù)據(jù)挖掘和數(shù)據(jù)分析。工作是將小麥加工成適合做面包的面粉,同時做面包。

上述兩類公司的區(qū)別是,數(shù)據(jù)堂、聚合數(shù)據(jù)的業(yè)務更貼近數(shù)據(jù)源,而TalkingData、集奧聚合的業(yè)務更貼近企業(yè)級用戶。

大數(shù)據(jù)交易中心如雨后春筍般出現(xiàn)

提供數(shù)據(jù)服務的,除了大數(shù)據(jù)公司外,大數(shù)據(jù)交易所也扮演重要角色。自2015年4月貴陽大數(shù)據(jù)交易所成立,各地大數(shù)據(jù)交易中心如雨后春筍般冒出。短短一年時間,就出現(xiàn)了長江大數(shù)據(jù)交易中心、華中大數(shù)據(jù)交易中心、上海大數(shù)據(jù)交易中心、浙江大數(shù)據(jù)交易中心等近十家交易中心。

交易中心要么是地方政府與大數(shù)據(jù)公司合作成立,如貴陽大數(shù)據(jù)交易所,要么是由上市公司牽頭建立,如浙江大數(shù)據(jù)交易中心。從目前來看,大數(shù)據(jù)交易中心還處于探索階段,數(shù)據(jù)交易量不大。截至今年8月,成立一年的貴陽大數(shù)據(jù)交易所的交易總額剛剛突破1億元。

數(shù)據(jù)特點決定數(shù)據(jù)是非標商品,交易存在信息不對稱現(xiàn)象

經(jīng)過幾年發(fā)展,大數(shù)據(jù)不再僅僅是概念,開始逐步落地。大家不再迷信數(shù)據(jù),對數(shù)據(jù)的看法開始回歸理性。愛分析認為數(shù)據(jù)具備以下幾個特點:

一. 絕大部分數(shù)據(jù)價值有限。

無論是政府、傳統(tǒng)企業(yè)還是互聯(lián)網(wǎng),每天都在產(chǎn)生TB級、甚至PB級的數(shù)據(jù)。這其中大部分數(shù)據(jù)對企業(yè)級用戶而言,是沒有價值的,或者說價值有限的,真正能為企業(yè)提供幫助的數(shù)據(jù)是極小一部分。

每個人都知道數(shù)據(jù)源越多,數(shù)據(jù)維度越廣,數(shù)據(jù)對業(yè)務的提升越大。但在實際應用中,還是需要摒棄掉大部分數(shù)據(jù),集中研究很小規(guī)模的數(shù)據(jù)。一方面,盡管Hadoop、Spark等開源技術(shù)已經(jīng)大大降低了數(shù)據(jù)存儲、處理的成本,但面對海量數(shù)據(jù),仍然有些力不從心;另一方面,大數(shù)據(jù)在各行業(yè)的應用尚處于探索階段,很多數(shù)據(jù)的場景應用尚未被發(fā)掘。

上述兩個原因使得絕大部分數(shù)據(jù)價值有限,這導致數(shù)據(jù)存在一定聚合效應,有價值的數(shù)據(jù)源集中在幾個行業(yè),甚至是幾個公司。

二. 數(shù)據(jù)與場景應用相結(jié)合才有價值。

經(jīng)濟下行,業(yè)績不樂觀,企業(yè)變得越來越務實。像前十年大量購買IT設備那樣在大數(shù)據(jù)投入是不可能的,企業(yè)更加關(guān)心數(shù)據(jù)能帶來什么價值。直接把數(shù)據(jù)給企業(yè)是沒有用的,需要將數(shù)據(jù)與企業(yè)的業(yè)務場景結(jié)合起來,使企業(yè)真正看到這些數(shù)據(jù)能為其帶來什么,這才是數(shù)據(jù)的價值。

從這個角度來看,脫離應用場景空談數(shù)據(jù)價值是沒有意義的。與場景結(jié)合的越緊密,數(shù)據(jù)價值越大,企業(yè)級用戶付費意愿越強烈。

三. 數(shù)據(jù)具有時效性,越久遠的數(shù)據(jù)價值越低。

很多人將數(shù)據(jù)比喻為石油,兩者的確有很多相像之處。但是數(shù)據(jù)與石油有一個非常大的區(qū)別,數(shù)據(jù)具有時效性。只要保存得當,一年前的石油和剛開采的沒有本質(zhì)區(qū)別,而一年前的數(shù)據(jù)價值遠低于最新數(shù)據(jù)。

以精準營銷為例,通過數(shù)據(jù)挖掘找到用戶感興趣的產(chǎn)品,過段時間很可能用戶已經(jīng)購買該產(chǎn)品。這時,原有數(shù)據(jù)已經(jīng)失效,用戶畫像發(fā)生變化,需要對最新的數(shù)據(jù)進行分析,找到新的需求點。

因為上述三個特點,數(shù)據(jù)是非標準化商品。如果雙方僅限于數(shù)據(jù)交易,沒有更加深層次的合作,數(shù)據(jù)就脫離應用場景而存在,如何進行定價是最大問題,如前文所述,數(shù)據(jù)只有在應用過程中才能發(fā)現(xiàn)其價值。

除以之外,不同數(shù)據(jù)對更新速度依賴程度是不一樣的,在各場景應用上數(shù)據(jù)時效性也有很大差別。因此,在判斷數(shù)據(jù)價值上,時效性對數(shù)據(jù)價值影響有多大是難以估量的。

另一方面,數(shù)據(jù)交易過程中存在信息不對稱的現(xiàn)象。數(shù)據(jù)買方如果不實際使用數(shù)據(jù)是無法判斷買到的數(shù)據(jù)是否為真正有效數(shù)據(jù),現(xiàn)實與想象中有多大差別是不確定的。另一方面,買方很難用一種簡單方式去判斷獲得的數(shù)據(jù)是否為最新數(shù)據(jù),同樣需要在應用過程中去鑒別。

目前數(shù)據(jù)在各行業(yè)的應用還處于探索階段,隨著行業(yè)發(fā)展,數(shù)據(jù)在各行業(yè)應用成熟,數(shù)據(jù)能帶來多大價值會逐漸達成共識,數(shù)據(jù)將逐漸成為標準化商品,交易過程中的信息不對稱將大大降低。

在實際操作上,很多有價值的數(shù)據(jù)源都是敏感數(shù)據(jù),如何進行脫敏處理,如何實現(xiàn)交易是另外一個大問題。針對這樣的問題,目前大數(shù)據(jù)公司采取的方式是將自身的算法架設在數(shù)據(jù)源的機房,通過原始數(shù)據(jù)提煉出數(shù)據(jù)標簽,完成數(shù)據(jù)加工的工作,像數(shù)據(jù)堂、TalkingData、集奧聚合都采用這類方式。

大數(shù)據(jù)交易中心還得靠政府

大數(shù)據(jù)交易中心不僅僅是作為民間數(shù)據(jù)交易的橋梁,更是作為政府數(shù)據(jù)開放的橋頭堡。目前來看,政府數(shù)據(jù)的開放存在政策問題。盡管國家近年頻頻出臺大數(shù)據(jù)相關(guān)政策,但是中央關(guān)于政府機關(guān)數(shù)據(jù)開放的具體管理辦法還未公布,地方政府對開放數(shù)據(jù)存在疑慮,做法非常謹慎。

如果大數(shù)據(jù)交易中心僅僅交易一些民間數(shù)據(jù),交易所的作用相對有限。正如前文所言,大部分數(shù)據(jù)價值有限,數(shù)據(jù)源相對比較集中,數(shù)據(jù)買方可以直接與數(shù)據(jù)源進行合作,無需通過交易所這個平臺實現(xiàn)。

近期,貴州政府制定發(fā)布《政府數(shù)據(jù) 數(shù)據(jù)分類分級指南》等4項政府數(shù)據(jù)系列地方標準。這說明一些地方政府已經(jīng)開始在政府數(shù)據(jù)開放上進行嘗試,相信國家層面的相關(guān)政策為時不遠。

數(shù)據(jù)與應用結(jié)合當前發(fā)展最佳

隨著技術(shù)發(fā)展,數(shù)據(jù)加工會更趨于標準化加工流程,同業(yè)比拼的不僅僅是技術(shù)實力,對接的數(shù)據(jù)源數(shù)目和質(zhì)量更為重要。目前這一領域還屬于早期圈地階段,很多行業(yè)的數(shù)據(jù)還未被有效存儲、采集,未來隨著各行業(yè)信息化成熟,高質(zhì)量數(shù)據(jù)源是最核心競爭力。這個領域會逐步淘汰小公司,最終剩下幾個大公司,新公司進入門檻越來越高。

這領域先發(fā)優(yōu)勢比較明顯,越早進入市場,越容易對接更多的數(shù)據(jù)源。很多掌握數(shù)據(jù)源的企業(yè)最初是不清楚自身數(shù)據(jù)源價值,因此早期獲取數(shù)據(jù)源成本相對較低。數(shù)據(jù)堂深耕這一領域五年時間,現(xiàn)在是這一領域最大公司,數(shù)據(jù)源通過眾包、行業(yè)、政府及互聯(lián)網(wǎng)四個維度進行獲取,與同業(yè)公司相比優(yōu)勢明顯。

數(shù)據(jù)應用領域發(fā)展前景更好,這些公司的優(yōu)勢不僅僅是技術(shù)和數(shù)據(jù)源,還有對數(shù)據(jù)基于場景應用的理解,各家公司為企業(yè)級用戶提供的服務具有差異性,市場競爭相對良性。另一方面,數(shù)據(jù)應用市場規(guī)模前景巨大,目前僅僅是冰山一角。以銀行客戶為例,目前大數(shù)據(jù)公司為銀行提供的主要是風險控制、精準營銷等對外業(yè)務層面,未來還會涉及到銀行客戶的內(nèi)部運營效率提升等方面。市場規(guī)模大、業(yè)務差異化大,使得各個垂直行業(yè)中都會產(chǎn)生巨頭公司。

從目前行業(yè)發(fā)展來看,數(shù)據(jù)應用領域的公司增速更快、體量更大,TalkingData、集奧聚合估值都超過30億。這兩家公司都是選擇以金融、地產(chǎn)作為切入點。金融、地產(chǎn)行業(yè)一方面公司自身信息化程度高,對數(shù)據(jù)非常重視,另一方面大型企業(yè)居多,付費能力強。


長按二維碼關(guān)注我們