識別1萬種物體 “衣+”讓服裝采購更簡單

王姝 鉛筆道 2016-09-26 11:39:47

blob.png

◆ “衣+”創(chuàng)始人張默

導語

2015年年底,ImageNet競賽(被譽為國際計算機視覺領域的“奧林匹克”)結(jié)果揭曉?!耙?”團隊的三位成員,在“靜態(tài)圖片和視頻目標檢測和分類任務”中獲得了五項世界第一,與它同場競技的有谷歌、英特爾、微軟等巨頭和斯坦福、香港中文大學等研究機構(gòu)。

兩年前,張默從新加坡回到國內(nèi),創(chuàng)立“衣+”,研發(fā)人工智能視覺搜索引擎。系統(tǒng)主打柔性物體(如衣服等)識別,準確度約90%。

產(chǎn)品主要面向B端,包括邊看邊買引擎、圖像識別智能分析引擎、人臉識別分析引擎。通過識別和分析視頻或圖像中的物體,以標注、打點、搜索同款等方式投放廣告,提高轉(zhuǎn)化率。

她讓用戶看劇之余搜同款 2億SKU任性剁手 識別1萬種物體

◆ “衣+”的商業(yè)模式

目前,“衣+”的合作伙伴有30多家,包括優(yōu)酷、360、新浪微博、阿里云、華為等,已接入淘寶、天貓的2億SKU,并獲得優(yōu)土等平臺的內(nèi)容和流量導入。系統(tǒng)能識別10000類物品、400種場景,單物體識別一項的精度甚至超過人眼。

blob.png

: 張默承諾文中數(shù)據(jù)無誤,為其真實性負責,鉛筆道已備份錄音速記,為內(nèi)容客觀性背書。

計算機視覺

2013年圣誕節(jié)前,硅谷一家投資機構(gòu)的辦公室里,張默正在協(xié)議上簽字。座位旁邊放著一副拐杖。事故發(fā)生在前一天,她腳踝骨折,但這個“天生愛闖蕩”的姑娘,連石膏都沒有打,一路從新加坡殺到硅谷。

協(xié)議簽完,張默當場拿到了一張15萬美元的支票。她手握支票,心潮澎湃。此時,她只有一個創(chuàng)業(yè)想法,做一個以圖搜衣的軟件,其余什么都沒有?!巴顿Y機構(gòu)愿意在這種情況下給錢,我還挺受鼓舞的?!?/p>

她關注計算機視覺領域很多年。北京大學軟件專業(yè)畢業(yè)后,她曾在華為、微軟和IBM等公司從事研發(fā)工作。她一直認為,“技術創(chuàng)新能創(chuàng)造藍海,而計算機視覺技術又是發(fā)展前沿”。

工作之余,她潛心研究行業(yè),尋找應用方向。作為一個“擁有愛美之心”的女生,張默經(jīng)常關注時尚,有時在路邊、網(wǎng)上看到好看的衣服,自然而然地就想搜到同款?,F(xiàn)有的文本搜索框無法滿足需求,她決定通過視覺識別搞定。

她讓用戶看劇之余搜同款 2億SKU任性剁手 識別1萬種物體

◆ 穿上西裝和晚禮服的程序師們讓人耳目一新。

種子輪融資塵埃落定,張默拄著拐杖,返回新加坡。算法團隊來自當?shù)?,開發(fā)團隊則是清一色的印度人。三個月時間,張默沒有躺下來養(yǎng)病,而是拖著腿上的石膏跟研發(fā)團隊奮戰(zhàn)。

5月,出于市場考慮,張默回國,成立“衣+”。“當時我覺得北京是一個充滿夢幻和憧憬的城市,所以義無反顧地回來了。”

攻堅識別技術

張默招來自己的同學和朋友,組建了一支10人的團隊攻堅技術難關。他們選擇直接從圖像識別中最難的柔性物體(如衣物等)識別入手。這類物體穿在人身上容易變形,相對剛性物體(如3C、日用品等)來說,技術壁壘更高。

為了提高識別的準確度,團隊采用卷積神經(jīng)網(wǎng)絡將不同商品建模。該模型設計通過不同層級去表述商品的不同特征,可以識別復雜環(huán)境,盡可能排除光線、角度、圖片質(zhì)量的干擾。

她讓用戶看劇之余搜同款 2億SKU任性剁手 識別1萬種物體

◆ 層級示意圖

模型網(wǎng)絡的底層采用商品的基本特征,如顏色、款式、材質(zhì)和紋理等;更高層使用細節(jié)特征,如衣領翻折角度、皮毛材質(zhì)的卷曲程度、圖案的大小間距等。“現(xiàn)在,我們的層級已經(jīng)從20多層發(fā)展至200層,已經(jīng)超過了去年微軟提出的152層?!?/p>

此外,團隊建立深度學習模型,通過訓練數(shù)據(jù)(商品數(shù)據(jù))和用戶行為反饋,糾正系統(tǒng),持續(xù)迭代優(yōu)化。“算法是引擎,數(shù)據(jù)是燃料,兩者缺一不可。”當時,系統(tǒng)的SKU大多通過爬蟲抓取,數(shù)據(jù)量不大。

10月,“衣+”App上線,用戶可通過手機拍照上傳,搜索服裝同款信息。兩個月后,張默拿到500萬天使輪融資,投資人是兩個分別將公司出售給阿里、騰訊的成功創(chuàng)業(yè)者張峰、戴志康。

上線后,產(chǎn)品一直不溫不火,張默琢磨著此路不通。“C端獲客成本太高,場景有限。”春節(jié)前后,她決定轉(zhuǎn)移到B端,讓圖像識別嵌入圖片和視頻網(wǎng)站,植入到更多高頻剛需場景?!耙曨l網(wǎng)站需要廣告,廣告主需要流量,圖像識別恰好可以連接兩端,將視頻流量導流至電商和廣告主中。”

拿下優(yōu)土阿里

去年3月,一次極客咖啡的股東聚會上,張默碰到了優(yōu)酷負責戰(zhàn)略合作的李捷。優(yōu)酷正好在尋找擁有圖像識別技術的合作方,幫助廣告變現(xiàn)。

會后,雙方達成合作。張默根據(jù)優(yōu)酷的需求,調(diào)整系統(tǒng)。在圖像識別的基礎上,增加視頻識別,追蹤物體運動軌跡,定位關鍵幀。識別目標從衣物拓展到常用商品,如水杯、電話等。

此外,張默推出場景識別。通過檢測物體推斷畫面場景,投放廣告,建立品牌和場景之間的聯(lián)系。如伊利牛奶主要應用于家庭和運動場景,當系統(tǒng)識別出這類場景時,會以角標、AR特效或疊加動漫貼圖等方式出現(xiàn)伊利的廣告。

去年9月,張默拿到A輪融資,投資方是優(yōu)酷土豆、樂搏資本和三行資本。三個月后,兩款產(chǎn)品在優(yōu)酷土豆上線。

她讓用戶看劇之余搜同款 2億SKU任性剁手 識別1萬種物體

◆ “衣+”針對優(yōu)酷土豆推出的兩款產(chǎn)品

上線之初,商品主要通過爬蟲抓取。一個月后,阿里平臺為“衣+”帶來億級SKU。目前,團隊已接入2億商品,深度學習模型不斷迭代,識別準確率從80%升至90%。

事實證明,場景與產(chǎn)品的相關性提升了廣告效果。“拿視頻打點廣告來說,CTR(點擊到達率)達到了5%~10%,是傳統(tǒng)廣告的25~50倍?!?/p>

其中,廣告主由視頻網(wǎng)站和平臺共同洽談。根據(jù)銷售情況的不同,雙方七三或六四分成。

更多的合作伙伴

今年,產(chǎn)品已漸漸成形,張默主要在推廣上發(fā)力,上游合作伙伴可分為三類:

她讓用戶看劇之余搜同款 2億SKU任性剁手 識別1萬種物體

“衣+”主營業(yè)務包括精準場景化營銷業(yè)務、邊看邊買電商業(yè)務和技術服務提供商。盈利模式為軟件技術許可和廣告分賬。

經(jīng)過1年的鉆研,團隊于今年5月,研發(fā)出三值神經(jīng)網(wǎng)絡。這項技術將模型壓縮了16倍(32bit到2bit),精度幾乎保持不變。識別系統(tǒng)可放到本地設備中運行,對內(nèi)存、計算能力和耗電的要求大幅降低,“運算速度快5倍”。

目前,“衣+”的合作伙伴有30多家,包括優(yōu)酷、360、新浪微博、阿里云、華為等,已接入淘寶、天貓的2億SKU,并獲得優(yōu)土等平臺的內(nèi)容和流量導入。系統(tǒng)能識別10000類物品、400種場景,單物體識別一項的精度甚至超過人眼。

未來,張默將進一步訓練模型,擴充識別品類、延展應用場景,嵌入更多的應用和平臺,完善B端業(yè)務。

長按二維碼關注我們