0

雷鋒網按:外界總會首先注意到字節跳動不少產品是建立在推薦引擎上的,但也往往會忽略與推薦引擎相輔相成的還有數據中臺。從簡單的A/B測試,到后來的數據分析平臺、數據開發治理、ABI、極速OLAP引擎等一系列產品形態的拓展,逐漸形成了數據中臺如今的模樣。而這項工作的主要承擔方,其實正是最近一段時間字節跳動開放出來的火山引擎數據中臺。
字節跳動的早期其實并沒有很成熟的數據處理體系(比如數倉),更別說有數據中臺這類體系了。但就在短短幾年間,伴隨今日頭條、抖音、西瓜視頻等多款爆款應用的成長,字節跳動的數據架構、實踐路徑、產品體系也逐步打磨出來。
在字節內部,數據中臺受到業務線的格外重視,一旦有新的產品業務上線,都會找到數據中臺請求支撐。正是這種休戚與共、強調解決問題的務實精神,讓數據中臺對內已經能夠支撐集團數百條業務。而最近一年,越來越多的外部客戶、圈內廠商也跑來咨詢:“誒?你們的數據中臺BP團隊、增長引擎,究竟是怎么搞的呀?”
在數據中臺團隊看來,現在有很多客戶對字節跳動內部數據驅動的理念和實踐是非常感興趣的。只是當前階段,數據中臺需要進一步加快最佳實踐的產品化,滿足客戶的差異化訴求。
那么,何為中臺BP?何為數據驅動增長?何為“以應用為中心”的數據中臺?雷鋒網近期與火山引擎數據中臺負責人羅旋進行了一次深入交流,以還原當下火山引擎數據中臺的獨到之處。
抖音的早期故事
2020年9月,來自一份第三方的調研數據顯示,抖音用戶日均總使用時長是441.6億分鐘。換算成你能理解的時間跨度,意味著將近9萬年。抖音獲得用戶青睞的同時,也在悄悄地改變著互聯網流量戰爭的格局。
實際上,因其強大的Feed流和推薦算法,抖音平臺的早期用戶自然增長率非常高,無論是用戶黏性、活躍量,還是停留時長,這意味著抖音早期幾乎不需要什么大力投放,因為本身它就是一款產品力非常強的應用。
時局到了第二階段,就不太一樣了。大概是在2018年初,抖音平臺上已經積累了大量活躍用戶,為了進一步優化體驗,給用戶帶來價值,產品也同時進入到了功能版本迭代的高發期。這時,就會遇到一個命題——A/B測試固然有效,但如何保證每一次迭代的決策長期來看是正確的?此時,產品經理就需要依靠大量的數據對產品的各種情況進行測算。
再往后,抖音的用戶體量已經足夠大,且進入到增長曲線的平滑期,除了精細化運營外,更需要探索新的增長空間。產品如何快速試錯、大量嘗試?此時,無論是底層引擎的響應速度,還是貼近應用層的工具服務,都需要跟上抖音的業務節奏。
分析以上過往你會發現,抖音從早期發展到如今的成功,離不開數據驅動理念的支撐,而給這一理念披上產品外衣的,用今天的視角來看其實就是火山引擎的數據中臺。
火山數據中臺的前世今生
在字節跳動內部,有這么一句話:“A/B是一種信仰,風神(數據洞察平臺)是一種習慣。”
2014年前:
可以說,A/B測試從2012年字節跳動創建之初就已經開始應用,通過A/B測試來消除偏見,接近客觀事實。
2014~2018年:
隨著A/B測試越做越多,字節團隊發現非A即B的負面影響,只看一個結果是不夠的,需要進一步對數據進行分析以佐證判斷,為此在A/B測試的基礎上開發了數據洞察平臺風神。而像數據集成、數據開發、數據治理等更多的工具也逐漸在這段時間里成型。
值得一提的是,數據中臺基于Clickhouse開發的OLAP引擎也是在此期間上線和能力改造,以解決數據分析性能的瓶頸。
這個階段,主要解決的是效率和成本優化的問題,包括對底層架構進行升級,從接入第三方的工具,到嘗試自研一些開發工具、調度工具等,使得研發和運維的效率變得更高。
2018年~2020年:
2018年應該是一個比較關鍵的節點,并且為字節跳動帶來了三個主要改變。
一是數據中臺的“成型”。
這個節點開始,字節跳動業務有了更深入、全面化的發展,繼今日頭條之后,陸續有抖音等現象級的爆款應用,以及孵化的新業務。“正是因為火山引擎的數據中臺在頭條、抖音都打磨過,所以當有新的業務出現時,可以非常快地接入。”羅旋指出。
二是數據中臺的BP化。
另一個重要變化是,在業務線變得越來越多的同時,很多業務的體量也足夠大了,比如為抖音提供服務時,單純提供一些通用型工具是不夠的,而是需要更加貼近其業務場景,滿足其定制化的場景需求。
這種背景下,字節跳動也開始籌備“數據中臺的BP團隊”,對“前端”業務進行專門的支撐。BP全稱是Business Partner,類比于HRBP,組織形式上是集中式的,可以統一管理調配培養,執行上分布式到各個業務,解決業務問題。這種組織方式的優勢在于,盡管BP團隊向上支撐了不同類型的業務線,但向下其實是兼容了底層數據的各項能力,具備相似的技能棧,對工具引擎的學習和使用是高效且順滑的。
雷鋒網認為,除了數據中臺底層好之外,字節跳動BP團隊存在的基礎是其企業具有強有力的組織能力,以及企業的部門墻比較低,否則怎么能讓業務部門和中臺組織能夠很好融合?
三是真正意義上有了“客戶”的理解。
這一個改變是水到渠成的。正是因為數據中臺早期在支撐更早期的業務線方面積累了很多的“信譽”,為今后支撐更多的業務線奠定了良好基礎,并形成了正循環。
這種視角下,需要團隊不僅有對數據的理解,還要有對“客戶”的理解,將業務線看成你的“客戶”,還能根據需要提供一些定制化需求。

【圖:火山引擎數據中臺架構圖】
2020年之后:
2020年字節跳動將數據中臺通過火山引擎對外開放,恰恰說明了一件事:字節跳動的數據中臺已經很好服務于內部,它開始思考如何服務好外部的事情了。
無論是之前的飛書,還是如今的火山引擎,逐步將內部實踐過的技術或用的好的產品開放出來,在形成商業化路徑的同時,還能反饋給內部,進一步提高內部技術。
從面向“業務價值”入手
越來越多的企業經歷了建中臺到拆中臺的過程,但不同的是字節跳動始終在堅守中臺,并且還通過火山引擎對外開放了,這是為什么?
原因不難得出——字節跳動的中臺發揮了應用的價值,一是上面說的BP制給業務帶來了很好的支撐;二是面向業務價值構建數據中臺,先判斷業務的需求是什么,然后提供輕量化的工具,隨之再逐步配套更多的能力。
這樣的方式也延伸到了火山引擎數據中臺的服務理念上來,面向應用構建數據中臺。簡單來講就是,面向應用更有目標性,能更早地發揮數據的價值,讓企業客戶的數字化轉型路徑不再是一個漫長的周期建設,而是一個逐步演進的過程。換一個更好的理解方式,其實是面向企業客戶實際需求,以及業務價值構建數據中臺。
這與其他的數據中臺廠商的服務有點大相徑庭,他們側重于搭建完整的體系,這種方式往往會給客戶帶來困惑:周期非常長且重。數據中臺最后是搭好了,但有不少客戶往往也找不到數據應用的場景,數據中臺建了半天沒用起來,更沒發揮出應有的作用。如果此時企業沒有一個強有力組織的話,很有可能“中道崩殂”。
業界有的數據中臺廠商也開始從場景側延伸出某些工具或解決方案。雙輪驅動看似美好,但實則需要上中臺的企業客戶對數據中臺廠商價值輸出有極強的容忍度。
對于如何更好地上數據中臺,雷鋒網根據采訪也梳理了幾點要素:
首先,上數據中臺的最好是業務發展或變化快速的部門,因為這些業務上中臺,一是ROI容易成正比,二也能充分發揮數據的價值,容易得到各方認可。
其次,一開始不一定就得從統一數據口徑入手,是不是可以先容忍數據層面一定程度的混亂,驗證價值。當業務發展起來后,再去治理它,這很大程度上符合敏捷的理念,也符合很多企業的實際情況。
然后,針對業務價值或實際存在的問題提供服務,務實而非務虛。火山引擎數據中臺的服務步驟一般是:1.先上專家或架構師,進行項目診斷;2.用產品和解決方案,走通關鍵路徑;3.當核心業務問題被解決后,也有一些事情是需要客戶自己來完成,這時也能夠針對性提供一些咨詢服務,從授人以魚到授人以漁。經過一兩輪的迭代,會發現,企業客戶的數據中臺正一點一點長起來。
在這個過程中,羅旋認為最好的服務策略是,先理解清楚客戶問題是什么。在他看來,數據中臺可能根本就不是需求,或者說就是個不準確或錯誤的需求。追本溯源,首先要了解客戶的原始問題是什么,數據中臺只是解決的路徑或方法之一。
“火山引擎不會以上帝視角直接告訴客戶,你需要什么,指標該用什么,而是會通過'望聞問切'的方式,再結合自身經驗,轉化為客戶能夠接受的理解方式。”
流量內卷重壓下,企業數字化怎么辦?
對于互聯網個體來講,流量越集中,變現效率就越高。如果從過去單純看流量,到現在可能開始關注私域流量,當互聯網用戶基數不再增長的情況下,任何一家企業開拓新業務,仍是在將流量左手倒右手。
這個時代,我們不難發現一個慘痛的現實:即便不是在互聯網行業,流量也開始內卷了,傳統行業實現數字化改造需要新的方式變得更為迫切了。
比如手機銀行就是一個典型案例。盡管這類應用跟社交類、游戲類App相比不會很高的用戶活躍度和使用時長,但放在同類型的銀行App里,依然存在小范圍的競爭。有沒有做足夠的用戶場景的布局和投入,決定了這款App(背后整條業務線)的生存空間。

【圖:6月10日發布會上,火山引擎總經理譚待首次揭秘數據中臺】
顯然,數字化實踐在字節跳動的起源其實是A/B測試,這體現了字節以衡量驅動迭代改進的方法理念,也直接影響了火山引擎數據中臺十分篤定A/B測試,形成了企業數字化時代沒有的優勢,同時對業務價值進行延展和創新,構成了企業數字化的突破點。
但對于A/B測試,羅旋并不覺得這是個存量市場。
“我覺得很多公司連A/B測試的基本概念都沒理解完全,離充分使用就更遠了,國內在這方面的市場教育,是遠遠不夠的。”
從商業化的角度來講,羅旋認為火山引擎本身要做的是一個更大的生意。
回溯字節跳動數據中臺跟業務部門之間的配合關系,我們不難發現,火山引擎也是希望將這種數據驅動、科學化增長的模式形成復制,推動企業客戶更好的成長。
如果這句話講給客戶聽,貼近現有業務進行數據治理或數據分析只是表象,更深層的是需要對這套數據架構/體系進行持續、整體性的升級,對數據價值進行充分洞察。越來越多的客戶正意識到需要強化對新技術的理解,加強自身的技術、數據價值沉淀,給產品賦予更多想象。
還是以手機銀行App的改造來看,銀行App不應該只是原來網上銀行或是網點柜面的復制品,而是能夠將用戶的金融信貸及生活習慣保留在App上的同時,以新的場景運營方式重塑這個平臺。
那么,這個故事又是否可以解答當前數據中臺人的困惑呢?
更廣泛的場景里,數據中臺帶來的價值和改造還有待一一驗證。
雷峰網原創文章,未經授權禁止轉載。詳情見轉載須知。