訂閱
糾錯
加入自媒體

不甘只做AI 應用工廠,字節(jié)跳動補課大模型

2024-03-18 10:33
光錐智能
關注

文|郝    鑫

編|王一粟

光錐智能獲取最新獨家消息,繼2023年8月首發(fā)后,今年4月,字節(jié)跳動旗下的大語言模型云雀大模型即將迎來重要版本的升級更新。

八個月一次的更新頻率放在大模型市場確實少見,在這樣內卷的大模型中,字節(jié)顯得有些另類,沖刺迅猛如百川智能,前期平均一個月發(fā)布升級一款大模型。

但回顧過去一年,字節(jié)并不甘愿躺平,與國內外大模型公司“先通用大模型,后產品應用”的思路不同,素有“應用工廠”的字節(jié)選擇在有一個云雀大模型的基礎上,狠、準、快地押注AI原生應用。

先是從組織層面著手,2023年下半年,字節(jié)開始整合大模型團隊和其他業(yè)務小組,成立專注于AI創(chuàng)新業(yè)務的新部門Flow,部門也成為字節(jié)在AI技術研究和研發(fā)產品的排頭兵。

再是像一架龐大制造機器,半年多的時間里,字節(jié)瘋狂地向國內外市場輸送了十幾款AI產品;與此同時,也在產品研發(fā)過程中積累和發(fā)表了一批圖像生成、視頻生成的基礎技術研究成果。

如今,字節(jié)就像是在產品和市場領域摸爬滾打完一圈后回來,帶著更多元化的視角來審視基礎大模型本身。

作為互聯網新貴,字節(jié)沒有經歷過2016年興起的大廠AI實驗室浪潮,反而是用AI算法技術和圖文、視頻結合,相繼創(chuàng)造出了今日頭條和抖音的爆款應用。

據最新披露,字節(jié)2023年Q3營收309億美元,已經超過了騰訊。新王登基后,擺在字節(jié)面前的問題也很清晰,如何利用自己的優(yōu)勢補齊落下的課,趕上新一波的AI浪潮?

AI應用制造工廠,半年上線十一款產品

“加強危機感,始終創(chuàng)業(yè),逃逸平庸的重力”,2024年伊始,字節(jié)CEO梁汝波就定下了全年的目標。

要說最貼合梁汝波所說的創(chuàng)業(yè)屬性的,莫過于字節(jié)去年成立的Flow。

去年8月云雀大模型正式發(fā)布,并同時宣布開始對外測試AI對話產品“豆包”,字節(jié)立即奔赴至下一個應用的戰(zhàn)場,云雀大模型逐漸隱去在了鋪天蓋地的消息中,轉而成為了豆包等一系列AI產品背后的“底座”。

九月份,字節(jié)新成立的Flow接棒成為主力。據公開報道信息梳理,字節(jié)抽調了大量高管人才掌舵,大模型團隊的負責人朱文佳同時負責Flow的業(yè)務線,字節(jié)技術副總裁洪定坤負責Flow的技術線,字節(jié)產品與戰(zhàn)略副總裁朱駿負責該部門的產品線,同時還有飛書的產品副總裁齊元俊加盟。

(光錐智能根據公開報道梳理制成)

在字節(jié)大舉進軍之下,實現了多個應用,多點開花的局面。據光錐智能不完全統(tǒng)計,從去年八月到現在,半年多的時間內,字節(jié)在海內外共測試、上線了十一款AI應用產品,一款圖像類的產品Picpic還未上線,這其中由Flow團隊主導研發(fā)的產品有八款。

從產品類型來看,字節(jié)選擇的方向主要集中在Chatbot、虛擬角色、Agent和圖像四個主要方向,基本覆蓋了去年大火的應用層創(chuàng)業(yè)方向,比如Chatbot領域有一騎絕塵的效率產品 ChatGPT,虛擬角色領域有用戶數量可觀的Character.AI,Agent方向上有OpenAI推出的GPTs等等。

多個方向出擊,遍地開花,這樣的畫面仿佛一夜又回到了抖音誕生的前夕。入局AI應用賽道,字節(jié)再次采用了“內部賽馬”的策略,國內通過云雀大模型提供能力,國外基于GPT提供服務。很多時候把海外當試驗田,先國內一步上線類似的產品,去跑市場和用戶數據,為國內上線作準備。

此外,字節(jié)也很清楚自身的優(yōu)勢在哪里,抖音和Tiktok兩個流量大池,天然成為了字節(jié)引流和拉新的利器。據光錐智能觀察,字節(jié)專門開設了豆包的“帶貨直播間”,向進入直播間的用戶介紹豆包的功能,宣傳可免費下載App。此外,字節(jié)也邀請了大量的抖音達人為豆包站臺,在段子里植入了豆包的新功能。

(圖源:抖音)

或許正是因為流量的牽引,發(fā)布時間晚的豆包在認知度和月活上已經超過了百度的文心一言。據報道,有消息人士透露豆包的月活已于去年12月增長至200萬,2024年1月份則在此基礎上翻了一番,豆包的月內平均日活已經完成了對文心一言的反超。

從字節(jié)自身業(yè)務角度來看,除了Flow,飛書、剪映、字節(jié)新加坡公司、巨量引擎、大力教育等多個部分也在試水和上線AI工具和產品。自從Sora問世以后,AI視頻賽道再燃戰(zhàn)火,字節(jié)的剪映業(yè)務也被寄與了厚望,張楠辭任抖音集團CEO一職領隊剪映團隊,從目前來看,剪映已經上線了 AI 克隆音色、AI 作圖、AI 繪畫、AI 生成口播等功能。

(圖源:剪映)

字節(jié)在 AI 視頻上推出產品也許只是早晚的事情,在技術儲備方面,字節(jié)已經積累了視頻生成模型MagicVideo-V2、視頻編輯Boximator、視頻生成研究 PixelDance,并從谷歌視頻生成模型團隊挖過來了對口人才。

已有消息稱,字節(jié)正在AI大模型領域秘密研發(fā)多個產品,其中包括多模態(tài)數字人產品以及AI生圖、AI生視頻產品。

字節(jié)不急于改舊業(yè)務,而利用單點的能力放射去內部賽馬,一方面是為了測試市場,一方面也在探索如何把AI嵌入到原有的業(yè)務流中。

比如在飛書業(yè)務線中推出了“智能伙伴”,用Agent的技術來改變傳統(tǒng)的工作流,實現辦公場景下的內容創(chuàng)作、內容總結、數據分析等功能,達到個人和企業(yè)的降本增效。哪些地方要發(fā)揮 Agent的能力,哪些地方要運用文生圖的能力,哪些場景要調用對話推理的能力,這些都要在落地過程中去檢驗。

飛書CEO謝欣曾在發(fā)布會上表示,未來AI的能力一定會變得非常強大,各行各業(yè)都會發(fā)生巨大變革。但目前AI能力還很有限,不一定能讓每一項任務都如期所愿,“當下更重要的是先讓自己做到AI Ready”。

重回主戰(zhàn)場,補課大模型

梁汝波在2023年底年會上反思,“字節(jié)對技術的敏感度不如創(chuàng)業(yè)公司,直到2023年才開始討論GPT。而業(yè)內做得比較好的大模型創(chuàng)業(yè)公司,都是在2018年至2021年創(chuàng)立的。”

梁汝波的言外之意是,字節(jié)的大模型慢了。

去年3月百度發(fā)布文心一言,隨后華為、阿里迅速跟進發(fā)布大模型,而直到8月中旬,抖音云雀大模型才姍姍來遲。

關于字節(jié)大模型團隊消息,最早可追溯至去年1月份,36氪曾報道,字節(jié)在當時組建了首個大模型團隊,包括語言大模型團隊和圖片大模型團隊。其中,語言大模型團隊由字節(jié)搜索部門牽頭,圖片大模型團隊由產品研發(fā)與工程架構部下屬的智能創(chuàng)作團隊牽頭。

彼時,ChatGPT和Midjourney都已經爆火出圈;蛟S是看到了這兩類背后路徑不同的產品,再考慮到旗下的一系列產品如何改造,字節(jié)從最初組建團隊,就選擇了技術、產品兩條腿走路。但大模型是大部分AI應用的底座,想要研發(fā)產品首先得有一個大模型。

云雀大模型正好承擔了這樣的角色,大模型剛一落地,字節(jié)就迅速同時開啟了AI應用研發(fā),但大模型性能上的不成熟,也一定程度上影響了AI應用的落地。

首先是從時間線上來看,相同功能的產品,國外上線的時間要早于國內,比如類GPTs平臺扣子國內開放時間比國外滯后了兩個月。即便國內的扣子上線后,但還是有很多中國用戶選擇國外版的Coze,原因在于可以直接調用 GPT-4 turbo的能力。

模型能力的高低之分,也會體現在產品的使用效果上,比如近期剪映海外版CapCut也推出了文生成視頻功能,但有用戶反饋,該功能在視頻清晰度、對提示詞理解和生成等待時間方面都差強人意。

這就導致了,在產品戰(zhàn)場大殺四方的字節(jié),不得不回過頭來補課大模型。

不過對字節(jié)而言,對標OpenAI 沒有太大意義,思考適合自己的大模型路線才是出路。

從公開資料來看,字節(jié)在AI方向的發(fā)力點還是集中在圖像、視頻領域。大模型方面,字節(jié)目前推出了通用大語言模型云雀和支持文本、圖像、音頻三種模態(tài)的多模態(tài)大模型BuboGPT;圖像視覺方向上,去年推出的MagicVideo-V2視頻生成模型曾經在國內外掀起了一波熱度,可以實現讓靜態(tài)圖片中的人物動起來。字節(jié)之后的研究繼續(xù)在視頻方向上延伸,包括如何通過輸入文本控制人物動作,如何增進視頻的動態(tài)效果等。

(光錐智能根據公開報道梳理制成)

由此看來,字節(jié)還是借鑒了OpenAI的做法,也就是在GPT大模型之外,把各種單點能力拉到最滿——語音方向有Whisper模型,圖像方向有DALL·E系列,視頻方向有Sora。

由于單點能力的突破也依賴于底層大模型的能力,特別是Sora提供了一種思路,即Transformer大模型架構可以與圖像生成模型相結合,這意味著大模型的推理、理解能力會影響最后的視頻生成邏輯。所以,在基礎大模型上,包括字節(jié)在內的所有大模型公司,都依然不能忽視。

除了在視頻模型上補足能力,字節(jié)也從團隊人才配置上下足了功夫。組建初期,抽調原新加坡負責TikTok技術負責人朱文佳帶領大模型團隊,后又令其同時負責Flow的業(yè)務線。一個排頭兵性質的部門Flow,集結了字節(jié)的技術副總裁、產品與戰(zhàn)略副總裁、飛書產品副總裁。近期,又被曝出谷歌視頻生成模型VideoPoet研究負責人蔣路加入了智能創(chuàng)作團隊,據悉,VideoPoet的思路與Sora世界模型的思路有很大的相似性。

Sora爆火后,有不少人將抖音前CEO張楠親自帶隊的剪映與其相提并論,但實際上,張楠仍然是更側重于產品層面。而真正的字節(jié)版Sora,必須要在上述這些科學家和技術負責人帶隊的團隊中誕生。

廣告&云業(yè)務

AI對字節(jié)的影響比想象中更大

去年一年,字節(jié)跳動創(chuàng)始人張一鳴將主要精力都花在了AI上,這對于受益于上一代AI技術(推薦算法)的最大受益者來說,的確具有不同凡響的重要意義。

AIGC最終生成的是內容,天然就是對內容生產形式的變革。相對于其他公司原有的電商、搜索、社交等業(yè)務屬性,抖音的基因本身就是內容,因此,這波大模型浪潮對字節(jié)的戰(zhàn)略意義,可能會遠大于其他公司。

雖然,ChatGPT-4 誕生剛滿一年,大模型和 AIGC 技術落地產業(yè)僅邁出了第一步,但是關于未來公司業(yè)務增長的想象力或許才剛打開。

以百度為例,其剛發(fā)布的2023年全年財報數據顯示,AI 已經給百度帶來了實際的效益。All in 大模型的這一年,讓百度搜索、廣告等老業(yè)務煥發(fā)生機,曾經低迷的云計算業(yè)務也看到了新的增長動力。

2023年百度核心收入1034.65億元,歸屬百度核心的凈利潤274億元,同比增長38%;大模型正在給百度帶來越來越多的商業(yè)收入,四季度內,僅大模型帶來的收入增長就達到了6.6億元,百度智能云的營收也來到了84億元;根據摩根士丹利的預估,2024年百度的廣告收入有望實現7%的同比增長。

雖然對字節(jié)來說,這點增長遠遠納入不了自己的眼睛,但不少業(yè)務線也依然具有一定的借鑒和參考價值。

據光錐智能了解到,受大模型浪潮影響,字節(jié)的云計算業(yè)務火山引擎的營收增長也比較可觀。得益于字節(jié)前期儲備了大量英偉達的GPU,很多大模型創(chuàng)業(yè)公司都愿意主動加入到火山引擎的生態(tài)中,從而拉動了火山引擎的增長。

雖然第一波先靠賣算力賺到第一桶金,但對火山引擎來說,未來靠使用這些大模型公司的算法而再次為云計算業(yè)務付費的客戶,才是更吸引人的。

而對字節(jié)賴以生存的廣告業(yè)務而言,大模型的影響力還尚未施展。目前,已經有百度、網易有道在內的幾家公司都提到,大模型對其廣告轉化都有促進作用。這對抖音、今日頭條等業(yè)務,無疑也是一個好消息。

為了提升營銷效率,抖音旗下的營銷平臺巨量引擎,也在1月23日,發(fā)布自動化技術品牌 UBMax(優(yōu)必投),立足應用下載、線索留資、電商引流三個場景。

另外,火山引擎也推出了非常具有字節(jié)特色的產品——火山引擎智能創(chuàng)作云,這是一個批量生成視頻的智能SaaS平臺,主要幫助電商賣家批量生成商品素材。雖然目前市場上做此類產品的公司非常多,也有一些是抖音的深度合作伙伴,但對于同時擁有技術和場景的公司,也只能是字節(jié)才能做到。

綜上所述,總體來看,字節(jié)在AI的投入上還是趨于保守,更注重對實際業(yè)務能產生價值的產品,而對前沿技術的投入才剛剛起步。

這也和字節(jié)近一年的聚焦戰(zhàn)略有關,近一年,字節(jié)幾乎清退或削減了所有與核心業(yè)務無關的業(yè)務條線,比如Pico、游戲。

核心業(yè)務強勢的時候,發(fā)展可以掩蓋一切問題。字節(jié)季度營收依然可以保持40%以上的同比增長,已經羨煞其他所有國內公司,但對字節(jié)和張一鳴來說,夢想還是要有的。

       原文標題 : 不甘只做AI 應用工廠,字節(jié)跳動補課大模型

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關注公眾號
OFweek人工智能網
獲取更多精彩內容
文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號