作為AI智能體的“黑馬”,Manus的爆火一度讓外界對(duì)其充滿期待。但經(jīng)過數(shù)月的摸索,Manus“折戟”中國市場。今日(7月19日),Manus創(chuàng)始人罕見發(fā)聲,首次公開回應(yīng)了這次起落背后的一切。
7月19日,Manus聯(lián)合創(chuàng)始人季逸超發(fā)布了一篇長博客,從技術(shù)層面深度復(fù)盤從創(chuàng)業(yè)以來在Agent(智能體)研發(fā)與訓(xùn)練方面的經(jīng)驗(yàn)教訓(xùn)。季逸超表示,Manus團(tuán)隊(duì)之所以選擇“套殼”而非自研大模型,正是基于前一次創(chuàng)業(yè)的慘痛教訓(xùn),決定基于開源或商業(yè)大模型做“上下文工程”,構(gòu)建智能體。然而,這個(gè)過程并不簡單,團(tuán)隊(duì)經(jīng)歷了4次智能體框架調(diào)整才實(shí)現(xiàn)局部最優(yōu)解。
通過回溯過去幾個(gè)月的創(chuàng)業(yè)歷程,季逸超為智能體賽道創(chuàng)業(yè)者總結(jié)了一系列的經(jīng)驗(yàn)。他指出,AI智能體的未來在于上下文設(shè)計(jì),而非單純比拼模型能力。值得注意的是,最近AI智能體領(lǐng)域迎來了不少新進(jìn)展,OpenAI推出了ChatGPT智能體系統(tǒng),Kimi發(fā)布了最新的大模型K2,并表示K2的設(shè)計(jì)目標(biāo)是“為下一代智能體提供通用認(rèn)知引擎”。在基礎(chǔ)模型廠商憑借底層模型發(fā)力智能體賽道的背景下,純智能體創(chuàng)業(yè)公司如何在激烈的競爭中立足,成為Manus不得不思考的問題。
從技術(shù)層面深度復(fù)盤Manus經(jīng)驗(yàn)教訓(xùn)
今年3月,一款名為Manus的產(chǎn)品刷屏網(wǎng)絡(luò)。這款產(chǎn)品由一家名為“蝴蝶效應(yīng)”的初創(chuàng)公司研發(fā),被稱為“全球第一款通用Agent產(chǎn)品”,能夠?qū)崿F(xiàn)真正的自主執(zhí)行能力,完成篩選簡歷、做房產(chǎn)研究、股票分析等復(fù)雜任務(wù)。
一夜爆火后,Manus的內(nèi)測邀請(qǐng)碼“一碼難求“,在二手平臺(tái)上甚至被爆炒至數(shù)萬元。然而不到半年時(shí)間,Manus就被爆出撤離中國市場的消息,不僅官方微博和小紅書賬號(hào)的內(nèi)容均已清空,官網(wǎng)首頁也顯示“Manus在你所在的地區(qū)不可用”。此外,還有消息稱Manus已將總部遷往新加坡,除了核心研發(fā)團(tuán)隊(duì)40多人遷往新加坡,其余約80名非核心員工被裁。對(duì)此,Manus對(duì)外回應(yīng)表示:“基于公司自身經(jīng)營效率考量,我們決定對(duì)部分業(yè)務(wù)團(tuán)隊(duì)進(jìn)行調(diào)整。公司將繼續(xù)專注核心業(yè)務(wù)發(fā)展,提升整體運(yùn)營效率?!?/p>
從智能體的“當(dāng)紅炸子雞”到撤離中國市場,Manus一直飽受行業(yè)爭議,外界對(duì)其這一選擇也存在諸多猜測。7月19日,Manus聯(lián)合創(chuàng)始人季逸超發(fā)布了一篇長博客,從技術(shù)層面深度復(fù)盤創(chuàng)業(yè)以來在Agent(智能體)研發(fā)與訓(xùn)練方面的經(jīng)驗(yàn)教訓(xùn),試圖將輿論拉回到技術(shù)與產(chǎn)品本身。
在長文中,季逸超表示在Manus項(xiàng)目的最初階段,他和他的團(tuán)隊(duì)就面臨一個(gè)關(guān)鍵決定:是使用開源基礎(chǔ)模型訓(xùn)練一個(gè)端到端的智能體,還是基于前沿模型的上下文學(xué)習(xí)能力構(gòu)建一個(gè)智能體?季逸超說,在他的上一段創(chuàng)業(yè)經(jīng)歷中,他從頭開始訓(xùn)練模型,但隨著GPT-3 和 Flan-T5的出現(xiàn),其內(nèi)部模型“一夜之間變得無關(guān)緊要”。正是因?yàn)橛辛诉@樣的慘痛教訓(xùn),Manus 選擇押注于上下文工程而非底層模型,這也使得Manus能快速地改進(jìn),進(jìn)行產(chǎn)品迭代。
具體來看,季逸超總結(jié)了Manus的不少實(shí)操經(jīng)驗(yàn),為業(yè)內(nèi)同行提供了重要參考。比如,他強(qiáng)調(diào)KV-Cache(Key-Value Cache,一種緩存機(jī)制)的命中率至關(guān)重要,輸入越穩(wěn)定,緩存命中率越高,成本和延遲越低。因此,創(chuàng)業(yè)者有三種辦法可以提高KV-Cache緩存命中率:一是保持提示前綴穩(wěn)定,避免在提示中使用時(shí)間戳;二是使上下文僅追加,避免修改先前的操作或觀察,確保序列化是確定性的;三是在需要時(shí)明確標(biāo)記緩存斷點(diǎn)。
此外,季逸超還提到,動(dòng)態(tài)修改工具列表會(huì)讓緩存失效、模型混亂,因此不要?jiǎng)討B(tài)添加工具,而是要使用“遮蔽法”來控制選擇;要用文件系統(tǒng)承載持久上下文,規(guī)避信息丟失;要保留錯(cuò)誤日志(如失敗的操作、堆棧信息),幫助模型更新內(nèi)部信念,減少重復(fù)錯(cuò)誤等。
并未直接回應(yīng)撤離中國市場原因
值得注意的是,季逸超的長文主要是技術(shù)層面的復(fù)盤與探討,但并未對(duì)市場關(guān)注的裁員、遷址新加坡、撤離中國市場等話題進(jìn)行直接回應(yīng)。
Manus雖然此前在國內(nèi)引發(fā)了不少關(guān)注,但Manus從創(chuàng)業(yè)之初就有著極強(qiáng)的海外市場基因。發(fā)布之初,Manus就僅僅支持英文,發(fā)布視頻也是全程英文介紹,還需要特殊的網(wǎng)絡(luò)條件進(jìn)行注冊(cè)。據(jù)了解,Manus的核心基礎(chǔ)是Claude大模型,這是美國創(chuàng)業(yè)公司Anthropic推出的一款大語言模型,而Anthropic是OpenAI最強(qiáng)勁的競爭對(duì)手之一。
此外,今年4月,Manus母公司“蝴蝶效應(yīng)”還完成了硅谷知名風(fēng)投Benchmark牽頭,騰訊、真格基金、HSG跟投的7500萬美元B輪融資,主要用于擴(kuò)張美國、日本、中東等海外市場。
業(yè)內(nèi)人士表示,Manus最初就是瞄準(zhǔn)了海外市場,但在國內(nèi)的意外爆火使其開始萌生同時(shí)開拓國內(nèi)市場的想法。Manus受到國內(nèi)用戶關(guān)注后,曾宣布與阿里通義千問團(tuán)隊(duì)達(dá)成戰(zhàn)略合作,雙方將基于通義千問系列開源模型,致力于在國產(chǎn)模型和算力平臺(tái)上實(shí)現(xiàn)Manus的全部功能。不過,Manus與通義千問的合作始終沒有落地,用戶注冊(cè)Manus依然需要特殊的網(wǎng)絡(luò)條件。
外界對(duì)于Manus撤出中國市場有諸多猜測。有分析人士指出,Manus的B輪融資由美國風(fēng)投公司Benchmark領(lǐng)投,而美國“對(duì)外投資安全計(jì)劃”禁止美國資本投資可能增強(qiáng)中國AI技術(shù)的項(xiàng)目,Manus將總部遷至新加坡或是為了規(guī)避審查風(fēng)險(xiǎn)。此外,由于Manus主要基于Claude模型,而Claude模型不向國內(nèi)用戶提供服務(wù),即使與阿里通義千問合作,也面臨維護(hù)兩套不同產(chǎn)品、成本高、投入產(chǎn)出不成正比等問題。這些原因,或都是其做出這一戰(zhàn)略調(diào)整的主要考量。
AI智能體賽道持續(xù)升溫加速落地
在Manus引發(fā)行業(yè)對(duì)“智能體退潮”的憂慮時(shí),近期AI智能體賽道卻迎來了頗多重磅消息和重要技術(shù)進(jìn)展。
7月18日,OpenAI推出了全新智能體產(chǎn)品“ChatGPT Agent”。根據(jù)介紹,這是一個(gè)融合Operator智能體網(wǎng)頁交互能力、含“深度研究”(Deep Research)功能的互聯(lián)網(wǎng)信息搜集能力以及ChatGPT對(duì)話能力的統(tǒng)一智能體,可以完成包括在線購物、訂餐預(yù)約、撰寫研究報(bào)告、制作PPT和財(cái)務(wù)分析在內(nèi)的多步驟復(fù)雜任務(wù)。
三者組成強(qiáng)力“AI三劍客”,標(biāo)志著OpenAI全面進(jìn)軍自動(dòng)化AI代理領(lǐng)域。值得注意的是,這一智能體產(chǎn)品的底層模型在多個(gè)基準(zhǔn)測試中提供了最先進(jìn)的性能,在涵蓋超百個(gè)學(xué)科的 Humanity' s Last Exam(人類的最后測試)中,得分率達(dá)41.6%,約是OpenAI o3和o4-mini 得分的兩倍;在FrontierMath數(shù)學(xué)基準(zhǔn)測試中,使用工具時(shí)得分27.4%,遠(yuǎn)超o4-mini 的 6.3% 。
與此同時(shí),Kimi近期也開源了萬億參數(shù)的混合專家模型K2。在Kimi公布的測評(píng)結(jié)果中, K2在自主編程、工具調(diào)用和數(shù)學(xué)推理三個(gè)維度的表現(xiàn)上,都超過了同為開源模型的DeepSeek-V3和阿里Qwen3。Kimi團(tuán)隊(duì)還對(duì)外宣稱,K2的設(shè)計(jì)目標(biāo)是“為下一代智能體提供通用認(rèn)知引擎”,其核心亮點(diǎn)是智能體的應(yīng)用能力,在工具調(diào)用和智能體循環(huán)方面表現(xiàn)極為出色。
多家券商研報(bào)表示,隨著各AI巨頭發(fā)力智能體產(chǎn)品商業(yè)化,2025年有望成為AI Agent元年。中金研報(bào)指出,基礎(chǔ)大模型仍是決定Agent能力上限的關(guān)鍵,大模型的編程及智能體能力也是各家廠商競爭關(guān)注的焦點(diǎn)。C端Agent具有更大的市場想象空間,因此也是大廠和創(chuàng)業(yè)公司更為聚焦的領(lǐng)域,無論是海外的OpenAI、Google還是國內(nèi)的字節(jié)、阿里,以及Manus、Genspark等創(chuàng)業(yè)公司都在這一領(lǐng)域積極布局,近半年來產(chǎn)業(yè)進(jìn)展顯著。
不過,當(dāng)前智能體類產(chǎn)品存在同質(zhì)化嚴(yán)重、商業(yè)化路徑不明等問題,在基礎(chǔ)模型廠商憑借底層模型發(fā)力智能體賽道的背景下,純智能體創(chuàng)業(yè)公司如何在激烈的競爭中立足,成為Manus不得不思考的問題。
校對(duì):陶謙