分享
國家互聯(lián)網(wǎng)信息辦公室準許從事互聯(lián)網(wǎng)新聞信息服務業(yè)務的網(wǎng)站
互聯(lián)網(wǎng)新聞信息服務許可證編號:10120220005
中新經(jīng)緯>>科技>>正文

三小時復現(xiàn)Manus,開源的OpenManus帶來哪些啟示?

2025-03-09 08:31:06 第一財經(jīng)

  三小時復現(xiàn)Manus,開源的OpenManus帶來哪些啟示?

  作者:呂倩 

  凌晨三點敲完代碼,次日早上八點新增三十多個好友申請,在開源社區(qū)GitHub上迅速收獲7000多顆星星——Manus爆紅不足三日,隸屬于國內(nèi)AI Agent初創(chuàng)公司DeepWisdom(深度賦智)的MetaGPT 團隊,就進行了產(chǎn)品復刻,并將產(chǎn)品Open Manus上傳至開源社區(qū)。

  第一財經(jīng)記者對話MetaGPT團隊,試圖理清此次技術(shù)復刻的底層邏輯,以及行業(yè)喧囂背后的意義。這一過程既反映出產(chǎn)品功能復刻離不開DeepWisdom公司具備的技術(shù)沉淀,也通過MetaGPT團隊的視角肯定了Manus團隊在規(guī)劃、后訓練、交互方式等方面的投入。

  在復刻過程中理解差異

  早在2023年,MetaGPT團隊開始研究多智能體框架,并在GitHub上開源相關(guān)代碼,獲得了社區(qū)的廣泛關(guān)注。2024年10月,團隊開始探索Agent的規(guī)劃能力和工具使用能力,提出Data Interpreter等工作。

  Manus火了之后,MetaGPTAI算法研究員向勁宇與MetaGPT算法研究員梁新兵討論:是否可以直接做一個開源版本。

  在具體產(chǎn)品屬性上,OpenManus是類Manus的多智能體框架,為開發(fā)者提供了快速上手和定制化開發(fā)的平臺,但向勁宇也不忘提醒:目前OpenManus是demo級(演示版本),暫時還沒有GALA benchmark評測結(jié)果,效果可能一般。后續(xù)團隊會進一步投入DeepResearch方向與SWE(軟件工程)代碼方向。

  此前Manus披露在GALA Benchmark評測中達到當前最優(yōu)水平(SOTA),超越OpenAI的Deep Research等競品。

  向勁宇推測,Manus團隊本身實現(xiàn)了非常復雜的規(guī)劃與后訓練,才能夠如同其demo提供良好的產(chǎn)品交互。Manus面臨效果不理想時的問題也是行業(yè)性問題,OpenManus暫時也沒有達到非常強的效果。

  對于三小時便能夠復刻“爆品”Manus,梁新兵對第一財經(jīng)記者表示,本質(zhì)在于團隊已儲備的技術(shù)積淀,且前兩個月前團隊已經(jīng)在思考如何通過簡單的、優(yōu)雅的形式,去呈現(xiàn)一個Agent形態(tài)。

  從Manus與OpenManus對外披露的演示視頻來看,兩者均屬于AI Agent產(chǎn)品,采用Multi-Agent(多智能體)架構(gòu),能夠?qū)碗s任務拆解為多個子任務,并分配給不同的Agent(智能體)執(zhí)行。另外,兩者均具備工具鏈集成屬性,集成多種工具,如網(wǎng)絡搜索、代碼執(zhí)行、文件處理等,以增強智能體的功能。

  相較而言,兩者最大差異在于OpenManus的開源屬性。與Manus的技術(shù)架構(gòu)主要依靠使用者猜測不同,OpenManus產(chǎn)品團隊直接在項目致謝中提及Claude廠商Anthropic去年上線的computer-use,YC投資的項目browser-use等。OpenManus作者張佳釔公開總結(jié)產(chǎn)品成果結(jié)合了computer-use、基本的Agents,以及規(guī)劃能力。

  多智能體將普及

  與其關(guān)注Manus剛剛出圈時的諸多噱頭,不如將目光聚焦在Manus模式給行業(yè)發(fā)展帶來的啟示。

  梁新兵認為,Manus讓更多普通人了解到智能體為何物,放大了Multi-Agent這條路徑。

  從發(fā)展歷史來看,Multi-Agent概念雛形最早可以追溯至20世紀80年代,分布式人工智能理念興起。2017年以后,隨著大型語言模型成熟,AI Agent應用開始從理論走向?qū)嶋H,例如AutoGPT 的出現(xiàn)標志著AI Agent的雛形誕生。

  2024年,微軟、谷歌、蘋果、OpenAI等廠商紛紛布局AI Agent市場。2025年1月,OpenAI發(fā)布首款AI Agent產(chǎn)品Operator,能夠執(zhí)行復雜操作,如編寫代碼、預訂旅行等,但目前僅提供給購買每月200美元ChatGPT Pro服務方案的消費者。直到國內(nèi)AI廠商Monica通過Manus,讓普通群眾第一次意識到Multi-Agent概念,MetaGPT的開源產(chǎn)品進一步揭開其神秘面紗。

  AIGCLINK發(fā)起人、行行AI合伙人占冰強對記者表示,Manus此類產(chǎn)品類型,之前MetaGPT團隊已經(jīng)實現(xiàn)過,也算是國內(nèi)首批投入智能體研發(fā)的團隊之一。

  MetaGPT NLP/Agent方向研究員洪思睿在交流中表示,目前的行業(yè)發(fā)展狀態(tài)中,通過大模型或Agent去做工具的使用,已經(jīng)不再新奇。隨著大家對具體產(chǎn)品與技術(shù)的關(guān)注越來越多,行業(yè)的技術(shù)難點在于:當很多相似的工具可解決同樣的問題,如何讓Agent把決策做得更好。另外,如果使用過程中接入的不是比較標準的工具接口,工具參數(shù)也可能出錯,進而導致工具的執(zhí)行效果不理想。

  這樣的背景下,通過動態(tài)路由技術(shù)優(yōu)化工具選擇與使用,通過知識增強與幻覺抑制提升決策可靠性,采用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架幫助 Agent 更清晰地展示決策過程,成為可選擇的解決措施。

  MCP協(xié)議(Model Context Protocol,模型上下文協(xié)議)目前成為了業(yè)內(nèi)的主流選項。所謂MCP,是由Anthropic于2024年11月底推出的一種開放標準協(xié)議,旨在統(tǒng)一大型語言模型(LLM)與外部數(shù)據(jù)源和工具之間的通信。它通過標準化接口,使LLM能夠安全、高效地訪問外部資源,從而擴展其功能。

  占冰強對記者表示,MCP本身完全可兼容,主要看技術(shù)廠商是否愿意支持。目前海外主流廠商已逐步接入,尤其是在AI工具和開發(fā)平臺領(lǐng)域,相信國內(nèi)廠商也會陸續(xù)跟進。

中新經(jīng)緯版權(quán)所有,未經(jīng)書面授權(quán),任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。
關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”),看更多精彩財經(jīng)資訊。
關(guān)于我們  |   About us  |   聯(lián)系我們  |   廣告服務  |   法律聲明  |   招聘信息  |   網(wǎng)站地圖

本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權(quán)。

未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復制及建立鏡像,違者將依法追究法律責任。

[京B2-20230170]  [京ICP備17012796號-1]

違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn

Copyright ©2017-2025 jwview.com. All Rights Reserved


北京中新經(jīng)聞信息科技有限公司