往后假期,你也可以為自己開發(fā)一個專屬AI導游。
文|《中國企業(yè)家》記者 閆俊文
3月初,一款名為Manus的通用Agent產(chǎn)品火爆網(wǎng)絡,測試階段,需要的驗證碼一碼難求。目前,Manus已經(jīng)在國外上線了APP,訂閱費根據(jù)檔次,分別為每月39美元和199美元。這比大部分大模型產(chǎn)品的收費都要高,比如Jasper AI,每月費用是29美元和59美元,其企業(yè)端收費更高一些。
Manus創(chuàng)始人肖弘是一位90后,有消息說,字節(jié)跳動曾嘗試收購Manus,但沒有成行。今年4月,Manus背后的公司完成由Benchmark領投的7500萬美元B輪融資,估值躍升至近5億美元,此前,它的投資人還有騰訊、真格基金、紅杉中國。
Agent,意即智能體,意味著AI能處理更復雜的問題,不僅能聽、能讀、能寫,還能思考與決策,甚至能夠與物理世界交互。
Agent時代正加速到來。2024年底,Anthropic發(fā)布并開源了MCP,(Model Context Protocol),MCP是一個開放協(xié)議,旨在標準化大型語言模型與外部數(shù)據(jù)源和工具的交互。它通過客戶端-服務器架構,允許AI應用通過統(tǒng)一接口訪問各種資源。今年4月,Google也發(fā)布了A2A(Agent to Agent),試圖讓AI智能體能夠相互“通信”。
近期,明勢創(chuàng)投創(chuàng)始合伙人黃明明在出席《中國企業(yè)家》2025商界木蘭年會時表示,Agent對物理世界的理解、記憶推理以及工具的使用,會在未來1~2年取得巨大突破,目前還遠遠沒有到大家停下來卷成本、卷差異化的地步。
目前,Manus的風暴仍在持續(xù),就像它的母公司名字“蝴蝶效應”一樣。該公司總部在武漢,但引發(fā)的創(chuàng)業(yè)潮卻在杭州、北京、上海等多地涌動。這些創(chuàng)業(yè)者們堅信,Agent是比APP更大的機會,下一個微信、抖音、小紅書的機會就藏在其中。
《中國企業(yè)家》記者在小紅書找到一位Agent創(chuàng)業(yè)者成峰,他今年31歲,生活在杭州,他擁有一個典型的大廠職業(yè)路徑,他先是在互聯(lián)網(wǎng)中廠、大廠從事產(chǎn)品和運營工作,后來跳到創(chuàng)業(yè)公司,最終選擇創(chuàng)業(yè)。
成峰始終覺得公司制的考核體系不能滿足自己對產(chǎn)品的想象,前者意味著用戶規(guī)模、ROI考核。最終他在2023年底,全職投入了Agent創(chuàng)業(yè)。
目前,成峰在小紅書、B站以及公眾號上以“AI產(chǎn)品自由”的賬號公開自己創(chuàng)作Agent的過程,就像一份教程——教別人怎么搭建Agent。他的全網(wǎng)粉絲超過5000人,同時也有足夠的廣告收入養(yǎng)活自己,但他的最終目標還是做Agent產(chǎn)品創(chuàng)業(yè)。這期間,他搭建過很多有趣的Agent:
一個是,給自己的媽媽搭建了一個“出行地圖”Agent。他將媽媽出行常用的起點和終點固定成模塊,設計成一個圖標放在手機屏幕上,一點擊,就能自動跳躍到高德地圖,自動打車以及導航到上車地點,而不是需要長輩手動搜索。
另一個是,能讓游客省去數(shù)百元錢的AI導游。他利用高德地圖和MiniMax的MCP做了一個浙江省博物館的AI導游,讓用戶可以聽AI對文物的講解。
還有一個是,他搭建了一款小紅書筆記Agent,這是一款接入了納米AI的小紅書爆款筆記工具。目前,小紅書沒有開放數(shù)據(jù)端口,但這款Agent像人一樣,搜索,瀏覽與抓取小紅書上的旅游內(nèi)容,最后生成AI旅游攻略。
這些Agent的搭建往往需要數(shù)小時到幾天不等,相較于APP開發(fā)數(shù)月的周期,大幅縮短了開發(fā)時間,并且搭建使用的語言不是代碼而是自然語言。
一個人人皆可設計產(chǎn)品的時代正在到來。
以下是成峰的講述(有刪減):
給媽媽做一個高德MCP
我開發(fā)MCP的需求,還是從個人出發(fā),因為都是自己經(jīng)歷的場景,所以就嘗試使用AI去解決問題。
今年“五一”期間,我用了一晚上,做了一個“高德地圖長輩版”的應用,方便長輩們出行打車。
我的老家在溫州,家中長輩需要在溫州和杭州之間往返,他們可能會有一些交通問題,有時候還帶著孩子,打車就比較困難,比如用滴滴打車或者高德地圖,他們需要去找收藏,得找半天,因為這些應用的收藏按鈕很小,有時候根本找不到。
后來,我就想把它做成一個網(wǎng)頁按鈕,放在手機屏幕上,家里人一點擊,就可以直接調(diào)用出發(fā)和目的地,打開高德地圖,直接打車。
其實,對于大部分人來說,怎樣去溝通一件事情,怎樣去表達,他其實沒有概念。我們跟大模型一樣,需要通過不斷對話,去校準經(jīng)驗,然后達到一個結果。但是搜索(移動互聯(lián)網(wǎng)產(chǎn)品)本身沒有這樣的功能,全靠用戶第一次輸入的準確性。
在“五一”前一周,我還做了故宮和浙江省博物館AI導游。這源于我去西藏旅游的經(jīng)歷,導游只管自己跑,基本不會給游客講解,我的體驗比較差。我就用MiniMax的MCP加上Cursor(AI代碼編輯器,功能是輸入需求表達,自動生成代碼)做了這款產(chǎn)品。
我用最簡單的產(chǎn)品工具去開發(fā),用自然語言表達,不到一周時間就做出來了。
其實,AI導游這一塊還有一些缺失,因為信息沒那么健全,如果博物館開放數(shù)據(jù),做出的產(chǎn)品體驗會更好一點。
有些旅游達人,他堅決不用智能體,全靠自己做攻略。我覺得用戶和用戶之間是不一樣的,有A用戶有B用戶,使用習慣是不一樣的。
旅游達人擔心“刷好評”以及不真實,其實還是抓數(shù)據(jù)源的問題,他能不能讓AI抓到差評的數(shù)據(jù)源。比如,大眾點評和小紅書比較難去抓,其實還是AI能力的問題,能力健全以后,AI能夠自己去抓那些評論,然后把評論匯總給用戶看的話,它能夠解決蠻多問題的。
這也是當前Agent存在的問題,就是產(chǎn)品之間的墻,我想去抓它的數(shù)據(jù),但抓不到,F(xiàn)在只能說,這一塊的業(yè)務沒辦法做。如果MCP未來的收益足夠大,肯定會有第三方或者第四方推動這個問題的解決。
我跟某大廠的內(nèi)部朋友聊過,如果依賴自己去做這件事情,內(nèi)部阻力還蠻大的,因為他們沒有人敢去下賭注,那些高層領導可能對AI并沒有那么了解,他們也不愿意腳踏實地地去用一用。
Manus的忠實用戶
我在2023年開始接觸AI編程,那時候GPT-4出來了,我自己寫一些小工具,到了2024年底,開始做一些小程序,到了今年,出現(xiàn)了MCP這個概念,加上Manus產(chǎn)品,我看到了肖弘,我覺得Agent是一個比APP更大的市場。
我試用過Manus,的確很流暢,比如你給他一個任務,首先,它會分析你的意圖是什么,然后,它就會有一個任務規(guī)劃,它會給你一個執(zhí)行表,它每做完一項就去勾一下,最后,它會用比較好的框架去展示結果。
我對肖弘團隊印象比較深的是這句話:“AI Should use browser,not in browser,The browser should be in cloud.(AI需要用瀏覽器,但不是在瀏覽器里面用,它應該在云端用)!
就像我們現(xiàn)在玩手機,其實都在用我們的眼睛。視覺層面的時間已經(jīng)給占用很多了,在視覺背后,還有很多空間可以去挖掘,比如,我們以前在看抖音時,背后其實可以有很多智能體幫我們?nèi)ネ瓿扇蝿,它的背后可以是無限的時間。
目前,杭州的MCP開發(fā)者是有一個圈層,但比較小,人數(shù)規(guī)模還比不上扣子(字節(jié)跳動的AI Bot開發(fā)平臺,于2024年2月上線)的開發(fā)者,原因在于它能夠商業(yè)化,比如一些企業(yè)已經(jīng)可以用扣子做一些生成圖片、寫文章的任務。
扣子排行榜前幾個Agent還挺有意思的,比如抓取一些小紅書的數(shù)據(jù),抓飛書的一些數(shù)據(jù),對于一些企業(yè)很有用。
目前,MCP或者部分智能體尚未形成成熟的商業(yè)化模式,其實,對Agent來說,MCP只是其中的一個點,它也不一定能做起來,但目前來看,它屬于其中一個臺階,未來可能會有比MCP更好的產(chǎn)品,但就目前來說,我個人覺得MCP是里面做得最好的。
我未來會以智能體為職業(yè)方向,現(xiàn)在商業(yè)化還不成熟,是因為生態(tài)不成熟,智能體的方向不會變,但可能智能體的形式會變。
未來,對純智能體的話,它可能還會面臨幾個挑戰(zhàn),第一個就是算力,如果像Manus那樣,它需要一個非常大的虛擬機,其實核心還是算力以及算力的成本。第二,就是大模型本身的突破,我本身不會去看到底哪個大模型做了什么功能,我始終去抓最好的大模型調(diào)用。
我現(xiàn)在社交媒體做了幾個賬號,全網(wǎng)粉絲超過了5000人,但我還是希望能做一個產(chǎn)品。
社交媒體是一個收集用戶反饋的渠道,在此之前開發(fā)產(chǎn)品,去做用戶訪談成本會比較高。此外,我們也可以做成一個賬號,可以用其他方式來盈利,這樣,當你未來有一個新的產(chǎn)品,你相當于有一個宣發(fā)平臺,能給你做冷啟動。