谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?


圖片AI迎來GPT時刻,大模型吞噬垂類的詛咒還在嗎?
原創科技新知 前沿科技組
作者丨櫻木 編輯丨江蘺
最近,一根香蕉打破了AI圈的平靜。最初可能只是朋友圈病毒式傳播的手辦圖,但隨后事情似乎向著瘋狂的方向發展,上線不到兩周,谷歌旗下的Nano Banana已在全球生產超2億張圖片,亞太地區用戶熱情度居首。而英偉達CEO黃仁勛成了它的忠實用戶,在倫敦,他面對一眾記者,公開宣稱自己是Nano Banana的忠實粉絲。瘋狂的流行帶來了另一個好處,就是直接帶動了Gemini App的用戶增長。在短時間內,Nano Banana為Gemini App帶來了超過1000萬新用戶。而在前不久,Nano Banana更是幫助谷歌Gemini超越了霸榜蘋果應用榜很久的ChatGPT。
相關的連鎖反應也在進一步加深,在海外,有報道顯示,為了應對nano Banana帶來的沖擊,openAI以約11億美元的全股票交易方式,收購產品實驗平臺Statsig。伴隨此次收購,Statsig的創始人兼首席執行官Vijaye Raji將加入OpenAI,擔任新設立的“應用部門首席技術官”。
在國內,字節快速跟進推出了seedream4.0,試圖通過這一方式強化豆包和即夢的用戶心智。而另一邊,垂類應用美圖,則遭遇了危機,通用模型吞噬垂類應用的故事,影響著資本市場對其未來的判斷,股價經歷了巨量波動。雖然外資投行,依然為美圖站臺,但通用模型的勢能仍好像“達摩克利斯之劍”影響著公司。一時間,AI世界的變化,開始圍繞著這一超級應用泛起波瀾。其實類似的波動,讓人總會想起,GPT-4o帶來的吉卜力畫風的時刻,而與之相對應的則是,通用模型是否會代替掉垂類AI應用的探討。前OpenAI研究員姚順雨曾在播客中表達,創業公司對比大模型公司最大的機會在于能不能設計出不同的interface(交互方式),可能模型的能力會產生beyond chatgpt的交互方式,變成superAPP。但從另一個維度來看,主流研究員則認為,長期耕耘C端業務的垂類應用,有著對用戶精細化的理解,而在B端,特定場景的know-how也能為垂類應用公司壘起一定的護城河。無疑nano Banana像是一場突如起來的變革,攪動著AI圈的神經,而到到底是促增長的功能,還是搶地盤的入侵,似乎值得一番拆解。
01 谷歌“香蕉”攪動AI圈
如果順著姚順雨的思路來看,Nano Banana確實正在顛覆圖片創作的邏輯。在以往,大模型如果要生成圖片,prompt提示詞非常關鍵,用戶需要學習結構化的提示詞才能獲取較好的效果。甚至在一些場景中,需要專業的提示詞才能達到應有的效果。后續的修改,無論是通過Midjourney的“Vary”功能還是DALL-E的局部重繪,都感覺像是獨立的、離散的操作。而現在,Nano Banana的快速響應和自然度,讓創作更像實時對話,而不是反復抽卡。這也是許多人第一次感到,AI圖像生成變得像實時創作。用戶不再需要反復調試結構化的咒語,而是通過簡單的自然語言對話,就能對圖像進行精確修改。Nano Banana繼承了Gemini大模型的“原生世界知識”,這意味著它不僅僅是一個圖像生成器,更是一個具備常識和推理能力的系統。它能夠理解和生成具有深層語義準確性的圖像.在羅永浩與周鴻祎最新的對談中,也提到了,語言對于AI幫助的核心價值。根據報道,這一切讓Nano Banana在風格一致性、多圖融合、精準的逐步編輯以及設計與風格遷移等多個方面上,有了出色的表現。
Nano Banana通過更精確的理解和更細致的任務拆分,實現了高度一致性的圖像編輯。某種程度上,這是通過模型定義實現的一種更近似Agent的能力。
從這個角度來看,其顛覆感正如姚順雨所說,正在改變交互的方式,這也是它為何能夠震動AI圈的原因。在此基礎上,Nano Banana也做到了成本低、速度快。在Google的介紹中,Nano Banana的定價為30美元/百萬token,每張圖片生成所需的token在1290個左右,成本約合0.039美元。而從另一個視角來說,Nano Banana的實現路徑,似乎很難復制,在團隊的訪談和公開分享里,Nano Banana的幾個方向被反復提及:文字渲染、交錯生成、速度哲學,以及世界知識的引入。這些關鍵詞組成的其實是,背后強大的模型能力所帶來的降維打擊。那么,另一個問題就非常值得關注了,面對如此強大的工具,以及國內已經逐漸明朗的大模型廠商格局,是否意味著,如果按照Nano Banana的思路,就可以成功顛覆垂類的AI應用呢?
02 美圖們的護城河在哪兒?

在美圖暴跌之后,相關券商的調研也相繼出爐。9月2日,摩根士丹利研報指出,美圖的增長軌跡并未受到AI模型Nano Banana的影響,其真正的價值在于提供了基礎AI模型無法企及的“最后一公里”解決方案。報告強調美圖憑借其在垂直領域的深厚積累、專有數據以及對核心付費功能的專注,構筑了堅實的護城河。此外,公司對所有AI模型保持開放和中立,并已將Nano Banana等新技術無縫整合進產品中。而與此同時,也有業內人士表達,美圖的C端業務主要優勢在于對美顏美體的精細化理解,目前看nano的手辦模型只是一種新的玩法,并不威脅C端主業。而美圖的B端業務主要是圍繞商拍等核心功能服務大C小B的客戶,優勢在于對于特定場景的know-how、在商拍環節,nano主要聚焦商品多角度復制性以適應不同社交平臺模板,而美圖產品則聚焦商品高匹配背景及模特,這個賽道國內海外目前確實涌現出了許多創業公司,但是大家在一塊全新的市場,目前的玩法、打法都不甚相同,還沒有到存量競爭的狀態。盡管如此,從敘事來看,美圖做為垂類應用,AI仍是其轉型的關鍵。從2022年開始,美圖率先在旗下產品Wink中上線視頻畫質修復技術,并逐步延伸出畫質優化、視頻分辨率提升、人像增強等一系列細分功能,形成完整的畫質修復能力矩陣。進入2023年,美圖進一步豐富了AI功能版圖,同時正式切入B端市場,為美業領域量身打造AI測膚解決方案,開啟ToB業務的探索。
隨后2024年,與阿里巴巴達成2.5億美元(約合人民幣18億元)戰略投資,雙方明確將在電商平臺、AI技術、云計算三大核心領域展開深度合作。其中在電商合作層面,雙方重點推進兩大方向:一是計劃聯合推出“AI試衣”功能——依托美圖成熟的AI試衣技術,結合阿里巴巴平臺豐富的商家服裝資源,從根本上優化線上購物的體驗痛點;二是美圖設計室將向淘天商家后臺開放部分核心能力,例如“AI商品圖”生成功能,幫助商家高效提升商品視覺呈現效果。
從以上可以看出,美圖的位置非常微妙,在c端,它通過AI技術進行自我迭代與升級,在b端,則通過自身技術賦能電商用戶,而無論哪一個業務,似乎都還是技術沉淀過后的串聯與精細化。從某種程度來說,美圖更多的優勢在于用戶心智、用戶經驗以及精細化,而這些是否能夠讓其保持現有的業務模型不受干擾,似乎需要時間驗證。而另一方面,按照之前的邏輯,美圖圍繞著美圖秀秀等垂類賽道的superapp進行著業務進行,從某種程度來說,似乎需要更大層面的交互方式的變化,才能占住更強的心智。同時,如國內頭部模型廠商開始進入到這一賽道之后,對其是否有更強的顛覆,值得一番思考。美圖是AI變革下的一個典型代表,每一次當巨頭模型公司發生技術溢出時,垂類AI應用就將經歷考驗,而這種不確定性,則會成為公司需要長期面對的命題。
03 場景賦能是終極勝負手

從硅谷的經驗來看,其實大模型公司與垂類AI公司的競爭,從來都是一個經久不衰的話題,比如,anthopic旗下的cloude code與編程垂類應用cursor,其追趕的速度都是超乎尋常。而面對這方面的競爭,似乎垂類AI的辦法,并沒有想象的多。 投資人朱嘯虎曾在采訪中坦言:AI Coding我一開始就不敢投,我覺得這肯定是大廠的天下。今年特別有意思,中國在補貼外賣,美國在補貼AI Coding,幾乎都是負毛利。你收幾十美金一個月的訂閱費,消耗的Token可能都是幾百美金,這都是拿投資人的錢在補貼程序員。而程序員這個群體是最沒有忠誠度的,哪個API好用、哪個便宜,他們就用哪個。
回歸到這次事件的主角,美圖在此前的計劃重心是在出海。在大摩的報告中,公司設定的首個里程碑是,在三年內(2025-2028年)將整體付費率提升至8-10%——這是在2024年4.7%基礎上的巨大飛躍;長期來看,其目標更指向休閑類產品付費率10%以上、生產力工具付費率20%以上的更高天花板。但要實現這一系列聚焦“用戶付費轉化”的目標,美圖首先要應對的,正是Nano Banana所代表的通用大模型沖擊:當“對話式創作”重構了用戶對圖像AI的交互期待,垂類應用若仍困守傳統功能,此前的付費率規劃便可能淪為空談。而美圖的應對邏輯——將Nano Banana技術整合進自身產品,同時聯合阿里深耕“AI試衣”這類場景化服務,恰恰為國產垂類AI指明了破局方向:這場看似“巨頭碾壓垂類”的博弈,實則已被撕開轉機的裂縫。
危機從不是大模型的技術溢出,而是垂類對自身價值的誤判——誤將“工具能力”等同于“用戶價值”;轉機也從不是與大模型比拼參數算力,而是成為大模型落地現實場景的“場景翻譯官”與“價值放大器”。畢竟大模型提供的只是“通用能力底座”,而垂類沉淀的用戶心智(如美圖之于“美”的認知)、場景know-how(如商拍中的背景匹配邏輯)、B端服務閉環(如對接電商的商家需求),才是把技術轉化為“用戶愿付費的服務”的關鍵,也是決定AI能否真正解決痛點的“最后一塊拼圖”。對國產垂類AI而言,真正的突破點從不是“造一個更好的香蕉”,而是跳出“與大模型對抗”的思維定式,像美圖錨定付費率目標那樣,聚焦“用大模型賦能場景”:當通用技術與垂類場景深度綁定,所謂的“危機”便會轉化為“差異化競爭”的轉機——畢竟AI的終極戰場從不是技術榜單,而是能否擊中用戶愿意買單的真實需求。也許,正如朱嘯虎所說,AI時代的演化速度可能是移動互聯網的三倍速,甚至更快,所以很多機會也會更快被證偽。當年移動互聯網的很多工具App還能有不錯的退出,但在三倍速的AI時代,退出可能會難很多。所以創業者要用十年、二十年的眼光來看,什么東西是更可持續的,要去離大廠不只是一條馬路,而是兩條馬路、三條馬路之外尋找機會。
資料來源:鋅刻度,《押注AI,美圖就能奪回失去的一切?》硅星人pro,《Nano Banana有點ChatGPT時刻的味兒了》智百道,《深度體驗谷歌Nano Banana后,我們發現了它的AB面》硬AI,《AI吞噬軟件又一案例?谷歌Nano Banana走紅,美圖股價重挫》美股IPO,《大摩:美圖的“增長戰略”,AI提升付費率,海外拉動用戶增長》硅星人pro,《對話朱嘯虎:搬離中國,假裝不是中國AI創業公司,是沒有用的》
原文標題 : 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
11月7日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業年度評選
-
11月20日立即報名>> 【免費下載】RISC-V芯片發展現狀與測試挑戰-白皮書
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
11月28日立即下載>> 【白皮書】精準洞察 無線掌控——283FC智能自檢萬用表
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業大會


分享













