AI的瘋狂三月:本地能力再提升,云上掀起動漫風
飛象原創(魏德齡/文)剛剛過去的三月,人工智能的功能升級可謂一個爆款接著又一個爆款,無論是面向本地部署的Gemma,還是ChatGPT在社交媒體平臺上掀起的日式動漫風。假如說以前的人工智能領域還是每年春節一爆款的話,這次則是直接開啟了“瘋狂三月”。
本地能力再提升
27B的參數量能力卻可以超過671B的模型,只需一張H100顯卡,就能在本地實現媲美云端的高效推理。谷歌開源的最新多模態大模型Gemma-3在這個3月成為很多用戶的最新本地AI部署嘗試。
Gemma 3提供四種不同參數規模的選項,分別為1B、4B、12B和27B參數。除了1B外,其他三種均支持多模態,輕松構建能夠分析圖像、文本和短視頻的應用,開啟交互式智能應用的新可能。這一小參數量的特性能夠讓包括手機、筆記本電腦和工作站等設備在本地運行高性能的模型。
從上圖不難發現,Gemma 3在同等規模下展現了業界領先的性能,在LMArena榜單評估中超越了Llama3-405B、DeepSeek-V3和o3-mini。這意味著可以在單個GPU或TPU上部署媲美甚至超越云端AI的體驗。
此外,Gemma 3具有強大的語言處理能力。其原生支持35種語言,并且預訓練支持140多種語言,幫助開發者構建全球化的AI應用。Gemma 3的128k-token超長上下文窗口,使得AI模型能夠理解和處理更加復雜和海量的信息。這一能力的提升,使得本地AI能夠在處理長文本、大規模數據分析等任務時,展現出更強的處理能力,為需要高精度和高效能的行業應用提供了有力支持。
Gemma 3還支持函數調用和結構化輸出,幫助開發者構建智能工作流,進一步簡化AI應用的開發過程。這使得開發者能夠更容易地構建出符合特定需求的AI應用,快速實現業務自動化和智能化,提高工作效率。
阿里巴巴最近發布并開源的Qwen2.5-Omni大模型同樣帶來了本地AI能力的又一次提升,作為首個端到端的全模態大模型,Qwen2.5-Omni能夠同時處理文本、圖像、音頻和視頻等多種輸入,并實時生成文本與自然語音合成輸出,顯著提升了AI在多維度、多感官的認知與交互能力。
輕量級的設計同樣是Qwen2.5-Omni的一大亮點,能夠以僅7B參數的小尺寸展現了同樣強大的性能,即便在手機上,也能輕松部署和應用Qwen2.5-Omni模型。當前,Qwen2.5-Omni已在魔搭社區和Hugging Face同步開源。
根據測試成績顯示,Qwen2.5-Omni全維度超Google的Gemini-1.5-Pro等同類模型,刷新業界紀錄。這一表現意味著,Qwen2.5-Omni不僅具備強大的處理能力,還能更智能、更自然地應對復雜任務。在面對多感官輸入時,Qwen2.5-Omni能夠模擬人類的認知方式,通過音視頻識別情緒,做出更加精準、富有情感的反饋與決策。
端側AI繼續著著小規模高性能的目標前進,而云端AI更是在3月成為網紅級別的存在,在全網掀起了一波又一波的P圖秀。
云上掀起動漫風
其實在ChatGPT 4o掀起線上動漫風之前,Google在擴大了Gemini 2.0 Flash模型圖像生成功能的訪問權限后,就已經讓人們感受了AI修圖的強大實力。其中一項重大功能便是能夠去除圖片中的水印,對于水印過多的圖片,甚至還能嘗試填補因水印刪除而產生的空白區域。
當然,這一強大的功能也引來了業界對于版權問題的擔憂,其中一大問題就在于付費照片的銷售。一些線上拍照服務,會以水印的形式呈現給用戶照片圖片,通過后續付費來解鎖無水印的原圖。然而隨著這一高效且強大的去水印功能出現,無疑會讓很多公司產生疑慮。
同樣是在3月,ChatGPT 4o也帶來了一波圖像能力的升級更新,推出基于GPT-4o模型的原生圖像生成功能,不再調用獨立的DALL-E文生圖模型。利用GPT-4o的多模態能力,ChatGPT在圖像生成時能更加精確地遵循指示、更精確地渲染圖像上的文字,同時支持多輪迭代優化圖像時保持角色形象一致。
隨之被用戶發掘出最吸引人的功能便在于可以將用戶上傳的圖片,重新繪制成其他繪畫風格的作品,其中尤以漫畫風格最為討喜,于是,轉換生成的吉卜力風格作品瞬間引爆互聯網,用戶們不僅將自己的日常生活照片進行轉換,還將重要歷史時刻、網絡梗圖同樣進行了轉換,ChatGPT 4o均能做到傳神般的寫照。
此外,轉換出來的動漫圖片,還能配合其他AI視頻生成工具,重制一些電影內容,制作出新的動畫短片。例如,國外AI影片創作者PJAce先通過ChatGPT 4o生成了102張魔戒電影預告片的轉換圖片,隨后又利用可靈進行動畫處理器,最終完整重現了一部吉卜力風格的《魔戒首部曲:魔戒現身》預告片。
巨大的使用熱情也讓ChatGPT的算力開始不堪重負,OpenAI CEO Sam Altman在28日時表示:“該功能開始暫時受限,我們的GPU正在‘融化’,Open AI正在嘗試優化效率。”隨即,很多用戶也發現該功能已經無法長時間使用,甚至可能會直接拒絕生成以“吉卜力”為關鍵詞指令的請求。
人工智能上演的瘋狂三月,顯然大有一石激起千層浪的勢頭,端側模型的能力升級,可能又將進一步推動一些企業的本地部署進程。云端圖像能力的提升,仿佛又打開了AI應用的新世界的大門,不過版權問題也隨之而來,修圖應用公司也可能開始心里發慌,但對于眾多使用者來說,無疑也度過了一個興奮嘗試的滿足三月。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
5G-A賦能機器人火炬接力:中國移動以技術革新點亮全運科技盛宴
2025年11月,第十五屆全國運動會將在粵港澳三地盛大啟幕。這場賽事不僅是體育健兒的競技場,更是前沿科技落地應用的“試驗田”。其中,11月2日的機器人火炬接力作為本次全運會的核心創新亮點..[詳細]
輕薄機型出師未捷身先死,長使業績淚滿襟
當iPhone Air宣布上市當天,隨著各路評測內容解禁,一個顯眼的標題也隨之出現,那就是“注定停產”。輕薄機型的出現一方面讓人們看到廠商正在挖掘全新市場空間,另一方面也勾起了小尺寸機型..[詳細]
智能未來:宇宙為你閃爍
未來十年,你家的電表可能再也不用換電池,自動駕駛汽車能"看到"幾公里外的路況,甚至海洋深處的傳感器都能實時傳回數據。這些不是科幻,而是剛剛在無錫物博會上發布的《2025全球..[詳細]
智能IP廣域網成為筑牢智算產業發展根基的關鍵一環
隨著國家加速推動智算產業高質量發展,網絡支撐能力已成為產業進階的核心抓手,而作為關鍵基礎設施的智能IP廣域網,正憑借其在算力調度、數據傳輸中的核心作用,成為筑牢智算產業發展根基的..[詳細]
大中華區市場失守 蘋果寄望AI驅動未來增長
蘋果公司公布的2025 財年第四季度財報呈現“冰火兩重天”態勢:全球營收1024.66億美元同比增長 8%,凈利潤274.66億美元同比激增86.4%,毛利率攀升至 47.18%。但作為第三大市場的大中華區卻成..[詳細]













