OpenAI 最強 AI 小模型:GPT-5.4 mini 與 nano 登場,低延遲、性能逼近滿血版
3 月 18 日消息,OpenAI 公司昨日(3 月 17 日)發(fā)布公告,宣布推出迄今最強大的小型模型 GPT-5.4 mini 與 GPT-5.4 nano,專為高頻且對延遲敏感的任務設計。
IT之家援引博文介紹,官方強調,在代碼助手、系統截圖解析以及實時圖像推理等對延遲要求極高的場景中,響應迅速且能可靠調用工具的小型模型往往比大型模型更具優(yōu)勢。
這兩款模型不僅繼承了 GPT-5.4 的諸多優(yōu)勢,還專門針對高頻工作負載優(yōu)化,目的通過更快的響應速度和更高的效率,來提升產品體驗。
GPT-5.4 mini 在編寫代碼、邏輯推理、多模態(tài)理解以及工具調用方面的表現遠超 GPT-5 mini,同時運行速度提升了 2 倍以上。

此外,它在 SWE-Bench Pro 和 OSWorld-Verified 等多項基準測試中,成績已經逼近體積更大的 GPT-5.4 模型。


憑借極低的延遲,GPT-5.4 mini 特別適合需要快速迭代的代碼工作流,能夠高效處理精準編輯、代碼庫導航及前端生成等任務。在多模態(tài)領域,它也能迅速解析密集的電腦用戶界面截圖,出色完成各類計算機操作任務。
GPT-5.4 nano 則是目前體積最小、價格最親民的版本。作為 GPT-5 nano 的重大升級版,它專為將速度和成本視為首要考量的任務而生。開發(fā)者可以將其廣泛應用于文本分類、數據提取、內容排序,以及處理簡單輔助任務的代碼子代理(Subagents)中。


兩款模型目前已正式開放使用。GPT-5.4 mini 已全面接入 API、Codex 及 ChatGPT。
其 API 版本支持 400k 上下文窗口,輸入與輸出成本分別為每百萬 Token 0.75 美元和 4.50 美元;在 Codex 中調用僅消耗 GPT-5.4 額度的 30%;在 ChatGPT 中,Free 和 Go 用戶可通過“思考(Thinking)”功能體驗。
相比之下,GPT-5.4 nano 目前僅通過 API 提供,其輸入與輸出成本極低,分別為每百萬 Token 0.20 美元和 1.25 美元。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創(chuàng)”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發(fā)之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
2026十大科技趨勢
2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!
[詳細]
黃仁勛:需要更多Token與工程師,這是AI革命的開工典禮
3月17日,在美國加州圣何塞開幕的GTC 2026大會上,英偉達創(chuàng)始人兼CEO黃仁勛開始了備受矚目的主題演講。來看他演講的觀眾需要排隊,現場人山人海。這場演講不僅有黃仁勛對過去二十年技術積累..[詳細]
我國算力規(guī)模與質量協同躍升,行業(yè)賦能效益加速釋放
當前,以大模型為代表的人工智能應用驅動全球計算技術進入新一輪創(chuàng)新爆發(fā)期,先進計算硬件、軟件、算法之間深度融合、協同演進,量子計算、類腦計算等前沿計算架構加快突破,算力需求呈現指..[詳細]
如何推進算電協同,筑牢綠色高效硬底座?
隨著AI浪潮的快速發(fā)展推進,全社會對算力的需求持續(xù)擴大,今年的《政府工作報告》也重點提出,要深化拓展“人工智能+”,實施超大規(guī)模智算集群、算電協同等新基建工程。在AI算力需求井噴的..[詳細]
平時不戴眼鏡的高通卡圖贊,談可穿戴設備殺手級AI應用
“我本人不戴眼鏡,只在戶外戴太陽鏡。所以對我來說,可能掛墜或項鏈這類形態(tài)會更舒服,我可以戴在胸前,隨時都能完成視覺交互。”卡圖贊隨后又以個人視角表..[詳細]
聚焦兩會|以AI賦能新質生產力,人工智能的責任是為人民服務
在“十五五”規(guī)劃開局的2026年,人工智能作為科技創(chuàng)新與新質生產力的關鍵支撐,被全民熱議、全社會所關注,并在兩會上被提升至戰(zhàn)略高度。委員代表們集體圍繞AI治理、產業(yè)創(chuàng)新、民生應用、人..[詳細]
MWC2026 爆火關鍵詞:U6GHz 到底是什么?一文看懂
近日巴塞羅那MWC2026大會火熱召開,全球最新的ICT科技集體亮相,令人目不暇接。各大廠商在介紹新技術、新產品時,不約而同地強調了對AI的支持能力和價值。[詳細]
聚焦兩會|具身智能落地場景全面擴容,產業(yè)堵點待打通
2026年開年,具身智能成為科技與產業(yè)領域的高頻熱詞。從央視春晚舞臺上人機共武,到 MWC2026 巴塞羅那展上中國機器人企業(yè)集體亮相的全球秀場,舞臺與展會的高光背后,是國產具身智能從技術演..[詳細]
我國系統推進自動駕駛政策法規(guī)體系建設,加速產業(yè)發(fā)展
近日,中國信息通信研究院(簡稱“中國信通院”)政策與經濟研究所、人工智能與經濟社會研究中心聯合發(fā)布《自動駕駛戰(zhàn)略與政策觀察(2025年)——推動自動駕駛全場景落地,搶占科技發(fā)展制高..[詳細]
專題|2026世界移動通信大會
2026年3月2日至5日,世界移動通信大會(MWC)在西班牙巴塞羅那Fira Gran Via會展中心拉開帷幕。本屆展會以“The IQ Era”(眾智啟新)為主題,向世界展示AI與通信深度融合的無限可能。..[詳細]













