成人免费观看cn_亚洲五码在线观看视频_女人另类性混交zo_国产成人综合一区_黄色a级片免费看_女人高潮一级片_亚洲性生活网站_久久国产成人精品国产成人亚洲_日本三级福利片_欧美成人三级在线视频_成人午夜精品久久久久久久蜜臀_奇米影音第四色

首頁|必讀|視頻|專訪|運營|制造|監管|大數據|物聯網|量子|低空經濟|智能汽車|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯網|會展
首頁 >> 飛象原創 >> 正文

中國聯通業界首創大模型能力邊界量化基準

2024年12月26日 09:42  CCTIME飛象網  

飛象網訊 (一飛/文)12月21日,OpenAI 發布了具有超強推理能力的大模型o3,引起了業內對大模型推理能力的廣泛討論和深入研究。o3的發布也帶來了三個引人深思的問題:市面上主流大模型的推理能力究竟如何?在真實應用場景中,是否總是需要具有極強推理能力的模型?在實際應用中,如何根據應用需求選擇合適參數量的大模型而避免“用大炮打蚊子”,以獲得最高性價。

中國聯通借鑒動物智能演化規律,結合大模型實際落地應用實踐,在業界首次提出大模型能力邊界量化基準,定量分析主流語言大模型能力邊界,詳細刻畫模型參數量、模型能力與應用場景之間的關系,為語言大模型的應用選型提供理論和經驗指導,將有助于降低語言大模型應用門檻,促進大模型普惠化。相關研究成果以<What is the Best Model? Application-Driven Evaluation for Large Language Models>為題發表在自然語言處理權威會議NLPCC2024上,相應的評估基準已向業界開源,獲得業界廣泛認可。

論文鏈接:https://arxiv.org/abs/2406.10307

評估基準:https://github.com/UnicomAI/UnicomBenchmark/tree/main/A-Eval

借鑒動物智能演化規律

一般來說,動物的腦神經元越多,腦容量越大,智力水平就越高。另外,不同智力水平的動物擅長的任務種類和難度也各不相同,即使小如烏鴉的大腦,也可以完成“烏鴉喝水”這樣的任務。

動物智能演化規律

相似地,在語言大模型中,擴展法則指出模型參數量越大,模型能力越強,相應的算法消耗和應用成本也越高。然而這樣的定性分析是不夠的,大模型能力邊界定量刻畫的缺乏,導致在實際應用中經常出現“高射炮打蚊子”的情況。因此對大模型能力邊界的定量刻畫是必要且緊迫的。

構建大模型能力評估基準

中國聯通研究團隊從實際應用場景維度出發,對語言大模型主要能力進行歸納、梳理和總結,建立了應用驅動的大語言模型能力評估基準。該評估基準包括文本生成、理解、關鍵信息抽取、邏輯推理、任務規劃等5大類能力,又細分為27類子能力。

語言大模型主要能力

針對27類子能力,中國聯通研究團隊構建了相應的評測任務和由易、中、難三個難度等級的678個問答對構成的評估數據集。為避免數據泄露問題,所有數據均由專家團隊人工編寫。

應用驅動的語言大模型能力評估數據集

量化主流大模型能力邊界

團隊設計了專家評估和基于大模型的自動化評估方法,對同一家族8個不同規模的模型(0.5B, 1.8B, 4B, 7B, 14B, 32B, 72B, 110B)進行測試和評估,避免模型架構、訓練數據等非模型參數量因素對評估結果產生干擾,得到了不同參數量模型在各種任務上的可靠的評估結果。從下圖的評測結果可以看出,不同參數量模型能力不同,模型參數量越大,模型能力越強,對于復雜任務需要使用大參數量模型。

不同參數量模型在各類任務中的準確率

依據能力要求確定模型參數量

根據語言大模型能力邊界測評結果,團隊提出了一種簡單可行的模型選型方法,指導模型落地應用時的參數選型。總的來說,針對不同任務,任務難度越高要求參數越大;針對同一任務,參數越大模型性能越好。具體地,可依據某項任務對模型性能的底線要求來選擇相應參數的規模,以圖中任務為例:在用戶需求準確率為80%的前提下,對于拼寫錯誤校正任務,14B以上模型可獲90分以上;對于邏輯錯誤檢測任務,110B以上模型可達90分以上;如果同時應用多個任務,先為每個任務選擇合適的模型,再選擇其中參數量最大的模型即可。選型過程中不需要用戶對大模型有深入了解,這將降低用戶選擇使用大模型的門檻,促進大模型普惠化。

模型參數量選擇方法示例

探索設計模型選型使用“說明書”

在元景大模型應用落地中,中國聯通基于上述評估基準,打造評估工具,量化1B、7B、13B、34B和70B等元景基礎大模型的能力邊界,并分別將其用于違規短信分類、投訴工單分類、客服助手、漁業知識問答、元景App問答等場景,提煉“模型參數量-模型能力-應用場景”關聯關系(如下圖),作為大模型使用“說明書”,集成到元景MaaS平臺,為開發者提供選模型指引。

模型參數量-能力-場景的對應關系圖

接下來,中國聯通將繼續推進模型邊界量化機理研究,擴展和深化“模型參數量-模型能力-應用場景”關聯關系,協同業界持續擴展模型能力邊界,完善和增強大模型的“記憶-推理-規劃-創造-成長-價值觀”能力鏈條,打造自主可控、模態豐富、性能先進、高性價比、安全可信的基礎大模型,支撐千行百業場景應用,加速大模型普惠化。

編 輯:魏德齡
飛象網版權及免責聲明:
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國移動副總經理張冬:5G揚帆開新篇,數智遠航啟新程
精彩專題
2024通信業年終盤點
2024數字科技生態大會
2024年度中國光電纜優質供應商評選活動
2024全球6G發展大會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像
成人免费观看cn_亚洲五码在线观看视频_女人另类性混交zo_国产成人综合一区_黄色a级片免费看_女人高潮一级片_亚洲性生活网站_久久国产成人精品国产成人亚洲_日本三级福利片_欧美成人三级在线视频_成人午夜精品久久久久久久蜜臀_奇米影音第四色
亚洲天堂免费电影| 狠狠操综合网| 天堂网在线观看国产精品| 综合亚洲视频| 麻豆精品蜜桃视频网站| 亚洲综合日本| 欧美日韩一区二区三区视频播放| 老司机精品久久| 99精品美女| 国产精品精品| 麻豆精品在线观看| 国产精品极品在线观看| 免费人成在线不卡| 午夜免费一区| 国产精品字幕| 美女一区网站| 精品视频高潮| 六月丁香综合在线视频| 视频一区日韩精品| 欧美日韩国产一区二区三区不卡| 日韩a一区二区| 免费视频一区二区三区在线观看 | 91精品蜜臀一区二区三区在线 | 国产欧美日韩免费观看| 9色国产精品| 999精品在线| 中文字幕系列一区| 久久高清精品| 99久久亚洲精品| 欧美日韩免费看片| 97精品一区| 日韩大片在线观看| 91精品xxx在线观看| 欧美成a人国产精品高清乱码在线观看片在线观看久 | 99国产精品| 亚洲午夜精品久久久久久app| 日本高清不卡一区二区三区视频| 日韩国产欧美| 国产国产精品| 黄色日韩在线| 久久成人亚洲| 青青在线精品| 国产视频一区二区在线播放| 欧美xxxx性| 精品日韩视频| 亚洲在线一区| 国产日韩亚洲| 日韩精品91| 免费成人网www| 蜜桃久久久久久| 日韩区欧美区| 你懂的国产精品| 国产精品久久久久久久久久10秀| 亚洲不卡系列| 亚洲欧美日本国产专区一区| 欧美一区不卡| 中文字幕在线视频网站| 午夜久久美女| 久久99精品久久久久久园产越南| 日韩在线观看一区| 亚洲啊v在线免费视频| 国内精品美女在线观看| 久久久久亚洲| 亚洲另类av| 亚洲综合电影| 亚洲字幕久久| а√天堂中文在线资源8| 亚洲神马久久| 精品国产一区二区三区2021| 亚洲国产影院| 国产精品99久久久久久董美香| 精品国产不卡一区二区| 久久久成人网| 国产精品美女在线观看直播| 蜜臀久久精品| 国产私拍福利精品视频二区| 国产一区视频在线观看免费| 国产欧美一区二区三区米奇| 久久九九电影| 久久免费精品| 蜜桃视频在线观看一区| 韩国三级一区| 久久久久久久久成人| 狠狠久久婷婷| 日韩88av| 国产精品极品在线观看| 国产精品美女久久久| av中文字幕在线观看第一页 | 日本一区二区高清不卡| 日韩在线a电影| 日韩在线视频精品| 国产精品一区二区免费福利视频| 久久视频国产| 电影91久久久| 日韩av资源网| 奶水喷射视频一区| 久久国产欧美| av资源新版天堂在线| 久久97视频| 国产亚洲精品精品国产亚洲综合| 丝袜亚洲另类欧美| 亚洲成人一区| 国产综合激情| 久久男女视频| 成人免费一区| 欧美激情 亚洲a∨综合| 青青青国产精品| 亚洲乱码一区| 日韩一区二区三区免费视频| 伊人精品视频| 亚洲大全视频| 婷婷中文字幕一区| 在线观看免费一区二区| 欧美高清一区| 99在线观看免费视频精品观看| 久久夜夜操妹子| 电影亚洲精品噜噜在线观看| 日韩成人免费| av高清不卡| 中文字幕成在线观看| 福利在线免费视频| 久久免费国产| 欧美日韩第一| 丝瓜av网站精品一区二区 | 蜜桃视频在线观看一区二区| 久久最新视频| 日本不卡视频在线| 欧美精品国产| 久久亚洲精品中文字幕| 中文字幕在线官网| 999精品色在线播放| 久久国产日韩| 亚洲欧美久久| 国产日韩视频在线| 国产黄色一区| 国产农村妇女精品一二区| 在线手机中文字幕| 香蕉视频亚洲一级| 99精品视频精品精品视频| 婷婷亚洲五月色综合| 老鸭窝亚洲一区二区三区| 日韩三级一区| 久久精品亚洲| 蜜桃视频欧美| 日韩精品视频在线看| 国产一区二区久久久久| 精品亚洲精品| 不卡在线一区| 日本色综合中文字幕| 美女在线视频一区| 99视频精品全部免费在线视频| 久久亚洲不卡| 国产精品二区不卡| 99在线精品免费视频九九视| 91精品在线免费视频| 91综合网人人| 在线免费观看亚洲| 黄色在线网站噜噜噜| aⅴ色国产欧美| 国产欧美日韩精品高清二区综合区 | 欧美日韩一区二区三区四区在线观看| 国产精品99久久免费观看| 国产99精品一区| 国产精品一区二区三区www| 国产中文一区| 国产精品久久久久久久久久齐齐 | 国产精品毛片aⅴ一区二区三区| 天堂av在线| 日韩精品免费视频一区二区三区| 97人人精品| 日韩精品亚洲专区在线观看| av高清一区| 国产精品视频3p| 蜜桃免费网站一区二区三区| 神马午夜在线视频| 国产精品国产三级在线观看| 日韩午夜高潮| 中文字幕在线免费观看视频| 午夜日韩影院| 亚洲激情社区| 国产精品久久久久久久久妇女| 日韩一区精品| 久久成人亚洲| 欧美+亚洲+精品+三区| jizzjizz中国精品麻豆| 国产精品蜜月aⅴ在线| 免费在线看一区| 偷拍欧美精品| 久久久国产精品一区二区中文| 久久97视频| 国产极品久久久久久久久波多结野 | 日韩精品视频在线看| 欧美不卡高清| 国产成人在线中文字幕| 国产欧美在线观看免费| 日韩一区二区三免费高清在线观看 | 国产精品红桃| 日本aⅴ免费视频一区二区三区| 欧洲激情综合| 亚洲伦乱视频|