證券日報官方網站

網站首頁
|

登錄/注冊

|
證券日報電子報

證券日報微信

證券日報微博

首頁

您所在的位置：網站首頁 > TMT頻道 > TMT行業 > 正文

智譜發布GLM-4.5：面向推理、代碼與智能體的開源SOTA模型

2025-07-29 09:41 來源：證券日報網

本報訊（記者梁傲男）7月28日，北京智譜華章科技股份有限公司（以下簡稱“智譜”）發布新一代旗艦模型GLM-4.5，專為智能體應用打造的基礎模型。Hugging Face與ModelScope平臺同步開源，模型權重遵循MIT License。

據悉，GLM-4.5在包含推理、代碼、智能體的綜合能力達到開源SOTA，在真實代碼智能體的人工對比評測中，實測國內最佳。

智譜方面有關人士表示，衡量AGI的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5是智譜對此理念的首次完整呈現，并有幸取得技術突破。GLM-4.5首次在單個模型中實現將推理、編碼和智能體能力原生融合，以滿足智能體應用的復雜需求。

智譜/供圖

記者了解到，為綜合衡量模型的通用能力，智譜選擇了最具有代表性的12個評測基準，綜合平均分，GLM-4.5取得了全球模型第三、國產模型第一，開源模型第一。

在參數效率方面，GLM-4.5參數量為DeepSeek-R1的1/2、Kimi-K2的1/3，但在多項標準基準測試中表現得更為出色，這得益于GLM模型的更高參數效率。在衡量模型代碼能力的SWE-benchVerified榜單上，GLM-4.5系列位于性能/參數比帕累托前沿，表明在相同規模GLM-4.5系列實現了最佳性能。

在性能優化之外，GLM-4.5系列也在成本和效率上實現突破，由此帶來遠低于主流模型定價：API調用價格低至輸入0.8元/百萬tokens，輸出2元/百萬tokens。同時，高速版本實測生成速度最高可至100 tokens/秒，支持低延遲、高并發的實際部署需求，兼顧成本效益與交互體驗。

真實場景表現比榜單更重要。為評測GLM-4.5在真實場景Agent Coding中的效果，智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進行對比測試。測試采用52個編程開發任務，涵蓋六大開發領域，在獨立容器環境中進行多輪交互測試。實測結果顯示（如下圖），GLM-4.5相對其他開源模型展現出競爭優勢，特別在工具調用可靠性和任務完成度方面表現突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間，在大部分場景中可以實現平替的效果。

（編輯張明富）

-證券日報網

熱點新聞

國產單機游戲迎快速發展期：3A大作與低成本游戲齊頭并進

暑期檔迎來“黑馬”影片影視板塊再獲關注

離境退稅政策持續優化“中國游”熱度持續提升

純固收類銀行理財產品收益率回調業內認為債市調整空間有限

24小時排行一周排行

1
2
3
4
5
6
7
8
9
10

深度策劃

聚焦2025陸家嘴論壇金融開放合作新動向

2025陸家嘴論壇6月18日正式啟幕……[詳情]

市場快訊

19:29	愛司凱：公司的512噴頭穩定批量生...
19:29	愛司凱：公司將加快MEMS工藝噴頭的...
19:29	愛司凱：公司自主研發的T2515型號3...
19:29	愛司凱：截至2024年末，公司已完成...
19:29	奧雅股份：截至2025年7月18日公司...
19:29	北斗星通：當前整體的海外收入占比...
19:29	廣聯航空：公司研發的無人機具備扎...
19:29	杰美特：公司擬收購思騰合力控制權...
19:29	杰美特：公司暫無在香港上市計劃
19:29	邁拓股份：公司暫未參與雅魯藏布江...
19:29	賽維時代：截至2025年7月18日公司...
19:29	皖能電力：公司目前現貨交易結算電...

国产精品传媒99一区二区_国产高潮抽搐喷水高清_精品国产一区二区三区AV蜜_国产麻豆剧传媒精品国产AV

版權所有《證券日報》社有限責任公司

互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證京B2-20250455

京公網安備 11010602201377號京ICP備19002521號

證券日報網所載文章、數據僅供參考，使用前務請仔細閱讀法律申明，風險自負。

證券日報社電話：010-83251700網站電話：010-83251800

網站傳真：010-83251801電子郵件：xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃，加關注

官方微博

掃一掃，加關注