7月28日,北京智谱华章科技股份有限公司(以下简称“智谱”)发布其新一代旗舰级大模型GLM-4.5。该模型不仅在多项综合能力评测中居于国内首位,更将战略重点放在了驱动“AI智能体(Agent)”。
这款新模型的发布,代表了AI发展方向的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“AI员工”。例如,开发者仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可发弹幕的“B站”Demo,甚至是一个完整的“Flappy Bird”小游戏。
据了解,GLM-4.5之所以能实现如此性能,其核心在于采用了“混合专家(MoE)”架构。该架构可被理解为一个庞大的“智囊团”,在处理任务时,系统会智能地激活最相关的“专家”小组进行应对,而非调动全体资源。这使得模型在拥有3550亿总参数量的庞大规模以确保能力强大的同时,每次任务仅需激活320亿参数,从而大幅提升了运算效率并降低了成本。官方资料显示,GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现却更为出色。
大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)
在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。
对于开发者与企业而言,价格因素同样是关注焦点。其API(应用程序接口)调用价格低至输入0.8元/百万Tokens(约50万个汉字),输出2元/百万Tokens,远低于市场主流价格。同时,其高速版的生成速度实测超过100 tokens/秒,是许多主流模型速度的2-3倍,能有效保障用户交互的流畅性。
目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。它的出现,有望大幅降低开发者和企业使用顶尖AI技术的门槛,催生出更多富有创意的AI智能体应用。
来源:北京科技报
撰文:记者 段大卫