聚焦科学传播 弘扬科学精神
APP下载
扫码下载APP
融媒矩阵
  • 人民号
  • 科普号
  • 北京号
  • 微博号
  • 头条号
  • 腾讯号
  • 百度号
  • 央视频号
  • 抖音号
  • 微信号
QR Code
当前位置: 首页 科创关注 正文
“北京造”大模型GLM-4.5发布!性能领跑国产并主攻AI智能体
2025-07-30 来源:北京科技报 阅读量:1.2万

7月28日,北京智谱华章科技股份有限公司(以下简称“智谱”)发布其新一代旗舰级大模型GLM-4.5。该模型不仅在多项综合能力评测中居于国内首位,更将战略重点放在了驱动“AI智能体(Agent)”。

这款新模型的发布,代表了AI发展方向的一次重要转变。它不再满足于扮演一个被动回答问题的“聊天机器人”,而是要成为能够理解复杂目标、自主规划并执行多步骤任务的“AI员工”。例如,开发者仅用一句简单的指令,就可让GLM-4.5独立开发出具备搜索功能的“谷歌”网站、可发弹幕的“B站”Demo,甚至是一个完整的“Flappy Bird”小游戏。

据了解,GLM-4.5之所以能实现如此性能,其核心在于采用了“混合专家(MoE)”架构。该架构可被理解为一个庞大的“智囊团”,在处理任务时,系统会智能地激活最相关的“专家”小组进行应对,而非调动全体资源。这使得模型在拥有3550亿总参数量的庞大规模以确保能力强大的同时,每次任务仅需激活320亿参数,从而大幅提升了运算效率并降低了成本。官方资料显示,GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现却更为出色。

大型语言模型性能评估表,包含智能体、推理与编码基准测试数据(图源:智谱)

在性能评估中,GLM-4.5的表现展示了其架构优势。在涵盖研究生水平推理和复杂软件工程解题等12项全球公认的硬核测试中,其综合得分位列全球第三,在所有国产模型和开源模型中均排名第一。

对于开发者与企业而言,价格因素同样是关注焦点。其API(应用程序接口)调用价格低至输入0.8元/百万Tokens(约50万个汉字),输出2元/百万Tokens,远低于市场主流价格。同时,其高速版的生成速度实测超过100 tokens/秒,是许多主流模型速度的2-3倍,能有效保障用户交互的流畅性。

目前,这款集高性能、低成本和开源特性于一体的模型已在智谱开放平台上线。它的出现,有望大幅降低开发者和企业使用顶尖AI技术的门槛,催生出更多富有创意的AI智能体应用。

来源:北京科技报

撰文:记者 段大卫

典赞时刻·2024首都科普年度榜单发布
2024年我和妈妈学科学
医路·新青年:述说新时代首都青年医者故事
要闻关注
北京策论丨国际科技创新中心建设的北京探索
谱写科技强国建设的“北京篇章”——北京国际科技创新中心建设纪实
机器人领域两大盛会8月举办,北京人形机器人领跑全国
北京发布加快人工智能赋能科学研究行动计划
推荐阅读
中原消费金融参与制定《IEEE 3410-2025金融风控大模型国际标准》
2025-07-30 网络
业界首款!神州鲲泰发布基于鲲鹏技术路线的大模型训推系列产品,持续强化智算产品体系
2025-07-29 网络
做深做透垂直场景,萤石网络迭代蓝海大模型2.0
2025-06-27 网络
微信、百度相继接入DeepSeek,多家大模型厂商宣布免费!AI应用迎来普惠化?
2025-02-17 央视新闻、中国证券报等
QR Code
扫码分享当前页面