Skip to main content
Z AI(原智谱 AI)提供了突破性的 GLM-4.5 系列,具有混合推理功能和智能体 AI 设计。这些模型于 2025 年 7 月发布,在统一推理、编码和智能体应用方面表现出色,同时在 MIT 许可证下保持开源可访问性。 网站: https://z.ai/model-api(国际)| https://open.bigmodel.cn/(中国)

获取 API 密钥

国际用户

  1. 注册/登录: 访问 https://z.ai/model-api。创建账户或登录。
  2. 导航到 API 密钥: 访问您的账户仪表板并找到 API 密钥部分。
  3. 创建密钥: 为您的应用程序生成新的 API 密钥。
  4. 复制密钥: 立即复制 API 密钥并安全保存。

中国大陆用户

  1. 注册/登录: 访问 https://open.bigmodel.cn/。创建账户或登录。
  2. 导航到 API 密钥: 访问您的账户仪表板并找到 API 密钥部分。
  3. 创建密钥: 为您的应用程序生成新的 API 密钥。
  4. 复制密钥: 立即复制 API 密钥并安全保存。

支持的模型

Z AI 根据您选择的地区提供不同的模型目录:

GLM-4.5 系列

  • GLM-4.5 - 旗舰模型,拥有 355B 总参数,32B 活跃参数
  • GLM-4.5-Air - 紧凑模型,拥有 106B 总参数,12B 活跃参数

GLM-4.5 混合推理模型

  • GLM-4.5(思考模式) - 具有逐步分析的高级推理
  • GLM-4.5-Air(思考模式) - 适用于主流硬件的高效推理
所有模型的特点:
  • 128,000 token 上下文窗口用于广泛的文档处理
  • 专家混合(MoE)架构提供最佳性能
  • 智能体原生设计集成推理、编码和工具使用
  • 开源可用性采用 MIT 许可证

在 Cline 中配置

  1. 打开 Cline 设置: 点击 Cline 面板中的设置图标(⚙️)。
  2. 选择提供商: 从”API Provider”下拉菜单中选择”Z AI”。
  3. 选择地区: 选择您的地区:
    • “International”用于全球访问
    • “China”用于中国大陆访问
  4. 输入 API 密钥: 将您的 Z AI API 密钥粘贴到”Z AI API Key”字段中。
  5. 选择模型: 从”Model”下拉菜单中选择您想要的模型。

Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了革命性功能,使其在传统语言模型中脱颖而出:

混合推理架构

GLM-4.5 在两种不同模式下运行:
  • 思考模式: 专为复杂推理任务和工具使用而设计,进行更深入的分析过程
  • 非思考模式: 为直接查询提供即时响应,优化效率
这种双模式架构代表了”智能体原生”设计理念,根据查询复杂性调整处理强度。

卓越性能

GLM-4.5 在涵盖智能体任务、推理和编码挑战的 12 个基准测试中获得了 63.2 的综合分数,在所有专有和开源模型中排名第三。GLM-4.5-Air 保持竞争性能,得分 59.8,同时提供卓越的效率。

专家混合卓越性

复杂的 MoE 架构在保持计算效率的同时优化性能:
  • GLM-4.5: 355B 总参数,32B 活跃参数
  • GLM-4.5-Air: 106B 总参数,12B 活跃参数

扩展上下文能力

128,000 token 上下文窗口使能全面理解冗长文档和代码库,实际测试确认有效处理近 2,000 行代码库,同时保持卓越性能。

开源领导力

在 MIT 许可证下发布,GLM-4.5 为研究人员和开发人员提供了无专有限制的最先进功能访问,包括基础模型、混合推理版本和优化的 FP8 变体。

区域优化

API 端点

  • 国际: 使用 https://api.z.ai/api/paas/v4
  • 中国: 使用 https://open.bigmodel.cn/api/paas/v4

模型可用性

地区设置决定 API 端点和可用模型,自动过滤以确保与您选择的地区兼容。

特殊功能

智能体功能

GLM-4.5 的统一架构使其特别适合需要集成推理、编码和工具利用功能的复杂智能体应用。

综合基准测试

性能评估包括:
  • 3 个智能体任务基准
  • 7 个推理基准
  • 2 个编码基准
这种综合评估展示了在各种 AI 应用中的多功能性。

开发者集成

模型支持通过多个框架的集成:
  • transformers
  • vLLM
  • SGLang
配备专用模型代码、工具解析器和推理解析器实现。

性能比较

与 Claude 4 Sonnet 对比

GLM-4.5 在智能体编码和推理任务中表现出竞争性能,尽管 Claude Sonnet 4 在编码成功率和自主多功能应用开发方面保持优势。

与 GPT-4.5 对比

GLM-4.5 在推理和智能体基准测试中排名具有竞争力,GPT-4.5 通常在 MMLU 和 AIME 等专业基准的原始任务准确性方面领先。

提示和注意事项

  • 地区选择: 选择适当的地区以获得最佳性能并符合当地法规。
  • 模型选择: GLM-4.5 用于最大性能,GLM-4.5-Air 用于效率和主流硬件兼容性。
  • 上下文优势: 大的 128K 上下文窗口能够处理大量代码库和文档。
  • 开源优势: MIT 许可证允许商业使用和二次开发。
  • 智能体应用: 特别适合需要推理、编码和工具使用集成的应用。
  • 混合推理: 对复杂问题使用思考模式,对简单查询使用非思考模式。
  • API 兼容性: OpenAI 兼容 API 提供流式响应和使用报告。
  • 框架支持: 为不同部署场景提供多种集成选项。