Z AI (智谱 AI)

Z AI（原智谱 AI）提供了突破性的 GLM-4.5 系列，具有混合推理功能和智能体 AI 设计。这些模型于 2025 年 7 月发布，在统一推理、编码和智能体应用方面表现出色，同时在 MIT 许可证下保持开源可访问性。 网站： https://z.ai/model-api（国际）| https://open.bigmodel.cn/（中国）

获取 API 密钥

国际用户

注册/登录： 访问 https://z.ai/model-api。创建账户或登录。
导航到 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全保存。

中国大陆用户

注册/登录： 访问 https://open.bigmodel.cn/。创建账户或登录。
导航到 API 密钥： 访问您的账户仪表板并找到 API 密钥部分。
创建密钥： 为您的应用程序生成新的 API 密钥。
复制密钥： 立即复制 API 密钥并安全保存。

支持的模型

Z AI 根据您选择的地区提供不同的模型目录：

GLM-4.5 系列

GLM-4.5 - 旗舰模型，拥有 355B 总参数，32B 活跃参数
GLM-4.5-Air - 紧凑模型，拥有 106B 总参数，12B 活跃参数

GLM-4.5 混合推理模型

GLM-4.5（思考模式） - 具有逐步分析的高级推理
GLM-4.5-Air（思考模式） - 适用于主流硬件的高效推理

所有模型的特点：

128,000 token 上下文窗口用于广泛的文档处理
专家混合（MoE）架构提供最佳性能
智能体原生设计集成推理、编码和工具使用
开源可用性采用 MIT 许可证

在 Cline 中配置

打开 Cline 设置： 点击 Cline 面板中的设置图标（⚙️）。
选择提供商： 从”API Provider”下拉菜单中选择”Z AI”。
选择地区： 选择您的地区：
- “International”用于全球访问
- “China”用于中国大陆访问
输入 API 密钥： 将您的 Z AI API 密钥粘贴到”Z AI API Key”字段中。
选择模型： 从”Model”下拉菜单中选择您想要的模型。

Z AI 的混合智能

Z AI 的 GLM-4.5 系列引入了革命性功能，使其在传统语言模型中脱颖而出：

混合推理架构

GLM-4.5 在两种不同模式下运行：

思考模式： 专为复杂推理任务和工具使用而设计，进行更深入的分析过程
非思考模式： 为直接查询提供即时响应，优化效率

这种双模式架构代表了”智能体原生”设计理念，根据查询复杂性调整处理强度。

卓越性能

GLM-4.5 在涵盖智能体任务、推理和编码挑战的 12 个基准测试中获得了 63.2 的综合分数，在所有专有和开源模型中排名第三。GLM-4.5-Air 保持竞争性能，得分 59.8，同时提供卓越的效率。

专家混合卓越性

复杂的 MoE 架构在保持计算效率的同时优化性能：

GLM-4.5： 355B 总参数，32B 活跃参数
GLM-4.5-Air： 106B 总参数，12B 活跃参数

扩展上下文能力

128,000 token 上下文窗口使能全面理解冗长文档和代码库，实际测试确认有效处理近 2,000 行代码库，同时保持卓越性能。

开源领导力

在 MIT 许可证下发布，GLM-4.5 为研究人员和开发人员提供了无专有限制的最先进功能访问，包括基础模型、混合推理版本和优化的 FP8 变体。

区域优化

API 端点

国际： 使用 https://api.z.ai/api/paas/v4
中国： 使用 https://open.bigmodel.cn/api/paas/v4

模型可用性

地区设置决定 API 端点和可用模型，自动过滤以确保与您选择的地区兼容。

特殊功能

智能体功能

GLM-4.5 的统一架构使其特别适合需要集成推理、编码和工具利用功能的复杂智能体应用。

综合基准测试

性能评估包括：

3 个智能体任务基准
7 个推理基准
2 个编码基准

这种综合评估展示了在各种 AI 应用中的多功能性。

开发者集成

模型支持通过多个框架的集成：

transformers
vLLM
SGLang

配备专用模型代码、工具解析器和推理解析器实现。

性能比较

与 Claude 4 Sonnet 对比

GLM-4.5 在智能体编码和推理任务中表现出竞争性能，尽管 Claude Sonnet 4 在编码成功率和自主多功能应用开发方面保持优势。

与 GPT-4.5 对比

GLM-4.5 在推理和智能体基准测试中排名具有竞争力，GPT-4.5 通常在 MMLU 和 AIME 等专业基准的原始任务准确性方面领先。

提示和注意事项

地区选择： 选择适当的地区以获得最佳性能并符合当地法规。
模型选择： GLM-4.5 用于最大性能，GLM-4.5-Air 用于效率和主流硬件兼容性。
上下文优势： 大的 128K 上下文窗口能够处理大量代码库和文档。
开源优势： MIT 许可证允许商业使用和二次开发。
智能体应用： 特别适合需要推理、编码和工具使用集成的应用。
混合推理： 对复杂问题使用思考模式，对简单查询使用非思考模式。
API 兼容性： OpenAI 兼容 API 提供流式响应和使用报告。
框架支持： 为不同部署场景提供多种集成选项。

快速入门

提升提示技巧

功能特性

探索 Cline 工具

企业解决方案

MCP 服务器

提供商配置

本地运行模型

故障排除

更多信息

Z AI (智谱 AI)

获取 API 密钥

国际用户

中国大陆用户

支持的模型

GLM-4.5 系列

GLM-4.5 混合推理模型

在 Cline 中配置

Z AI 的混合智能

混合推理架构

卓越性能

专家混合卓越性

扩展上下文能力

开源领导力

区域优化

API 端点

模型可用性

特殊功能

智能体功能

综合基准测试

开发者集成

性能比较

与 Claude 4 Sonnet 对比

与 GPT-4.5 对比

提示和注意事项

快速入门

提升提示技巧

功能特性

探索 Cline 工具

企业解决方案

MCP 服务器

提供商配置

本地运行模型

故障排除

更多信息

​获取 API 密钥

​国际用户

​中国大陆用户

​支持的模型

​GLM-4.5 系列

​GLM-4.5 混合推理模型

​在 Cline 中配置

​Z AI 的混合智能

​混合推理架构

​卓越性能

​专家混合卓越性

​扩展上下文能力

​开源领导力

​区域优化

​API 端点

​模型可用性

​特殊功能

​智能体功能

​综合基准测试

​开发者集成

​性能比较

​与 Claude 4 Sonnet 对比

​与 GPT-4.5 对比

​提示和注意事项

获取 API 密钥

国际用户

中国大陆用户

支持的模型

GLM-4.5 系列

GLM-4.5 混合推理模型

在 Cline 中配置

Z AI 的混合智能

混合推理架构

卓越性能

专家混合卓越性

扩展上下文能力

开源领导力

区域优化

API 端点

模型可用性

特殊功能

智能体功能

综合基准测试

开发者集成

性能比较

与 Claude 4 Sonnet 对比

与 GPT-4.5 对比

提示和注意事项