Skip to main content

概述

GCP Vertex AI:
一个完全托管的服务,通过 Google Cloud 提供对领先生成式 AI 模型(如 Anthropic 的 Claude 3.5 Sonnet v2)的访问。
了解更多关于 GCP Vertex AI
本指南专为拥有既定 GCP 环境的组织定制(利用 IAM 角色、服务账户和资源管理最佳实践),以确保安全和合规的使用。

步骤 1:准备你的 GCP 环境

1.1 创建或使用 GCP 项目

  • 登录 GCP 控制台:
    Google Cloud Console
  • 选择或创建项目:
    使用现有项目或创建一个专用于 Vertex AI 的新项目。

1.2 设置 IAM 权限和服务账户

  • 分配所需角色:
    • 授予你的用户(或服务账户)Vertex AI User 角色(roles/aiplatform.user
    • 对于服务账户,还要附加 Vertex AI Service Agent 角色(roles/aiplatform.serviceAgent)以启用某些操作
    • 根据需要考虑其他预定义角色:
      • Vertex AI Platform Express Admin
      • Vertex AI Platform Express User
      • Vertex AI Migration Service User
  • 跨项目资源访问:
    • 对于不同项目中的 BigQuery 表,分配 BigQuery Data Viewer 角色
    • 对于不同项目中的 Cloud Storage 存储桶,分配 Storage Object Viewer 角色
    • 对于外部数据源,请参考 GCP Vertex AI 访问控制文档

步骤 2:验证区域和模型访问

2.1 选择并确认区域

Vertex AI 支持多个区域。选择满足你的延迟、合规性和容量需求的区域。示例包括:
  • us-east5(俄亥俄州哥伦布)
  • us-central1(爱荷华州)
  • europe-west1(比利时)
  • europe-west4(荷兰)
  • asia-southeast1(新加坡)
  • global(全球)
全球端点可能提供更高的可用性并减少资源耗尽错误。仅支持 Gemini 模型。

2.2 启用 Claude 3.5 Sonnet v2 模型

  • 打开 Vertex AI 模型园:
    在 Cloud Console 中,导航到 Vertex AI → Model Garden
  • 启用 Claude 3.5 Sonnet v2:
    找到 Claude 3.5 Sonnet v2 的模型卡片并点击 启用

步骤 3:配置 Cline VS Code 扩展

3.1 安装并打开 Cline

  • 下载 VS Code:
    下载 Visual Studio Code
  • 安装 Cline 扩展:
    • 打开 VS Code
    • 导航到扩展市场(Ctrl+Shift+X 或 Cmd+Shift+X)
    • 搜索 Cline 并安装扩展
VS Code 中的 Cline 扩展

3.2 配置 Cline 设置

  • 打开 Cline 设置:
    点击 Cline 扩展中的设置 ⚙️ 图标
  • 设置 API 提供商:
    从 API 提供商下拉菜单中选择 GCP Vertex AI
  • 输入你的 Google Cloud 项目 ID:
    提供你之前设置的项目 ID
  • 选择区域:
    选择支持的区域之一(例如,us-east5
  • 选择模型:
    从可用列表中选择 Claude 3.5 Sonnet v2
  • 保存并测试:
    保存设置并通过发送简单提示进行测试(例如,“生成一个检查数字是否为质数的 Python 函数。“)

步骤 4:身份验证和凭据设置

选项 A:使用你的 Google 账户(用户凭据)

  1. 安装 Google Cloud CLI:
    按照安装指南操作
  2. 初始化并验证:
    gcloud init
    gcloud auth application-default login
    
    • 这使用你的 Google 账户设置应用程序默认凭据(ADC)
  3. 重启 VS Code:
    确保重启 VS Code,以便 Cline 扩展获取新凭据

选项 B:使用服务账户(JSON 密钥)

  1. 创建服务账户:
    • 在 GCP 控制台中,导航到 IAM & Admin > Service Accounts
    • 创建新的服务账户(例如,“vertex-ai-client”)
  2. 分配角色:
    • 附加 Vertex AI Userroles/aiplatform.user
    • 附加 Vertex AI Service Agentroles/aiplatform.serviceAgent
    • 可选择添加其他所需角色
  3. 生成 JSON 密钥:
    • 在服务账户部分,管理你的服务账户密钥并下载 JSON 密钥
  4. 设置环境变量:
    export GOOGLE_APPLICATION_CREDENTIALS="/path/to/your/service-account-key.json"
    
    • 这指示 Google Cloud 客户端库(和 Cline)使用此密钥
  5. 重启 VS Code:
    从设置了 GOOGLE_APPLICATION_CREDENTIALS 变量的终端启动 VS Code

步骤 5:安全、监控和最佳实践

5.1 强制执行最小权限

  • 最小权限原则:
    仅授予必要的最小权限。与广泛的预定义角色相比,自定义角色可以提供更精细的控制
  • 最佳实践:
    参考 GCP IAM 最佳实践

5.2 管理资源访问

  • 项目级与资源级访问:
    访问可以在两个级别进行管理。请注意,资源级权限(例如,对于 BigQuery 或 Cloud Storage)会添加到项目级策略中,但不会覆盖它们

5.3 监控使用情况和配额

  • 模型可观察性仪表板:
    • 在 Vertex AI 控制台中,导航到 模型可观察性 仪表板
    • 监控指标,如请求吞吐量、延迟和错误率(包括 429 配额错误)
  • 配额管理:

5.4 服务代理和跨项目考虑

  • 服务代理:
    了解不同的服务代理:
    • Vertex AI Service Agent
    • Vertex AI RAG Data Service Agent
    • Vertex AI Custom Code Service Agent
    • Vertex AI Extension Service Agent
  • 跨项目访问:
    对于其他项目中的资源(例如,BigQuery、Cloud Storage),确保分配适当的角色(BigQuery Data Viewer、Storage Object Viewer)

结论

通过遵循这些步骤,你的企业团队可以安全地将 GCP Vertex AI 与 Cline VS Code 扩展集成,以利用 Claude 3.5 Sonnet v2 的强大功能:
  • 准备你的 GCP 环境:
    创建或使用项目,使用最小权限配置 IAM,并确保附加必要的角色(包括 Vertex AI Service Agent 角色)
  • 验证区域和模型访问:
    确认你选择的区域支持 Claude 3.5 Sonnet v2 并且模型已启用
  • 在 VS Code 中配置 Cline:
    安装 Cline,输入你的项目 ID,选择适当的区域,并选择模型
  • 设置身份验证:
    使用用户凭据(通过 gcloud auth application-default login)或带有 JSON 密钥的服务账户
  • 实施安全和监控:
    遵循 IAM 最佳实践,仔细管理资源访问,并使用模型可观察性仪表板监控使用情况
有关更多详细信息,请参考 GCP Vertex AI 文档 和你的内部安全策略。
祝编码愉快!
本指南将随着 GCP Vertex AI 和 Cline 的发展而更新。请始终参考最新文档了解当前实践。