zh使用指南使用指南

使用指南

一、产品简介

TokenBay 是一个聚合主流大模型的 API 中转服务平台。我们将 OpenAI、Anthropic Claude、Google Gemini、DeepSeek 等众多模型,通过统一的 OpenAI 兼容接口提供给开发者,让你只需一个 API Key、一个 Base URL,即可调用全球主流大模型。

核心优势

  • 统一接口:完全兼容 OpenAI API 格式,已有代码改一行即可迁移
  • 价格透明:所有模型明码标价,用多少花多少,无订阅、无套路
  • 稳定高速:多线路负载均衡,国内直连,无需代理
  • 模型丰富:聚合 GPT、Claude、Gemini、DeepSeek、Qwen 等数十种模型
  • 灵活管理:支持多 Key 管理、额度限制、用量统计、团队协作

适用人群

  • AI 应用开发者
  • 企业技术团队
  • 学习与研究 AI 的个人用户
  • 需要快速接入多模型的产品

二、快速接入

Step 1:创建 API Key

Step 2:填入 URL 和 Key

  • 准备你要接入的工具
  • 填入 URL 和 Key
Base URL: https://api.tokenbay.com/v1
API Key:  sk-xxxxxxxxxxxxxxxxxxxxxxxx

Step 3:发起调用

from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.tokenbay.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
 
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Hello"}],
)
 
print(response.choices[0].message.content)

三、计费说明

计费模式

  • 按量付费:按实际消耗计费,用多少扣多少
  • 无订阅、无月费:不强制订阅,账户余额随时可用
  • 预充值制:提前充值到账户余额,调用时实时扣费

价格规则

  • 所有模型定价在「模型价格」页面公开透明
  • 输入与输出价格通常不同(输出更贵)
  • 部分模型支持缓存命中折扣(Prompt Caching)

充值与余额

  • 支持多种支付方式
  • 充值实时到账
  • 余额永久有效,不过期
  • 支持余额预警通知

四、模型说明

支持的模型类别

  • 完整模型列表与实时价格请查看「模型价格」页面。

模型选型建议

使用目标推荐模型
追求极致质量gpt-5.5、gpt-5.4、claude-opus-4.8、claude-opus-4.7、gemini-3.1-pro-preview 等
追求性价比gpt-5.4-mini、gemini-2.5-flash、gemini-3.5-flash、qwen3.5-flash 等
复杂推理gpt-5.5、claude-opus-4.8、deepseek-v4-pro、qwen3.7-max 等
长文本处理gemini-3.1-pro-preview、gemini-2.5-pro、claude-sonnet-4.6、kimi-k2.6 等

API 兼容性

TokenBay 完全兼容 OpenAI API 格式,支持以下 endpoint:

Endpoint用途
/v1/chat/completions对话补全(支持流式)
/v1/images/generations图像生成
/v1/models获取模型列表

/v1/models 的公开返回范围仍在完善中。准确的模型 ID、价格、模态和可用性请以模型价格页面及控制台 Models 页面为准。

模型调试

进入「模型使用」页面,你可以:

  • 在线调试:无需写代码,直接对话测试模型效果
  • 参数调节:支持调试文本、图片、视频等不同模型所需参数
  • 多模型对比:同一问题让多个模型同时回答,直观对比效果
  • 快速复制代码:调试满意后,一键生成对应代码片段

五、功能介绍

1. API Key 管理

进入「API Key 管理」页面,你可以:

  • 创建多个 Key:建议为不同项目 / 不同应用分别创建,便于管理与统计
  • 设置额度限制:为每个 Key 设置最大可用额度,防止意外超支
  • 设置模型权限:限制某个 Key 只能调用特定模型
  • 设置有效期:可指定 Key 的过期时间
  • 启用 / 禁用 / 删除:随时控制 Key 的状态
  • 查看独立用量:查看每个 Key 的独立用量

安全建议:API Key 等同于密码,请勿提交到 GitHub 或公开场所。如发生泄漏,请立即在控制台禁用并重新生成。

2. 用量统计与账单

进入「用量日志」页面,你可以:

  • 查看每日 / 每周 / 每月的消耗趋势
  • 按 Key 维度查看每个项目的消耗
  • 按模型维度查看不同模型的使用情况
  • 查看每一次调用的明细(时间、模型、Token 数、消耗金额)
  • 导出账单数据(CSV)

3. 充值、发票与账单

  • 支持银行卡、Google Pay、Apple Pay、Link 等支付方式
  • 充值实时到账,余额永久有效
  • 充值完成后,自动发送支付账单到邮箱

4. 团队与邀请(升级中)

进入「组织管理」页面,你可以:

  • 组织管理:支持创建组织并管理成员
  • 邀请成员:通过邀请链接或邮箱邀请同事加入
  • 成员 Key:组织内成员可自主创建 Key
  • 额度管理:为每个成员单独设置每月可用积分额度
  • 权限控制:区分管理员、普通成员等角色
  • 统一计费:所有成员消耗统一从主账户扣费

六、最佳实践

1. 控制成本

  • 优先使用性价比模型处理简单任务
  • 复杂任务再使用旗舰模型
  • 利用 Prompt Caching 降低重复输入的成本
  • 为每个 Key 设置额度上限,防止 Key 泄露导致超支

2. 提升稳定性

  • 实现请求重试机制(建议 1 次,指数退避)
  • 设置合理的超时时间(建议 60–120 秒)
  • 监控错误率,必要时切换模型

3. 流式响应

对于聊天类应用,建议使用 stream=True,边生成边看到结果,体验更好:

from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.tokenbay.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
 
stream = client.chat.completions.create(
    model="gpt-5.4",
    messages=[],
    stream=True,
)

4. 错误处理

常见状态码及典型场景:

状态码语义典型场景
200成功请求成功;异步任务本身失败时,也可能通过响应中的 status: "failed" 表达
400客户端请求错误参数无效、缺少必填字段、请求体解析失败、任务不存在
401鉴权失败Token 缺失、无效或已被禁用
403权限不足用户被封禁、额度不足、无权访问分组或模型、IP 限制不通过
404资源不存在未匹配路由,或视频内容代理中的任务不存在
413请求体过大请求体超过大小限制
429请求限流模型请求限流、全局 API 限流、上游负载饱和
500服务端内部错误请求转换、上游调用、响应解析或序列化失败
501未实现接口或转换尚未实现
502网关错误视频内容代理中的上游 URL 抓取失败,或上游返回无效响应
503服务不可用无可用渠道、系统资源过载、渠道无可用 Key
504上游超时渠道响应时间超限

遇到可重试错误时,请使用指数退避并限制重试次数;鉴权、权限或参数错误应先修正请求,不要直接重试。