使用指南

一、产品简介

TokenBay 是一个聚合主流大模型的 API 中转服务平台。我们将 OpenAI、Anthropic Claude、Google Gemini、DeepSeek 等众多模型，通过统一的 OpenAI 兼容接口提供给开发者，让你只需一个 API Key、一个 Base URL，即可调用全球主流大模型。

核心优势

统一接口：完全兼容 OpenAI API 格式，已有代码改一行即可迁移
价格透明：所有模型明码标价，用多少花多少，无订阅、无套路
稳定高速：多线路负载均衡，国内直连，无需代理
模型丰富：聚合 GPT、Claude、Gemini、DeepSeek、Qwen 等数十种模型
灵活管理：支持多 Key 管理、额度限制、用量统计、团队协作

适用人群

AI 应用开发者
企业技术团队
学习与研究 AI 的个人用户
需要快速接入多模型的产品

二、快速接入

Step 1：创建 API Key

注册或登录到工作台
创建「API Keys」并点击复制

Step 2：填入 URL 和 Key

准备你要接入的工具
填入 URL 和 Key

Base URL: https://api.tokenbay.com/v1
API Key:  sk-xxxxxxxxxxxxxxxxxxxxxxxx

Step 3：发起调用

from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.tokenbay.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
 
response = client.chat.completions.create(
    model="gpt-5.4",
    messages=[{"role": "user", "content": "Hello"}],
)
 
print(response.choices[0].message.content)

三、计费说明

计费模式

按量付费：按实际消耗计费，用多少扣多少
无订阅、无月费：不强制订阅，账户余额随时可用
预充值制：提前充值到账户余额，调用时实时扣费

价格规则

所有模型定价在「模型价格」页面公开透明
输入与输出价格通常不同（输出更贵）
部分模型支持缓存命中折扣（Prompt Caching）

充值与余额

支持多种支付方式
充值实时到账
余额永久有效，不过期
支持余额预警通知

四、模型说明

支持的模型类别

完整模型列表与实时价格请查看「模型价格」页面。

模型选型建议

使用目标	推荐模型
追求极致质量	gpt-5.5、gpt-5.4、claude-opus-4.8、claude-opus-4.7、gemini-3.1-pro-preview 等
追求性价比	gpt-5.4-mini、gemini-2.5-flash、gemini-3.5-flash、qwen3.5-flash 等
复杂推理	gpt-5.5、claude-opus-4.8、deepseek-v4-pro、qwen3.7-max 等
长文本处理	gemini-3.1-pro-preview、gemini-2.5-pro、claude-sonnet-4.6、kimi-k2.6 等

API 兼容性

TokenBay 完全兼容 OpenAI API 格式，支持以下 endpoint：

Endpoint	用途
`/v1/chat/completions`	对话补全（支持流式）
`/v1/images/generations`	图像生成
`/v1/models`	获取模型列表

/v1/models 的公开返回范围仍在完善中。准确的模型 ID、价格、模态和可用性请以模型价格页面及控制台 Models 页面为准。

模型调试

进入「模型使用」页面，你可以：

在线调试：无需写代码，直接对话测试模型效果
参数调节：支持调试文本、图片、视频等不同模型所需参数
多模型对比：同一问题让多个模型同时回答，直观对比效果
快速复制代码：调试满意后，一键生成对应代码片段

五、功能介绍

1. API Key 管理

进入「API Key 管理」页面，你可以：

创建多个 Key：建议为不同项目 / 不同应用分别创建，便于管理与统计
设置额度限制：为每个 Key 设置最大可用额度，防止意外超支
设置模型权限：限制某个 Key 只能调用特定模型
设置有效期：可指定 Key 的过期时间
启用 / 禁用 / 删除：随时控制 Key 的状态
查看独立用量：查看每个 Key 的独立用量

安全建议：API Key 等同于密码，请勿提交到 GitHub 或公开场所。如发生泄漏，请立即在控制台禁用并重新生成。

2. 用量统计与账单

进入「用量日志」页面，你可以：

查看每日 / 每周 / 每月的消耗趋势
按 Key 维度查看每个项目的消耗
按模型维度查看不同模型的使用情况
查看每一次调用的明细（时间、模型、Token 数、消耗金额）
导出账单数据（CSV）

3. 充值、发票与账单

支持银行卡、Google Pay、Apple Pay、Link 等支付方式
充值实时到账，余额永久有效
充值完成后，自动发送支付账单到邮箱

4. 团队与邀请（升级中）

进入「组织管理」页面，你可以：

组织管理：支持创建组织并管理成员
邀请成员：通过邀请链接或邮箱邀请同事加入
成员 Key：组织内成员可自主创建 Key
额度管理：为每个成员单独设置每月可用积分额度
权限控制：区分管理员、普通成员等角色
统一计费：所有成员消耗统一从主账户扣费

六、最佳实践

1. 控制成本

优先使用性价比模型处理简单任务
复杂任务再使用旗舰模型
利用 Prompt Caching 降低重复输入的成本
为每个 Key 设置额度上限，防止 Key 泄露导致超支

2. 提升稳定性

实现请求重试机制（建议 1 次，指数退避）
设置合理的超时时间（建议 60–120 秒）
监控错误率，必要时切换模型

3. 流式响应

对于聊天类应用，建议使用 stream=True，边生成边看到结果，体验更好：

from openai import OpenAI
 
client = OpenAI(
    base_url="https://api.tokenbay.com/v1",
    api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
 
stream = client.chat.completions.create(
    model="gpt-5.4",
    messages=[],
    stream=True,
)

4. 错误处理

常见状态码及典型场景：

状态码	语义	典型场景
200	成功	请求成功；异步任务本身失败时，也可能通过响应中的 `status: "failed"` 表达
400	客户端请求错误	参数无效、缺少必填字段、请求体解析失败、任务不存在
401	鉴权失败	Token 缺失、无效或已被禁用
403	权限不足	用户被封禁、额度不足、无权访问分组或模型、IP 限制不通过
404	资源不存在	未匹配路由，或视频内容代理中的任务不存在
413	请求体过大	请求体超过大小限制
429	请求限流	模型请求限流、全局 API 限流、上游负载饱和
500	服务端内部错误	请求转换、上游调用、响应解析或序列化失败
501	未实现	接口或转换尚未实现
502	网关错误	视频内容代理中的上游 URL 抓取失败，或上游返回无效响应
503	服务不可用	无可用渠道、系统资源过载、渠道无可用 Key
504	上游超时	渠道响应时间超限

遇到可重试错误时，请使用指数退避并限制重试次数；鉴权、权限或参数错误应先修正请求，不要直接重试。