使用指南
一、产品简介
TokenBay 是一个聚合主流大模型的 API 中转服务平台。我们将 OpenAI、Anthropic Claude、Google Gemini、DeepSeek 等众多模型,通过统一的 OpenAI 兼容接口提供给开发者,让你只需一个 API Key、一个 Base URL,即可调用全球主流大模型。
核心优势
- 统一接口:完全兼容 OpenAI API 格式,已有代码改一行即可迁移
- 价格透明:所有模型明码标价,用多少花多少,无订阅、无套路
- 稳定高速:多线路负载均衡,国内直连,无需代理
- 模型丰富:聚合 GPT、Claude、Gemini、DeepSeek、Qwen 等数十种模型
- 灵活管理:支持多 Key 管理、额度限制、用量统计、团队协作
适用人群
- AI 应用开发者
- 企业技术团队
- 学习与研究 AI 的个人用户
- 需要快速接入多模型的产品
二、快速接入
Step 1:创建 API Key
Step 2:填入 URL 和 Key
- 准备你要接入的工具
- 填入 URL 和 Key
Base URL: https://api.tokenbay.com/v1
API Key: sk-xxxxxxxxxxxxxxxxxxxxxxxxStep 3:发起调用
from openai import OpenAI
client = OpenAI(
base_url="https://api.tokenbay.com/v1",
api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
response = client.chat.completions.create(
model="gpt-5.4",
messages=[{"role": "user", "content": "Hello"}],
)
print(response.choices[0].message.content)三、计费说明
计费模式
- 按量付费:按实际消耗计费,用多少扣多少
- 无订阅、无月费:不强制订阅,账户余额随时可用
- 预充值制:提前充值到账户余额,调用时实时扣费
价格规则
- 所有模型定价在「模型价格」页面公开透明
- 输入与输出价格通常不同(输出更贵)
- 部分模型支持缓存命中折扣(Prompt Caching)
充值与余额
- 支持多种支付方式
- 充值实时到账
- 余额永久有效,不过期
- 支持余额预警通知
四、模型说明
支持的模型类别
- 完整模型列表与实时价格请查看「模型价格」页面。
模型选型建议
| 使用目标 | 推荐模型 |
|---|---|
| 追求极致质量 | gpt-5.5、gpt-5.4、claude-opus-4.8、claude-opus-4.7、gemini-3.1-pro-preview 等 |
| 追求性价比 | gpt-5.4-mini、gemini-2.5-flash、gemini-3.5-flash、qwen3.5-flash 等 |
| 复杂推理 | gpt-5.5、claude-opus-4.8、deepseek-v4-pro、qwen3.7-max 等 |
| 长文本处理 | gemini-3.1-pro-preview、gemini-2.5-pro、claude-sonnet-4.6、kimi-k2.6 等 |
API 兼容性
TokenBay 完全兼容 OpenAI API 格式,支持以下 endpoint:
| Endpoint | 用途 |
|---|---|
/v1/chat/completions | 对话补全(支持流式) |
/v1/images/generations | 图像生成 |
/v1/models | 获取模型列表 |
/v1/models的公开返回范围仍在完善中。准确的模型 ID、价格、模态和可用性请以模型价格页面及控制台 Models 页面为准。
模型调试
进入「模型使用」页面,你可以:
- 在线调试:无需写代码,直接对话测试模型效果
- 参数调节:支持调试文本、图片、视频等不同模型所需参数
- 多模型对比:同一问题让多个模型同时回答,直观对比效果
- 快速复制代码:调试满意后,一键生成对应代码片段
五、功能介绍
1. API Key 管理
进入「API Key 管理」页面,你可以:
- 创建多个 Key:建议为不同项目 / 不同应用分别创建,便于管理与统计
- 设置额度限制:为每个 Key 设置最大可用额度,防止意外超支
- 设置模型权限:限制某个 Key 只能调用特定模型
- 设置有效期:可指定 Key 的过期时间
- 启用 / 禁用 / 删除:随时控制 Key 的状态
- 查看独立用量:查看每个 Key 的独立用量
安全建议:API Key 等同于密码,请勿提交到 GitHub 或公开场所。如发生泄漏,请立即在控制台禁用并重新生成。
2. 用量统计与账单
进入「用量日志」页面,你可以:
- 查看每日 / 每周 / 每月的消耗趋势
- 按 Key 维度查看每个项目的消耗
- 按模型维度查看不同模型的使用情况
- 查看每一次调用的明细(时间、模型、Token 数、消耗金额)
- 导出账单数据(CSV)
3. 充值、发票与账单
- 支持银行卡、Google Pay、Apple Pay、Link 等支付方式
- 充值实时到账,余额永久有效
- 充值完成后,自动发送支付账单到邮箱
4. 团队与邀请(升级中)
进入「组织管理」页面,你可以:
- 组织管理:支持创建组织并管理成员
- 邀请成员:通过邀请链接或邮箱邀请同事加入
- 成员 Key:组织内成员可自主创建 Key
- 额度管理:为每个成员单独设置每月可用积分额度
- 权限控制:区分管理员、普通成员等角色
- 统一计费:所有成员消耗统一从主账户扣费
六、最佳实践
1. 控制成本
- 优先使用性价比模型处理简单任务
- 复杂任务再使用旗舰模型
- 利用 Prompt Caching 降低重复输入的成本
- 为每个 Key 设置额度上限,防止 Key 泄露导致超支
2. 提升稳定性
- 实现请求重试机制(建议 1 次,指数退避)
- 设置合理的超时时间(建议 60–120 秒)
- 监控错误率,必要时切换模型
3. 流式响应
对于聊天类应用,建议使用 stream=True,边生成边看到结果,体验更好:
from openai import OpenAI
client = OpenAI(
base_url="https://api.tokenbay.com/v1",
api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxx",
)
stream = client.chat.completions.create(
model="gpt-5.4",
messages=[],
stream=True,
)4. 错误处理
常见状态码及典型场景:
| 状态码 | 语义 | 典型场景 |
|---|---|---|
| 200 | 成功 | 请求成功;异步任务本身失败时,也可能通过响应中的 status: "failed" 表达 |
| 400 | 客户端请求错误 | 参数无效、缺少必填字段、请求体解析失败、任务不存在 |
| 401 | 鉴权失败 | Token 缺失、无效或已被禁用 |
| 403 | 权限不足 | 用户被封禁、额度不足、无权访问分组或模型、IP 限制不通过 |
| 404 | 资源不存在 | 未匹配路由,或视频内容代理中的任务不存在 |
| 413 | 请求体过大 | 请求体超过大小限制 |
| 429 | 请求限流 | 模型请求限流、全局 API 限流、上游负载饱和 |
| 500 | 服务端内部错误 | 请求转换、上游调用、响应解析或序列化失败 |
| 501 | 未实现 | 接口或转换尚未实现 |
| 502 | 网关错误 | 视频内容代理中的上游 URL 抓取失败,或上游返回无效响应 |
| 503 | 服务不可用 | 无可用渠道、系统资源过载、渠道无可用 Key |
| 504 | 上游超时 | 渠道响应时间超限 |
遇到可重试错误时,请使用指数退避并限制重试次数;鉴权、权限或参数错误应先修正请求,不要直接重试。
