常见问题
账号与令牌
Q. 一个账号最多建几个令牌?
默认 100 个,企业级账户可联系提升。每个令牌独立额度、独立模型白名单。
Q. 忘记密码?
登录页点击「忘记密码」→ 邮件重置;或用绑定过的 GitHub / Google 账号一键登录。
Q. 能否给团队成员单独的子账号?
可以。在「用户管理」中邀请成员,分配「只读 / 普通 / 管理」等角色;每个成员独立令牌与配额。
计费
Q. 最低充值金额?
$1 起充,支持 USDT、支付宝、微信支付、信用卡。
Q. 发票?
月消费 ≥ $100 可联系开具增值税普通发票;国际用户需单独协商。
Q. 为什么我的扣费和官方定价不一致?
三种可能:
- 使用的不是
official分组,倍率大于 1×; - prompt cache 命中或失效改变了计费;
- Claude thinking / reasoning 输出也计入
output_tokens。
API 使用
Q. 为什么流式看不到 thinking / reasoning 块?
确认:① 使用支持 thinking 的模型(claude-opus-4-*、o1/o3、gemini-2.5-*);② Claude 需显式传 thinking: {type:"enabled"};③ OpenAI Responses 需传 reasoning.effort。
Q. 响应超时/连接断开怎么办?
- 非流式:默认 600s,超长请求改用流式;
- 流式:客户端 readTimeout 至少 600s;
- 长上下文建议用 mini/flash 模型或拆分任务。
Q. 能使用 OpenAI 的 Assistants / File / Fine-tune API 吗?
本网关目前不实现 Assistants、Files、Fine-tunes 三组 OpenAI 私有端点(调用返回 501)。大多数用例可通过上下文工程 + RAG 替代。
Q. 是否支持连续对话 / 会话状态?
网关本身无状态。若要维持会话:
- OpenAI 协议:客户端把历史
messages完整回传; - OpenAI Responses:使用
previous_response_id; - Gemini:使用
cachedContent复用长 system; - Anthropic:使用
cache_control: ephemeral复用前缀。
合规与隐私
Q. TTToken 会保存我的 prompt 吗?
不保存请求体/响应体。日志仅包含:模型、token 数、耗时、状态码、渠道 ID、请求 ID。
Q. 中国大陆是否可用?
域名走 CDN,通常可直连;如遇网络抖动可自建反代。请遵守所在地法律,不要将服务用于向公众提供未备案的生成式 AI。
联系与反馈
- 邮箱:hbfengye052@163.com
- Telegram 群:请在控制台公告查看最新入群链接
- bug 反馈:提交工单并附上
X-Request-Id与时间戳
🕒 SLA
日常支持:9:00–24:00(UTC+8);紧急故障:7×24 on-call,企业客户配专属技术群。