文档

API 文档

集成所需的一切。支持 Anthropic 与 OpenAI 两种协议——同一把 Key,同一套规则。

1. 获取 API Key

注册并登录后,进入 控制台 → API Keys → 新建 Key。你会得到一串以 cc_user_ 开头的密钥——请立即复制,它只展示这一次。

2. 调用网关

基址为 https://api.wdllm.com(或运营方告知你的地址)。

Anthropic 原生

curl https://api.wdllm.com/v1/messages \
  -H "x-api-key: $YOUR_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "max_tokens": 512,
    "messages": [
      {"role": "user", "content": "Hello, world!"}
    ]
  }'

OpenAI 兼容

curl https://api.wdllm.com/v1/chat/completions \
  -H "Authorization: Bearer $YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "claude-sonnet-4-6",
    "messages": [
      {"role": "user", "content": "Hello, world!"}
    ]
  }'

流式(SSE)

curl https://api.wdllm.com/v1/messages \
  -H "x-api-key: $YOUR_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{"model":"claude-sonnet-4-6","stream":true,"max_tokens":1024,
       "messages":[{"role":"user","content":"Tell me a haiku."}]}'

3. 模型与推理档位

完整可调用的模型见 /pricing 或编程式拉取 /v1/models(实时反映上游 Anthropic 的最新清单)。同一模型可以通过**模型名后缀**调节推理强度,无需任何额外字段——任何 SDK / 客户端都能用。

后缀语法:<base>[-<effort>][-thinking]。两个维度独立,可自由组合:

模型名 effort 思考 适合
claude-opus-4-8off普通问答 · 最低延迟
claude-opus-4-8-maxmaxoff要详尽长答但不要慢推理
claude-opus-4-8-thinkingon要推理 · 默认详尽度
claude-opus-4-8-xhigh-thinkingxhighon复杂重构 / 长链推理(火力全开)
claude-haiku-4-5-thinkingon老模型(无 effort)开思考

要点

可直接复制的示例(最强推理 + 最深思考)

curl https://api.wdllm.com/v1/messages \
  -H "x-api-key: $YOUR_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-opus-4-8-xhigh-thinking",
    "max_tokens": 4096,
    "messages": [
      {"role": "user", "content": "Refactor this code for performance."}
    ]
  }'

4. 视觉(图片)

内联 base64 编码图片:

{
  "model": "claude-sonnet-4-6",
  "max_tokens": 512,
  "messages": [{
    "role": "user",
    "content": [
      {"type": "image", "source": {
        "type": "base64",
        "media_type": "image/png",
        "data": "iVBORw0KG..."
      }},
      {"type": "text", "text": "What's in this image?"}
    ]
  }]
}

5. 提示缓存

cache_control 标记消息块,使其驻留缓存,后续读取仅按 10% 计费:

{
  "role": "user",
  "content": [
    {"type": "text", "text": "Large system context...",
     "cache_control": {"type": "ephemeral"}},
    {"type": "text", "text": "User question goes here"}
  ]
}

6. 工具(函数调用)

{
  "model": "claude-sonnet-4-6",
  "max_tokens": 1024,
  "tools": [{
    "name": "get_weather",
    "description": "Look up current weather",
    "input_schema": {
      "type": "object",
      "properties": {"city": {"type": "string"}},
      "required": ["city"]
    }
  }],
  "messages": [{"role":"user","content":"Weather in Tokyo?"}]
}

7. 用量遥测

每次成功请求都会返回:

查询任意历史请求的用量:

GET /v1/usage/{request_id}
→ {
  "input_tokens": 781,
  "output_tokens": 921,
  "cache_read_input_tokens": 0,
  "cache_creation": {"ephemeral_5m_input_tokens": 0, ...},
  "cost_micro": 18234,
  "model": "claude-sonnet-4-6"
}

8. 错误码

状态码含义
401缺少或无效的 API Key。
402余额不足(<code class="inline">insufficient_funds</code>)—— 请充值后继续;或请求了未定价模型(<code class="inline">model_not_priced</code>)—— 该模型当前未在定价表中,请联系运营添加。两种情况下网关都不会调用上游、不消耗 token。
429触发限流(每 Key RPM 或上游账号 RPM)。
502上游 Anthropic 报错;冷却系统会自动改路。
503无健康上游账号,请稍后重试。

9. SDK

沿用你现有的任意 SDK,只需替换基址:

# Python (anthropic-sdk-python)
client = anthropic.Anthropic(
    api_key="cc_user_...",
    base_url="https://api.wdllm.com",
)

# Python (openai-python)
client = openai.OpenAI(
    api_key="cc_user_...",
    base_url="https://api.wdllm.com/v1",
)

# Node.js (@anthropic-ai/sdk)
const client = new Anthropic({ apiKey: process.env.YOUR_KEY,
                                baseURL: 'https://api.wdllm.com' });

需要这里没有列出的功能?发邮件至 support@wdllm.com,我们乐意帮忙。