online.st0722.top

全模型通用的联网搜索中间层

这个网关接收标准 OpenAI Chat Completions 请求。只有最后一条 user 消息以精确前缀 web: 开头时才会触发联网搜索; 否则会原样转发到 https://api.chatst.org/v1/chat/completions

使用流程

1. 触发搜索 最后一条 user 消息写成 web: 你的问题
2. 自动抽取 query 网关会先把长文本压缩成更适合搜索的关键词,再调用 Ollama Cloud Web Search。
3. 回传结果 流式请求会先收到“搜索完成”通知;非流式请求会把这条通知放在 AI 回复最前面。

规则说明

不触发搜索 没有 web: 前缀时,直接透传,不做额外处理。
错误策略 上游出错会自动重试一次,两次都失败后回退到离线请求。
部署端口 默认监听 6666,你可以直接放到反向代理后面使用。
正确调用方式
POST https://online.st0722.top/v1/chat/completions
Authorization: Bearer <你的 API Key>
Trigger

精确前缀触发

只识别最后一条 user 消息的开头 web: ,不会误伤普通对话内容。

Search

Ollama Cloud Web Search

统一用 Ollama 的 web search API 取结果,默认 max_results=5,可以直接在服务端控制搜索质量。

Output

前置通知 + 原始回复

搜索成功时先告诉你“已成功联网搜索到 xx 个结果,用时 xx 秒”,然后继续返回模型输出。

示例请求

curl https://online.st0722.top/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "your-model",
    "stream": false,
    "messages": [
      {"role": "user", "content": "web: 帮我查一下今天 OpenAI 和 Ollama 的联网搜索能力对比"}
    ]
  }'