创建对话请求(openai)
文本系列
创建对话请求(openai)
POST
创建对话请求(openai)
简介
通用文本对话接口,支持 OpenAI 兼容的大语言模型生成对话回答。通过统一的 API 接口,您可以调用 OpenAI、Claude、DeepSeek、Grok、通义千问等多个主流大模型。认证
Bearer Token,如
Bearer sk-xxxxxxxxxx请求参数
模型标识,支持的模型包括:
- OpenAI 系列:
o4-mini、o3-mini、gpt-5.2、gpt-5.1、gpt-4o、gpt-4o-mini等 - Claude 系列:
claude-opus-4-6、claude-sonnet-4-5-20250929、claude-haiku-4-5-20251001等 - DeepSeek 系列:
deepseek-v3-1-250821、deepseek-v3、deepseek-r1等 - Grok 系列:
grok-4、grok-4-fast-reasoning、grok-3等 - Gemini 系列:
gemini-3-pro-preview、gemini-3-flash-preview、nano-banana-pro及其-thinking/-nothinking/-thinking-<预算>/-thinking-low/-thinking-high后缀变体 - 国产模型系列:
glm-5、glm-4.7、doubao-seed-1-8-251228(豆包 Seed 系列)、qwen3-coder-plus、kimi-k2.5等
对话消息列表,每个元素包含
role(user/system/assistant)和 content随机性控制,0-2,值越高回复越随机
是否启用流式输出,返回 SSE 格式的分片数据
最大生成 token 数,控制回复长度
核采样参数,0-1,控制生成的多样性
基础示例
非流式请求
流式请求(SSE)
Python 示例
高级功能
工具调用(Functions / Tools)
支持 OpenAI 兼容的工具调用格式,适用于 GPT、Claude、DeepSeek、Grok、通义千问等模型。- 第一阶段:模型返回工具调用
- 第二阶段:返回工具执行结果
结构化输出(JSON Schema)
支持通过response_format 参数控制输出格式,适用于 GPT、Claude、Grok 等模型。
思考能力
部分模型支持思考能力(Thinking/Reasoning),可以在生成回复时展示推理过程。不同模型的实现方式不同:- DeepSeek
- 通义千问
- Gemini
DeepSeek 模型支持通过
thinking 字段开启思考能力:- 默认
thinking.type为"disabled",需要显式设置为"enabled"开启 - 思考能力的输出形态可能因模型版本而异
- 建议配合
stream: true以获得更好的交互体验
通义千问扩展功能
通义千问模型支持搜索、语音识别等扩展功能,所有扩展参数需放入parameters 对象中。
- 搜索功能
- 语音识别
通义千问的所有扩展参数(如
enable_search、search_options、asr_options、temperature、top_p 等)都需要放在 parameters 对象中,而不是请求体的顶层。联网搜索功能
部分模型支持实时联网搜索,可以获取最新信息并在响应中包含引用来源。- Claude 搜索
- Grok 搜索
Claude 模型不支持通过 带位置信息的示例(展示工具调用流程):
web_search_options 参数开启网络搜索功能,所以使用只能通过tool工具调用实现,且可能因为网络和提示词等原因不稳定,详细看上面工具调用(Functions / Tools)。基础示例(展示工具调用流程):- 搜索功能会增加响应时间和 token 消耗(包含搜索结果内容)
- 搜索结果会在响应中自动包含引用来源
- 支持的模型包括 Claude Sonnet 4、Claude 3 Opus 等
- 在多轮对话中,工具调用和结果会在消息历史中可见,模型可以基于之前的搜索结果继续对话
稳定性说明:
- 联网搜索功能依赖上游代理服务和外部搜索服务,可能存在以下不稳定性:
- 网络波动:网络连接问题可能导致搜索请求超时或失败
- 服务限制:搜索服务可能有频率限制、超时限制或临时不可用
- 搜索结果质量:某些查询可能无法找到相关信息,或搜索结果质量不佳
- 模型判断:模型会根据问题自动判断是否需要搜索,某些情况下可能不会触发搜索
GPT 文件输入(Responses API)
GPT-5 等模型支持文件输入功能,需要通过/v1/responses 接口调用,而不是 /v1/chat/completions。
- 通过文件 URL 上传
- 通过 Base64 编码上传
您可以通过链接外部网址上传 PDF 文件:
- 文件大小限制:单个文件不超过 50 MB,单个请求中所有文件总大小不超过 50 MB
- 支持的模型:
gpt-4o、gpt-4o-mini、gpt-5-chat等支持文本和图像输入的模型 - 推理模型(o1、o3-mini、o4-mini)如需使用推理能力,也应使用
/v1/responses接口
Grok 推理能力
Grok 模型(特别是grok-4-fast-reasoning)支持推理能力,响应中的 usage 会区分 completion_tokens 和 reasoning_tokens:
completion_tokens - reasoning_tokens
响应格式
- 非流式响应
- 流式响应
错误处理
| 异常类型 | 触发场景 | 返回信息 |
|---|---|---|
| AuthenticationError | API密钥无效或未授权 | 错误:API密钥无效或未授权 |
| NotFoundError | 模型不存在或不被支持 | 错误:模型 [model] 不存在或不被支持 |
| APIConnectionError | 网络中断或服务器未响应 | 错误:无法连接到API服务器 |
| APIError | 请求格式错误等服务端异常 | API请求失败:[错误详情] |
支持的模型系列
OpenAI 系列
- GPT-4.1、GPT-4o、GPT-4o Mini、GPT-3.5-turbo
- 推理模型:o3-mini、o4-mini(需使用
/v1/responses接口)
Claude 系列(Anthropic)
- Claude Sonnet 4、Claude 3 Opus、Claude 3 Haiku
DeepSeek 系列
- DeepSeek V3、DeepSeek R1
Grok 系列(xAI)
- Grok-4、Grok-3、Grok-3-fast、Grok-4-fast-reasoning
通义千问系列(Qwen)
- Qwen3-omni-flash 等
豆包 Seed 系列(Doubao)
- doubao-seed-1-8-251228 等
其他模型
- Gemini 系列、GLM 系列(含 glm-5)、Kimi 系列等
注意事项
messages列表中system角色用于设定模型行为,user角色为用户提问- 多轮对话需追加历史记录(包含
assistant角色的回复) - 依赖
openai库:pip install openai - 不同模型对某些功能的支持程度可能不同,建议在使用前查看具体模型的文档
相关资源
常见问题
查看对话接口的常见问题解答
模型列表
查看所有支持的模型信息
