OpenAIAPI模型概述cchatgpt模型简介
模型
概述
OpenAI API 由具有区别功能和价位的各种模型提供支持。您还可以通过微调,针对您的特定用例对我们的原始基本模型进行有限的自定义。
模型 | 描写 |
---|---|
GPT⑷
限量测试版
|
一组改进 GPT⑶.5 的模型,可以理解和生成自然语言或代码 |
GPT⑶.5 | 一组改进 GPT⑶ 的模型,可以理解并生成自然语言或代码 |
达尔·E
测试版
|
可以在给定自然语言提示的情况下生成和编辑图象的模型 |
耳语
测试版
|
可以将音频转换为文本的模型 |
嵌入 | 一组可以将文本转换为数字情势的模型 |
适度 | 可以检测文本会不会敏感或不安全的微调模型 |
GPT⑶ | 一组可以理解和生成自然语言的模型 |
荒废的 | 已弃用模型的完全列表 |
我们还发布了开源模型,包括Point-E,Whisper,Jukebox和CLIP。
访问我们的模型索引,供研究人员了解 更多关于我们的研究论文中介绍了哪些模型和差异 在InstructGPT和GPT⑶.5等模型系列之间。
延续模型升级
随着 的发布,我们的一些模型现在正在不断更新。我们还提供静态模型版本,开发人员可以在引入更新模型后继续使用最少三个月。随着模型更新的新节奏,我们还让人们能够贡献 eval,以帮助我们针对区别的用例改进模型。如果您有兴趣,请查看OpenAI Evals存储库。gpt⑶.5-turbo
以下模型是临时快照,一旦更新版本可用,我们将宣布其弃用日期。如果要使用最新的模型版本,请使用标准模型名称,如 或 。gpt⑷
gpt⑶.5-turbo
型号名称 | 停产日期 | 替换型号 |
---|---|---|
GPT⑶.5-涡轮增压-0301 | 09/13/2023 | GPT⑶.5-涡轮增压-0613 |
GPT⑷-0314 | 09/13/2023 | GPT⑷-0613 |
GPT⑷⑶2K-0314 | 09/13/2023 | GPT⑷⑶2K-0613 |
在我们的弃用页面上了解有关模型弃用的更多信息。
GPT⑷
限量测试版
GPT⑷ 是一个大型多模态模型(今天接受文本输入和发出文本输出,将来会出现图象输入),由于其更广泛的一般知识和高级推理能力,它可以比我们之前的任何模型更准确地解决困难。与 一样,GPT⑷ 针对聊天进行了优化,但适用于使用聊天完成 API 的传统完成任务。如需了解怎样使用 GPT⑷,请参阅我们的 GPT 指南。gpt⑶.5-turbo
最新型号 | 描写 | 最大代币数 | 训练数据 |
---|---|---|---|
GPT⑷ | 比任何 GPT⑶.5 型号都更强大,能够履行更复杂的任务,并针对聊天进行了优化。将在发布 2 周后使用我们最新的模型迭代进行更新。 | 8,192 代币 | 截至2021年<>月 |
GPT⑷-0613 | 13 年 2023 月 3 日带有函数调用数据的快照。与 区别,此模型不会收到更新,并将在新版本发布 <> 个月后弃用。gpt⑷ gpt⑷ |
8,192 代币 | 截至2021年<>月 |
GPT⑷⑶2K | 功能与基本模式相同,但上下文长度是其 4 倍。将使用我们最新的模型迭代进行更新。gpt⑷ |
32,768 代币 | 截至2021年<>月 |
GPT⑷⑶2K-0613 | 13 年 2023 月 3 日的快照。与 区别,此模型不会收到更新,并将在新版本发布 <> 个月后弃用。gpt⑷⑶2 gpt⑷⑶2k |
32,768 代币 | 截至2021年<>月 |
对许多基本任务,GPT⑷ 和 GPT⑶.5 模型之间的差异其实不明显。但是,在更复杂的推理情况下,GPT⑷ 比我们之前的任何型号都更有能力。
GPT⑶.5
GPT⑶.5 模型可以理解和生成自然语言或代码。我们在 GPT⑶.5 系列中功能最强大、最具本钱效益的型号是针对聊天进行了优化,但也适用于传统的完成任务。gpt⑶.5-turbo
最新型号 | 描写 | 最大代币数 | 训练数据 |
---|---|---|---|
GPT⑶.5-涡轮增压器 | 功能最强大的 GPT⑶.5 型号,针对聊天进行了优化,本钱仅为 .将在发布 1 周后使用我们最新的模型迭代进行更新。text-davinci-003 |
4,096 代币 | 截至2021年<>月 |
GPT⑶.5-涡轮增压⑴6K | 功能与标准模型相同,但上下文是其 4 倍。gpt⑶.5-turbo |
16,384 代币 | 截至2021年<>月 |
GPT⑶.5-涡轮增压-0613 | 13 年 2023 月 3 日带有函数调用数据的快照。与 区别,此模型不会收到更新,并将在新版本发布 <> 个月后弃用。gpt⑶.5-turbo gpt⑶.5-turbo |
4,096 代币 | 截至2021年<>月 |
GPT⑶.5-涡轮⑴6K-0613 | 13 年 2023 月 3 日的快照。与 区别,此模型不会收到更新,并将在新版本发布 <> 个月后弃用。gpt⑶.5-turbo⑴6k gpt⑶.5-turbo⑴6k |
16,384 代币 | 截至2021年<>月 |
文本-达芬奇-003 | 可以完成任何语言任务,质量更好,输出时间更长,并且遵守一致的指令,而不是居里,巴贝奇或ADA模型。还支持一些附加功能,例如插入文本。 | 4,097 代币 | 截至2021年<>月 |
文本-达芬奇-002 | 与监督微调而不是强化学习类似的能力,但经过训练text-davinci-003 |
4,097 代币 | 截至2021年<>月 |
代码-达芬奇-002 | 针对代码完成任务进行了优化 | 8,001 代币 | 截至2021年<>月 |
我们建议使用其他 GPT⑶.5 型号,由于它的本钱更低,性能更高。gpt⑶.5-turbo
达尔·E
试用版
达尔·E是一个AI系统,可以从自然语言的描写中创建逼真的图象和艺术。我们目前支持创建具有特定大小的新图象、编辑现有图象或创建用户提供的图象的变体的功能。
现在的达尔·通过我们的 API 提供的 E 模型是 DALL· 的第二次迭代E 具有比原始模型更逼真、更准确和分辨率高 2 倍的图象。您可以通过我们的实验室界面或通过 API 进行尝试。
耳语
试用版
耳语是一种通用语音辨认模型。它是在各种音频的大型数据集上进行训练的,也是一个多任务模型,可以履行多语言语音辨认和语音翻译和语言辨认。Whisper v2-large 模型目前可通过我们的 API 使用模型名称。whisper⑴
目前,Whisper的开源版本和通过我们的API提供的版本之间没有区分。但是,通过我们的 API,我们提供了一个优化的推理进程,这使得通过我们的 API 运行 Whisper 比通过其他方式运行要快很多。有关Whisper的更多技术细节,您可以浏览论文。
嵌入
嵌入是文本的数字表示情势,可用于衡量两段文本之间的相关性。我们的第二代嵌入模型旨在以一小部份本钱取代之前的 16 个第一代嵌入模型。嵌入对搜索、聚类分析、建议、异常检测和分类任务非常有用。您可以在公告博客文章中浏览有关我们最新嵌入模型的更多信息。text-embedding-ada-002
适度
审核模型旨在检查内容会不会符合 OpenAI 的使用策略。这些模型提供的分类功能可查找以下种别中的内容:冤仇、冤仇/要挟、自残、性、性/未成年人、暴力和暴力/图形。您可以在我们的审核指南中找到更多信息。
审核模型采取任意大小的输入,该输入会自动分解以修复模型特定的上下文窗口。
型 | 描写 |
---|---|
文本审核-最新 | 最有能力的审核模型。精度将比稳定模型高很多。 |
文本审核稳定 | 几近与最新型号一样强大,但略旧。 |
GPT⑶
GPT⑶ 模型可以理解和生成自然语言。这些模型被更强大的 GPT⑶.5 代模型所取代。但是,原始 GPT⑶ 基本模型(、、 和 )是当前唯一可用于微调的模型。davinci
curie
ada
babbage
最新型号 | 描写 | 最大代币数 | 训练数据 |
---|---|---|---|
文本居里-001 | 非常有能力,比达芬奇更快,本钱更低。 | 2,049 代币 | 截至2019年<>月 |
文本-巴贝奇-001 | 能够完成简单的任务,速度非常快,本钱更低。 | 2,049 代币 | 截至2019年<>月 |
文本-ADA-001 | 能够完成非常简单的任务,通常是 GPT⑶ 系列中最快的型号,本钱最低。 | 2,049 代币 | 截至2019年<>月 |
达芬奇 | 功能最强大的 GPT⑶ 模型。可以完成其他模型可以完成的任何任务,通常质量更高。 | 2,049 代币 | 截至2019年<>月 |
居里 | 非常有能力,但比达芬奇更快,本钱更低。 | 2,049 代币 | 截至2019年<>月 |
巴贝奇 | 能够完成简单的任务,速度非常快,本钱更低。 | 2,049 代币 | 截至2019年<>月 |
阿达 | 能够完成非常简单的任务,通常是 GPT⑶ 系列中最快的型号,本钱最低。 | 2,049 代币 | 截至2019年<>月 |
我们怎样使用您的数据
您的数据就是您的数据。
自 1 年 2023 月 <> 日起,发送到 OpenAI API 的数据将不会用于训练或改进 OpenAI 模型(除非您明确选择加入)。选择加入的一个好处是,随着时间的推移,模型可能会在您的用例中变得更好。
为了帮助辨认滥用行动,API 数据可能会保存最多 30 天,以后将被删除(除非法律另有要求)。对具有敏感利用程序的受信任客户,可能为零数据保存。由于数据保存为零,要求和响应正文不会持久化到任何日志记录机制中,并且仅存在于内存中以便为要求提供服务。
请注意,此数据政策不适用于 OpenAI 的非 API 消费者服务,如 ChatGPT 或 DALL·电籽实验室。
按终结点列出的默许使用策略
端点 | 用于训练的数据 | 默许保存期 | 符合零保存条件 |
---|---|---|---|
/v1/完成 | 不 | 30天 | 是的 |
/v1/聊天/完成 | 不 | 30天 | 是的 |
/v1/编辑 | 不 | 30天 | 是的 |
/v1/images/世代 | 不 | 30天 | 不 |
/v1/图象/编辑 | 不 | 30天 | 不 |
/v1/图象/变体 | 不 | 30天 | 不 |
/v1/嵌入 | 不 | 30天 | 是的 |
/v1/音频/转录 | 不 | 零数据保存 | - |
/v1/音频/翻译 | 不 | 零数据保存 | - |
/v1/文件 | 不 | 直到被客户删除 | 不 |
/v1/微调 | 不 | 直到被客户删除 | 不 |
/v1/审核 | 不 | 零数据保存 | - |
有关详细信息,请参阅我们的 API 数据使用政策。要了解有关零保存的更多信息,请联系我们的销售团队。
模型终端节点兼容性
端点 | 型号名称 |
---|---|
/v1/聊天/完成 | GPT⑷, GPT⑷-0613, GPT⑷⑶2K, GPT⑷⑶2K-0613, GPT⑶.5-涡轮增压, GPT⑶.5-涡轮增压-0613, GPT⑶.5-涡轮增压⑴6K, GPT⑶.5-涡轮⑴6K-0613 |
/v1/完成 | 文本-达芬奇-003, 文本-达芬奇-002, 文本-居里-001, 文本-巴贝奇-001, 文本-阿达-001 |
/v1/编辑 | 文本-达芬奇-编辑-001, 代码-达芬奇-编辑-001 |
/v1/音频/转录 | 耳语⑴ |
/v1/音频/翻译 | 耳语⑴ |
/v1/微调 | 达芬奇、居里、巴贝奇、阿达 |
/v1/嵌入 | 文本嵌入-ADA-002, 文本搜索-ADA-doc-001 |
/v1/审核 | 文本审核稳定,文本审核最新 |
此列表不包括我们的第一代嵌入模型,也不包括我们的 DALL·E 模型。