你真的了解ChatGPT吗

ChatGPT究竟是甚么?

本期和大家聊一下时下比较火热的ChatGPT,关于账号的使用和介绍的视频,最开始之前自己也有密切的关注略知一二。首先这个东西他不是平空出现的,其实在这之前就有过几代,比如说GPT4和GPT3,然后就是去年的2022年的12月份发布了最新的,也就是现在疯传的ChatGPT。目前是被微软所收购,听说投资也很多,所以这个前景大家是可以去期待一下的。

现在就向大家解释一下ChatGPT这个缩写,它的一个大致是甚么含义:                  首先 Chat 就是我们说的沟通交换的意思,所以它本质就是一个沟通交换的软件; 这个G实际上是generative的缩写,也就是生成式和生产式的意思;这个P它代表的是一个复合词,是pre-trained,就是经过提早训练的;最后这个T就是transformer,表示转换的意思。其实我们目前市面上很多产品都是通过应用这个transformer的思想来完成的(就是利用转换的思想,比如说代码转换成app或一段话) 

OpenAI 的前世今生

OpenAI 成立于 2015 12 月,是所处于美国旧金山的一个人工智能研究实验室,由

非营利性的 OpenAI Inc.及其营利性的子公司 OpenAI LP 组成。OpenAI 展开人工通用

智能(AGI)研究,为了确保 AI 能够造福全人类,OpenAI 提供了一个基于 AI 的开发

和研究框架,这也是其名字的来源(开放 AI 能力)。利用 OpenAI 的平台,客户可

以快速提升开发技能并获得 AI 领域的专业知识,这有助于安全有效的通用人工智能

AGI)技术的发展。OpenAI 开发、保护和训练了一批可用于通用活动的 AI 模型,

包括写作、浏览、编程和图象处理等,OpenAI 始终相信 AGI 对我们平常生活的影响

将远远超过初期的 AI 技术。

马斯克、奥特曼和其他投资者于 2015 12 月宣布创建 OpenAI,并许诺向该项目投

入超过 10 亿美元。通过公布其专利和研究成果,OpenAI 将与其他组织和研究人员

自由互动“OpenAI Gym”的公测版本于 2016 4 27 日发布,这是一个加强

OpenAI 研究领域的平台。2016 12 5 日,OpenAI 发布了“Universe”,这是一个

用于开发和测试 AI 的平台,智能能力可以覆盖全球的网站、游戏和其他利用程序。

2019 3 11 日,OpenAI 宣布从非盈利(non-profit性质过度到有限盈利

capped for profit,利润上限为任何投资的 100 倍(创建了 OpenAI LP 公司)。

也是在 2019 年,微软向 OpenAI 投资了 10 亿美金,并取得了 OpenAI 技术的商业化

授权。从此,OpenAI 的一些技术开始出现在微软的产品和业务上。不过,OpenAI

微软的合作其实从 2016 年就开始,2016 年,微软的云服务 Azure OpenAI 提供了

大范围实验的平台。Azure 彼时已为他们提供了带有 InfiniBand 互连的 K80 GPU

算力资源,以优化深度学习的训练。2020 9 22 日,OpenAI 开始授权微软使用

他们的 GPT⑶ 模型,也是全球首个可以享受 GPT⑶ 能力的公司。

2020 6 11 日,OpenAI 发布了 OpenAI API,这也是 OpenAI 第一个商业化产品。

官方解释了,他们认为开发商业产品是确保 OpenAI 有足够资金继续投入 AI 研究的

有效手段。自此,OpenAI 也正是开始商业化运作。官方也解释了,使用 API 的方式

提供模型而不是开源模型也将下降模型的使用门坎,毕竟对中小企业来讲,部署

强大的 AI 模型所需要的本钱可能更高。

2016 年至今,OpenAI 发布了很多人工智能相关的技术,从工具到算法到论文到模

型,都有触及。

2016

2016 4 27 日,OpenAI 发布了他们的第一个项目——OpenAI Gym Beta,这是一

个用来开发和比较区别强化学习算法的工具。

2017

2017 5 24 日 , OpenAI 开 源 了 一 个 重 现 强 化 学 习 算 法 的 工 具 ——

OpenAI Baselines。目标是提供用于正确的强化学习算法实现的一些最好实践,以帮

助大家提高强化学习的研究效力。

2018

2018 6 11 日,OpenAI 公布了一个在诸多语言处理任务上都获得了很好结果的

算法,即著名的 GPT,这也是该算法的第一个版本。GPT 是第一个将 transformer

无监督的预训练技术相结合,其获得的效果要好过当前的已知算法。这个算法算是

OpenAI 大语言模型的探索性的先驱,也使得后面出现了更强大的 GPT 系列。

一样是在 2018 6 月份,OpenAI OpenAI Five 已开始在 Dota2 游戏中击败业余

人类团队,并表示在未来2个月将与世界顶级玩家进行对战。OpenAI Five使用了256

P100 GPUs 128000 CPU 核,每天玩 180 年时长的游戏来训练模型。在随后的

几个月里 OpenAI Five 详情继续公布。在 8 月份的专业比赛中,OpenAI Five 输掉了 2

场与顶级选手的比赛,但是比赛的前 25⑶0 分钟内,OpenAI Five 的模型的有着十分

良好的表现。OpenAI Five 继续发展并在 2019 4 15 日宣布打败了当时的 Dota2

世界冠军。

2019

2019 2 14 日,OpenA 官宣 GPT⑵ 模型。GPT⑵ 模型有 15 亿参数,基于 800

网页数据训练。2019 11 5 日,15 亿参数的完全版本的 GPT⑵ 预训练结果发

布。

2019 3 4 日,OpenAI 发布了一个用于强化学习代理的大范围多代理游戏环境:

Neural MMO。该平台支持在一个持久的、开放的任务中的存在大量的、可变的代

理。

2019 4 25 日,OpenAI 公布了最新的研究成果:MuseNet,这是一个深度神经

网络,可以用 10 种区别的乐器生成 4 分钟的音乐作品,并且可以结合从乡村到莫扎

特到披头士的风格。这是 OpenAI 将生成模型从自然语言处理领域拓展到其它领域开

始。

2020

2020 4 14 日,OpenAI 发布了 Microscope,这是一个用于分析神经网络内部特

征构成进程的可视化工具,也是 OpenAI 为了理解神经网络模型所作出的努力。

2020 5 28 日,OpenAI 正式公布了 GPT⑶ 相关的研究结果,其参数高达 1750

亿,这也是当时全球最大的预训练模型,同年 9 月,GPT⑶ 的商业化授权给了微软。

2020 6 17 日,OpenAI 发布了 Image GPT 模型,将 GPT 的成功引入计算机视觉

领域。

2021

2021 1 5 日,OpenAI 发布 CLIP,它能有效地从自然语言监督中学习视觉概念。

CLIP 可以利用于任何视觉分类基准,只需提供要辨认的视觉种别的名称,类似于

GPT⑵ GPT⑶ "zero-shot "能力。

2021 1 5 日,OpenAI 发布了 DALL·E 模型,其为 120 亿个参数的 GPT 3 版本,

它被训练成使用文本-图象对的数据集,从文本描写中生成图象。

2021 8 10 日,OpenAI 发布了 CodexOpenAI Codex 一样是 GPT 3 的后代;它

的训练数据既包括自然语言,也包括数十亿行公然的源代码,包括 GitHub 公共存储

库中的代码。OpenAI Codex 就是 Github Coplilot 背后的模型。

2022

2022 1 27 日,OpenAI 发布了 InstructGPT。这是比 GPT 3 更好的遵守用户意图

的语言模型,同时也让它们更真实,且 less toxic

2022 3 15 日,OpenAI 新版本的 GPT⑶ Codex 发布,新增了编辑和插入新内

容的能力。

2022 4 6 日,DALL·E2 发布,其效果比第一个版本更加逼真,细节更加丰富且

解析度更高。

2022 6 23 日,OpenAI 通过视频预训练(Video PreTrainingVPT)在人类玩

Minecraft 的大量无标签视频数据集上训练了一个神经网络来玩 Minecraft,同时只使

用了少许的标签数据。通过微调,该模型可以学习制作钻石工具,这项任务通常需

要熟练的人类花费超过 20 分钟(24,000 个动作)。它使用了人类原生的按键和鼠标

运动界面,使其具有相当的通用性,并代表着向通用计算机使用代理迈出了一步。

2022 9 21 日,OpenAI 发布了 Whisper,这是一个语音辨认预训练模型,结果

逼近人类水平,支持多种语言。

短时间来看,ChatGPT仍存在诸多不足,亟待解决的问题主要有两方面:合规性问题和技术性问题

技术性问题

1. ChatGPT产生的答复会不会产生相应的知识产权?

2. ChatGPT进行数据发掘和训练的进程会不会需要取得相应的知识产权授权?

3. ChatGPT是基于统计的语言模型,这一机制致使回答偏差会进而致使虚假信息

传播的法律风险,如何下降其虚假信息传播风险?

合规性问题

1. ChatGPT的回答可能过时,由于其数据库内容只到2021年,对触及2022年以后,或

者在2022年有变动的问题无能为力

2. ChatGPT在专业较强的领域没法保证正确率,即便在鸡兔同笼此类低级问题中依然存在

毛病,并且英文回答和中文回答存在明显差异化

3. ChatGPT对不熟习的问题会强行给出一定的答案,即便答案明显毛病,仍然会坚持下

去,直到明确戳破其粉饰的内容,会立马道歉,但本质上会在不熟习的领域造成误导






                     

ChatGPT相关资讯

ChatGPT热门资讯

X

截屏,微信识别二维码

微信号:muhuanidc

(点击微信号复制,添加好友)

打开微信

微信号已复制,请打开微信添加咨询详情!