ChatGPT来了,小火伴们准备好了吗
ChatGPT来了,悲观者说狼来了,由于很多工种可能被人工智能取代,乐观者说机遇来了,由于很多工种可能产生革命性变革。但不论外界怎样看待,作为垂直行业普通科技工作者,应当静下心来,去思考这项技术能给我们带来甚么?而不单单作为一个看客,让美好的事物和尖真个技术从我们的指尖淡然划过。
本杂文包括以下几个章节:
--------------------------------------------------------------------------------------
1)ChatGPT到底有多火?
ChatGPT由人工智能研究实验室OpenAI于2022年11月30日推出。上线短短5天,用户数量已突破100万。由于太过火爆,OpenAI不能不暂时关闭了用户的测试入驻窗口。据瑞银团体的一份报告显示,在ChatGPT推出仅两个月后,它在2023年1月末的月活用户已突破了1亿,成为史上用户增长速度最快的消费级利用程序。为了到达这个目标,电话用了75年,手机用了16年,网站用了7年,苹果公司的利用软件iTunes和AppStore分别用了6.5年和2年,社交软件Twitter、WhatsApp、Instagram、抖音分别用了5年、3.5年、2.5年和9个月。援用分析公司Similarweb的数据表明,2023年1月期间,ChatGPT平均每天大约有1300万独立访客,这一数据是2022年12月的两倍之多。
有专家正告称,ChatGPT作为AI软件,将席卷互联网带来一场革命,它可能使数百万人失业。作为ChatGPT前期投入最大受益者,2023年1月23日,微软宣布向ChatGPT开发者OpenAI追加投资数十亿美元,这是人工智能领域史上最大的一笔投资,而在之前不久,微软刚刚裁员1万人。
ChatGPT到底有多火,犹如酷热的夏天,赤脚站在北京的柏油路上,手持麦克,演唱费翔的歌曲“你就像那冬里的一把火熊熊火焰温暖了我的心窝.......”。
--------------------------------------------------------------------------------------
2)ChatGPT到底有多牛?
马斯克赞美它:“好得吓人”。库克赞美它:“不可思议”。黄仁勋赞美它:“堪比智能手机问世”。比尔·盖茨赞美它:“不亚于互联网的诞生”。它能做甚么?
ChatGPT可以几近完善的聊天(回答发问),这个才是本行,其它是它的副业。从副业的水平就可以窥见它的本行是多么专业。
ChatGPT可以掌握专业性很高的知识,明尼苏达大学的教授对它进行测试时,它通过了几项法学院考试,获得了C+的成绩。在考试中,它能准确背诵法律条文并正确举出案例。最近,该软件在宾夕法尼亚大学沃顿商学院的MBA考试中,得分也高于许多人,获得的成绩为B。
ChatGPT可以写代码,程序员有点怕怕了........
ChatGPT可以写文案,写演讲稿,以色列总统是全球首位使用ChatGPT写演讲稿的总统,开头“能够成为一个具有如此充满活力和创新的高科技产业的国家的总统,我很自豪。”、结尾“让我们不要忘记,正是我们的人性使我们真正与众区别。”
ChatGPT可以做题,美国发起一项在线调查,结果显示89%的学生用ChatGPT完成作业,48%的学生居然用于小考试。2023年2月17日,香港大学副校长(教学)何立仁向教职员和学生发邮件表示,校内制止在课堂、作业和其他评估中使用“ChatGPT”或其他AI相关工具。
ChatGPT还可以翻译、作曲、写视频脚本等,感兴趣的小火伴可以尝试用ChatGPT给红楼梦写续集、写个人年终总结........
这一代和下一代ChatGPT(听说参数还会增加100倍,远超人大脑细胞个数)到底能有多牛?那真是“小牛按门铃——牛到家了”。
--------------------------------------------------------------------------------------
3)ChatGPT的发展历程
ChatGPT发展其实不是风平浪静的。真可谓是“千淘万漉虽辛苦,吹尽狂沙始到金”。
2017年,谷歌大脑(Google brain)发表了一篇关于transformer架构的文章,文章名称《Attention is All You Need》,看名称真不像一篇科技文章,它强调Attention机制在人工智能中的作用,特别是自然语言处理中作用。transformer架构诞生了两大自然语言模型:BERT和GPT。BERT(谷歌)利用的是transformer架构的编码器部份,而GPT(OpenAI)利用的是transformer的解码部份。近年,BERT一直优于GPT,直到GPT3.5基础上发展出来了ChatGPT这一逆天大招。
关于谷歌和OpenAI恩怨情长,小火伴们可以更多了解一下人工智能战场上的血雨腥风。听说当年创造了Transformer结构的8位谷歌软件工程师中,目前唯一一名还留在谷歌,其余几人中,有的人选择离开谷歌各自创建公司,还有的人,去了OpenAI……
ChatGPT固然也是资金堆积起来的,据统计,从GPT进化到GPT⑶的进程也是模型体量增长的进程--参数量从1.17亿增加到了1750亿,预训练数据量从5GB增加到45TB,其中GPT⑶训练一次的费用是46万美元,总训练本钱1200万美元。除训练,推理也很花钱。有人估算,现在OpenAI运行ChatGPT的算力费用每天就有10万美元。在OpenAI困难的日子微软压宝OpenAI真是大白天踩了狗屎。现在微软bing(必应)已集成了ChatGPT,其全球下载量在一夜之间猛增10倍。想体验的小火伴,可以到某宝租个海外电话号以用于开通账号。
--------------------------------------------------------------------------------------
4)ChatGPT给我们的启示
①具有大量的知识和数据,是我们科研工作者的底气
人工智能寻求的是计算机摹拟人脑完成复杂的事情,从这个层面上来讲,ChatGPT就是一个超级大脑。ChatGPT这个超级大脑成功的缘由是具有了海量的语料,而语言其实就是人类知识的载体。固然ChatGPT的制造者也具有了把海量知识灌输给计算机的技术。
作为科研工作者,我们要常常翱翔于我们自己专业的专业文献和书籍中,获得大量的知识,并把知识转化为解决生产问题的代码程序和策略。多和同行、竞争对手交换,从他们的成功经验中获得给养并自主发扬光大。
②成功属于那些时刻准备成功、不忘初心的人
ChatGPT成功的背后有一个比马斯克还疯狂的人,他就是山姆·奥特曼。奥特曼有很多传奇的业绩,但最佩服的是他创办的OpenAI是一个非盈利机构,他持有的股分为0。他为何要这么做?为了保持初心。奥特曼的梦想,不是用一项技术让自己发财,而是用一项技术改变世界。
技术成功的背后也有资本投资的成功,这个公司就是微软。微软因风投了ChatGPT,一夜之间,市值暴涨800亿美元。这类资本成功的背后不单单是偶然,其实微软在人工智能领域虽然不如谷歌那末霸气,但也是人才辈出,在做投资决定之前必将是对技术有了很前沿的研究和跟踪。
作为科研工作者,技术是我们的看家本领,我们需要时刻了解全部行业的技术前沿发展,努力跻身前列,时刻准备着成功、不忘初心。
③磨刀不误砍柴工
ChatGPT和BERT一样诞生于2017年的文章,虽然只有短短五年,但对人工智能这个领域每天都在产生着不言而喻的变化。ChatGPT的成功离不开这几年的破釜沉舟、忍气吞声、苦练内功。
作为科研工作者,贵在坚持,延续坚持,占住自己的一技之长,傲视四周,不断攀登科技高峰,花越大力气磨刀,就会在金字塔尖上站的更稳更久。
④做好人工智能需要更大的魄力
虽然ChatGPT的技术细节还没有表露出来,但从其发展历程或者可以窥视一些的,现在的ChatGPT则是由效果比GPT3更强大的GPT⑶.5系列模型提供支持,这些模型使用微软Azure AI超级计算基础设施上的文本和代码数据进行训练。具体来讲,ChatGPT在一个开源数据集上进行训练,训练参数也是前代GPT2的10倍以上,还多引入了两项功能:人工标注数据和强化学习,相当于拿回了被GPT3去掉的微调步骤,实现了在与人类互动时从反馈中强化学习。也因此,我们得以看到一个强大的ChatGPT:能理解人类区别指令的含义,会甄别高水准答案,能处理多元化的主题任务,既可以回答用户后续问题,也能够质疑毛病问题和谢绝不适当的要求。
说的更通俗一些就是模型逐渐变大,标记数据逐渐变多,加上强化训练、多任务学习等技术策略。关于ChatGPT的标记数据是怎样来的,听说是很多劳工的成果(ChatGPT爆火背后,是一群时薪2美元的肯尼亚劳工)。
作为科研工作者,我们不但要学会利用人工智能,更要在自己的领域把它用好,拿出更多的勇气和蔼魄,在数据搜集、清洗、网络搭建、各种学习策略上下工夫。
总之,ChatGPT的成功预示着大数据和大模型的成功。各行各业开始布局大模型研究,拉开了新时期通用人工智能的序幕。传统模型研发和落地需要专业人工智能人员根据业务场景开发专用的模型,致使人工智能落地门坎高、本钱高、效力低。与传统“一模一景”区别的是从庞大、多类型的场景数据中学习,总结出区别场景、区别业务的通用能力,学习出一种特点和规律,成为具有泛化能力的模型库。所以大模型时期,大模型出现“出现”能力,人工智能生产范式产生转变,未来软件的大部份价值可以直接由大模型提供,只有剩余的一小部份由提示工程和业务领域提供,下降了人工智能落地的门坎、研发本钱,并提升了产出效力。
以上内容部份引自网络素材,部份引自2023年底行将出版书籍《小样本数据分析和应用--python机器学习实践》。