ChatGPT「代码解释器」来了!图片秒变视频
↓推荐关注↓
转自:新智元
↓推荐关注↓
转自:新智元
【新智元导读】坐等3个多月,ChatGPT「代码解释器」终究全面开放了,一大波魔法来袭。
家人们,终究来了!
刚刚,ChatGPT「代码解释器」测试版正式向所有Plus用户开放。
OpenAI的科学家Karpathy对此还宣扬了一波,代码解释器测试版相当强大。
它是你的个人数据分析师:可以读取上传的文件、履行代码、生成图表、统计分析等等。我预计社区将需要一些时间来充分展现其潜力。
前段时间,GPT4能力降落在网上引发轩然大波,乃至有人只觉得它比GPT3.5强一点点。
而现在,代码解释器让人们再次感觉到,那个熟习而且强大的GPT⑷又回来了!
插件一上线,许多网友纷纭上手实测了一番。
功能解禁
那末,「代码解释器」究竟能做甚么?
30秒,图片变视频
这不,有网友竟用ChatGPT把图片变成了视频。这效果简直比Midjourney、Runway还炸裂。
这是怎么做到的?网友给出了全套教程。
第一步:打开「代码解释器模型」。要启用它,请进入设置 -> 测试版功能 -> 代码解释器。
步骤二:
从下拉菜单当选择「代码解释器」选项。然后,上传你想做动画的图片。
步骤三:
我想展现一家奢华餐厅的一些食品。因此,我要求ChatGPT将这个食品图片从左到右制作成动画。通过修改我的GPT提示(见下文),你可以创建你自己的动画。
具体prompt以下:
步骤四:
按回车键。30秒后,ChatGPT会给你一个视频的下载链接。
联合开创人Greg Brockman转发称,在不可能记住ffmpeg调用的情况下,用于图象转换的代码解释器。
事实证明,「代码解释器」确切很牛,现在截个视频,只需要一句话就可以弄定了。
「有一定内存容量限制,不过处理小文件是没问题了。刚扔给TA 4秒钟的gen⑵视频,截取前两秒,没问题,迅速弄定。
会自动实验适合的代码,如果要编程序也完全可以先扔给ta某一文件提出要求,然后看看ta提供出来的代码」。
PDF转图片
国内知名互联网科技博主「宝玉」用「代码解释器」实现了把PDF转成图片。
以往需要将每页内容合并成一张图,而现在,一个prompt就弄定了。
GIF变视频
图片变视频以外,还可以实现GIF变视频。
网友给ChatGPT的提示为:我上传一个GIF,你给我一个5s的MP4,用一个故事性镜头缓慢放大。
上传GIF
最后ChatGPT立即生成了视频
另外,ChatGPT还可以做个「矩阵」GIF出来。
生成QR码
在前两天,OpenAI宣布ChatGPT「代码解释器」行将全面开放。
就展现了一个能够生成QR码的例子,短短一句话,简直动嘴就可以完成任务。
「口袋」数据分析师
代码解释器最大的用例就是进行数据分析。
比如,让它分析各国预期寿命数据,世界上最大的城市,(可上传CSV、word、PDF或视频文件)
然后,与数据交谈,问任何你可能想问的问题。
或要求从数据中提取独特的随机趋势,以取得欣喜。
比如,从两个数据中找出独特的趋势,并以表格的情势显示出来。
最后一步,可视化。
把数据变成你想要的任何图表或图形。最重要的是,只需点击一下完成。
比如,生成一个散点图,说明一个国家的人均GDP和其平均预期寿命之间的关系。
看到这么强大「数据分析师」,网友又开始R.I.P了。
使用指南
「代码解释器」怎样用?来自沃顿商学院的一名教授Ethan Mollick专门为此写了一篇指南。
首先,Mollick就指出,Code Interpreter这个名字的起法延续了OpenAI给他们自己的产品起烂名儿的悠久传统。
由于——虽然说它叫「代码解释器」,但实际上它对那些根本不懂编程的人最有用。
本质上,「代码解释器」能让GPT⑷上传和下载信息,并为用户编写和履行程序,这使得AI能够做到之前没法做的各种事情。
具体来讲,它为AI提供了一个解决问题的通用工具箱(通过用Python编写代码)、超大内存(最大100MB,可以是紧缩情势),且用户可以把这个工具箱集成到AI里面,发挥LLM的优势。
这有助于解决之前版本的 ChatGPT 存在的许多问题。比方说,
它允许AI处理数学(哪怕很复杂),还可以更准确地处理单词(例照实际计算段落中的单词),底层缘由就是,它可以编写Python代码来解决LLM在数学和语言方面的天然弱点。
比如像下图这样。
可以看到,「代码解释器」能准确计算出段落中单词的数量。
另外,「代码解释器」下降了幻觉和瞎编乱造的产生机率。
当人工智能直接使用Python时,代码有助于让它「诚实」。道理也很简单,如果代码不正确,Python就会报错。由于代码操作的是数据,因此AI不会在数据中插入毛病信息。
固然,这其实不完善。AI依然有几率会产生幻觉,但其实这其实不常见,并且不太可能影响到代码或数据本身。
这样一来,AI就更加靠近通用人工智能了——大量问题可以通过代码来解决。
而且,GPT⑷非常善于以新颖有趣的方式来决定甚么时候用「代码解释器」。
Mollick举了个例子,假设他让GPT⑷向用户证明地球是圆的,那末就会用上「代码解释器」,提供了多个论证,将文本与代码和图象结合在一起。
此前,各个专业需要编程的人都得会点儿写代码,但写完了还得自己调试。就算之前的AI能提供点儿帮助,但是对没有Python学习基础的人来讲,或者挺难,得借助AI的气力反复修改代码。
而现在,有了「代码解释器」,AI就可以自己纠错并且Debug了!
接着,Mollick又讲了怎么用「代码解释器」来处理数据,这算是真实戳中大量用户痛点了。
Mollick表示,「代码解释器」的运行水平非常先进,可以自动处理许多复杂的定量分析,并且能够采取非常复杂的数据方法。
用户只需点击加号便可轻松上传数据,乃至是ZIP文件等紧缩数据。
同时,在提供数据时,用户能给个prompt就最好了。然后,AI就能够从上下文里找出数据含义和结构了!
另外,Mollick指出,在使用「代码解释器」时,用户更多的是在和AI进行「对话」,其实不需要挖空心思写一个又严谨又凝炼的prompt出来。
就像和一个数据分析师聊天一样,和人怎样交谈,就怎样跟「代码解释器」沟通。
但是这里有两个特殊情况,或者需要写个类似prompt的东西。
一个是AI有时候会不记得自己能干甚么,此时就需要一个prompt来给AI点醒。
比如:「你可以制作GIF,请尝试一下。」
另外一种情况是在用户对结果不满意的时候,可以通过prompt来让「代码解释器」对结果进行优化。
比如:「请对该结果进行进一步的测试」,或,「能不能让这个图表更好一点」。
在加载完数据以后,GPT就能够履行数据合并和清算的操作了。具体处理方式相当复杂,但就像上面所提到的一样,只要把「代码解释器」当作一个和你面对面的数据分析师就行了。
同时,Mollick提示广大用户,AI在自我纠错并改正以后最好或者查一下结果,万一出错呢。
紧接着Mollick实操了一下,他让「代码解释器」弄个预测建模出来,预测超级英雄可能会有甚么超能力。
可以看到,「代码解释器」构建了一个随机森林散布器。
固然,在实操进程中,用户或者得和GPT「多沟通」。Mollick就不想让AI用数值数据的方法来估算缺失的数据,Mollick想直接放弃掉没有的部份。
但他指出,也能够和GPT说,让它换个别的处理方法。
以后,Mollick给GPT输入了一个「你可以进行另外一个复杂和有趣的分析吗」的prompt。他表示,「代码解释器」选择的一些分析方法让他印象深入。
就像下图这样。
「代码解释器」奇妙地分析了超级大国的网络情况。可以看到,方法多样,而且非常成心思。
「代码解释器」最使人印象深入的应当就是其推理能力了。Mollick概括为,非常「人性化」。
另外,可视化的交互性水平仍然在线,且在不断提升。用户可以不断让AI来改进或更改输出的内容。
Mollick让AI创建了一个交互式表格,包括6个图表,其中还有一个是3D的。
为了让图表更加美观,Mollick不断输入prompt,调剂结果。
终究成果就像下图右侧这样。
十大惊人魔法
网友@GPTDAOCN近日总结了ChatGPT十大使人震惊的用例:
代码解释器的可视化
1. 将GIF转换为MP4:可以将动态图片(GIF)转换为视频文件(MP4)的功能,使你更方便地分享和使用。
2. 创建各种图形:你可以利用这个功能来生成各种如柱状图、折线图、饼图等图形,直观地显现和分析你的数据。
3. 从图象中提取色彩以创建PNG调色板:这个功能可以从任何一张图象中提取主要色彩,然后生成一个PNG格式的调色板。
4. 清洗数据以生成深入的可视化:如果你有一些混乱的数据,这个功能可以帮你进行清洗和整理,再将其转换为清晰的可视化图形。
5. 将CSV文件转换为GIF:这个功能可以将CSV(逗号分隔值)文件中的数据以动态的方式展现,生成一张GIF图。
6. 分析歌单以概括你的音乐品味:你可以利用这个功能来根据你的音乐歌单进行分析,从而概括你的音乐品味。
7. 将你的数据集转换为一个完全功能的HTML网站:这个功能能将你的数据快速转换成一个功能齐全的网站,方便你进行展现和分享。
8. 创建可下载的股票数据集:这个功能能帮你创建一份股票数据集,并且这个数据集是可以下载的,方便你进行更深入的分析和研究。
9. 将图象转换为文本文件:如果你需要从图象中提取文字,这个功能可以帮你将图象中的文字转换成文本文件。
10. 对未格式化的数据进行详细分析:对那些没有规定格式的原始数据,这个功能能帮你进行深入的分析,以获得有价值的信息。
其实,代码解释器的用例远不止这些。
网友点评
我正在尝试ChatGPT代码解释器。到目前为止,我只能建议「每一个开发者现在就开始研究它」。
Code Interpreter断了多少人的生路?太多行政每天低效力的处理数据,现在只需要自然语言就能够办公自动化。
- EOF -
主页君平常还会在个人微信分享Python相关工具、资源和精选技术文章,不定期分享一些成心思的活动、岗位内推和怎么用技术做业余项目
加个微信,打开一扇窗
1、重磅,GPT⑷ API 全面开放使用!
2、一些 Python 代码加速工具!
3、Python 命令补全工具 argcomplete
觉得本文对你有帮助?请分享给更多人
推荐关注「Python开发者」,提升Python技能
点赞和在看就是最大的支持❤️