chatGPT笔记 3.0
这篇主要内容分为两部份,第一是抄袭来的成品展现。第二是对langchain agent的介绍和在应用中的一个拓展的想法。
关于作品,代码我抄的。但是也算是我对结合某种前端和GPT的一个阶段成果吧。由于对depolyment的不了解…目前这个作品只能在local server上运行,我尝试着deploy到streamlit的网站上,但是总是由于data leak的问题报错…这个问题一直没得到解决。有利害的朋友希望可以帮我解答一下。先谢过。所以本篇或者以图片的情势来介绍目前这个作品好了。
1.ChatPDF 网页
这个作品完全抄自Youtuber :Prompt Engineering ,有兴趣的朋友可以去看他的频道,他目前有一些比较基础的对GPT结合APP和网页的应用视频。
相信有很多朋友已尝试过plugin功能了,在最初上线的8页plugin app中,其中一个就是ChatPDF,也就是通过把本地PDF文件上传到网页上,对其进行发问,搜索,或总结。我的这个作品,完全抄袭ChatPDF,在功能上没有创新。下面是我的主页。
左侧是一个简单的页面介绍,和我的个人信息,右侧是一个可以放置PDF文件的loader,点击就能够放入任何PDF文件(200m以下),并且通过大语言模型进行分析解答。那我们现在放入一个文件。我随意找了一个特斯拉2023年Q1的简单财报放在里面。该Q1财报有一共29页的PDF文件,有效内容大概20页不到。下面是财报的简单展现。
Q1财报。整体就是数据+描写的情势。
这边当报告被上传后,就弹框出来问问题界面和可以对PDF文件提出问题了。举例为下面两个问题。
1.问题1:2023年q1的收入是多少
答: $2.513B。
这个答案啊是根据 Net income attributable to common stockholders (GAAP) 来回答的。
2.问题2:总结这个报告最重要的3个点,200字之内
1.特斯拉在2023年第一季度报告了强劲的财务事迹,营业利润率到达11.4%,营业收入到达27亿美元,净利润到达25亿美元。非通用会计准则下的净利润为29亿美元。
2.公司专注于快速增永生产、自动驾驶和车辆软件投资,并保持与增长投资计划的步调一致。他们认为今年是利用其作为电动车市场本钱领导者地位的独特机会。
3.特斯拉的能源贮存部署在2023年第一季度同比增长了360%,到达3.9千兆瓦时,太阳能部署同比增长了40%,到达67兆瓦。第一季度的服务和其他业务的营收和毛利润也创下了历史新高。但是,公司承认当前宏观经济和监管环境存在风险和不肯定性,包括供应链挑战和推延和高效制造产品的潜伏延迟。
上述就是这个作品的简单赘述了。下面是基于上面的framework可以进行拓展的一个作品的概述
2.关于对excel使用的拓展 – agent的使用
Langchain中比较核心的利用,功能被称作agent,上面对pdf的解读也是通过agent调用chatgpt3.5的模型进行的分析。并且调用agent非常简单,下面是关于csv文件的agent调用举例。
用这个一个code就能够load完成数据了。然后我们就能够对数据进行发问,或编辑了。下面是数据展现,数据编辑和数据分析的例子
数据展现:
从statscan拿的数据,主要是加拿大和26个主要国家的汇率记录,从2017年开始
1.数据编辑
这边我让他去除加币兑换澳大利亚币小于1的数据,并把剩下的数据乘10放在一个新的列,最后保存为一个新的csv file。
看看成果
嗯,怎样说,不尽人意。这边gpt把大于1的数据移除,而不是小于1。
2.数据分析
这边我问gpt关于这组数据中,哪一个汇率的浮动率最高。
这次他的答案非常准确,gpt理解了浮动率应当计算标准差来计算每一个数据,并且进行比较选出其中波动率最高的国家。
关于下个作品的想法,应当是基于pdf的framework然后接入csv agent的接口。这样,就算不懂数据编程方法,和数据分析代码的人,也能够用语言的方式对数据进行分析。这样就会大大的减少数据的学习曲线。这个进程,可以像编程一样,是一行一行的输入的,也就是每次输入都可以看到数据相应的变化,并对其进行下一次的编辑或更改。