OpenAI DALL·E升级:文本生成图象能力升级,新增二次创作功能(dalle openai theverge)
摘要:
OpenAI发布了DALL·E 2的研究论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》,研究科学家Prafulla Dhariwal是共同一作,他表示该模型的图象生成能力得到了升级。DALL·E 1是使用GPT⑶方法从语言中提取信息,并将其利用于图象生成的模型。图象会被紧缩成一系列单词,并且模型能够学习预测这些单词从而生成图象。
正文:
OpenAI最近发布了DALL·E 2的研究论文,这一消息引发了广泛的关注。DALL·E是OpenAI研究团队开发的一种图象生成模型,它可以根据给定的文本生成对应的图象。在DALL·E 1中,使用了GPT⑶的方法从语言中提取信息,并将其利用于图象生成。具体来讲,图象被紧缩成一系列单词表示,并且模型学习如何预测这些单词来生成图象。
DALL·E的发布引发了用户和企业的广泛兴趣。其强大的图象生成能力使得它在创作艺术、设计和媒体等领域具有重要意义。人们可以通过提供文字描写,让DALL·E生成对应的图象,这为创意和设计工作提供了便利。
但是,需要注意的是,DALL·E生成的图片遭到版权保护。OpenAI明确表示,商业使用需要取得相应的授权。用户只对自己上传到系统的图片具有所有权,而由DALL·E生成的图片则归OpenAI所有。
在社交媒体平台上,一些用户发起了#DalleMeme话题,有人还在Reddit上开设了专栏weirddalle,将DALL·E生成的达利风格meme图分享给大家。这些图象的独特性和对达利风格的模仿引发了用户的关注,一些账号因此积累了大量的粉丝。
DALL·E还与Shutterstock合作,使得DALL·E生成的艺术作品得以在网上广泛传播。Shutterstock表示愿意接受基于AI生成的艺术作品,这为DALL·E生成的图片提供了更多展现的机会。
媒体对DALL·E的关注度也愈来愈高。The Verge等媒体对DALL·E进行了报导,OpenAI也向The Verge确认了一些有关DALL·E的细节。但是,至今为止,该模型的具体工作原理依然是一个谜。
为了让更多的人能够使用DALL·E的图象生成功能,OpenAI开放了DALL·E API,为企业提供了AI文本到图象生成的能力。
总之,DALL·E作为OpenAI研究项目的重要成果,对推动AI技术在图象生成方面的发展具有重要影响。它不但在创意和设计领域具有潜力,还可以够为艺术和媒体等行业带来新的可能性。