OpenAI DALL·E Upgrade: Text-to-Image Generation and Second Creation(dalle openai theverge)
OpenAI DALL·E Upgrade:文本到图象生成和第二创作
摘要:OpenAI公布了DALL·E 2的最新研究论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。OpenAI的研究科学家Prafulla Dhariwal表示,DALL·E 2采取了从语言中提取的GPT⑶方法,并将其利用于生成图象。DALL·E 2能够将图象紧缩成一系列单词,并学会预测哪一个单词对应于特定的图象部份。这一技术的利用潜力引发了广泛的兴趣,并与Shutterstock的合作为其带来了更多的商业机会。DALL·E API的推出也使得企业能够利用这一技术为创意和营销带来更多可能性。
1. DALL·E 2对图象生成的新突破
OpenAI的研究科学家Prafulla Dhariwal表示,DALL·E 2是根据从语言中提取的GPT⑶方法进行改进的。这一方法将文本转换为图象的生成进程进行了改进。
与之前的版本相比,DALL·E 2能够将图象紧缩成一系列单词,并学会预测哪一个单词对应于特定的图象部份。通过这类方式,DALL·E 2可以更好地理解和生成与文本描写相关的图象。
2. 图象生成的限制与所有权
虽然DALL·E 2在图象生成方面获得了重大突破,但OpenAI制定了一些限制。根据OpenAI的规定,用户使用DALL·E生成的图象严禁用于商业用处和NFT交易。
另外,OpenAI在用户上传图象时取得了所有权,这意味着他们可使用用户上传的图象来改进模型。但是,用户只对自己上传的图象具有所有权。
3. DALL·E在社交媒体上引发的关注
由于其使人惊叹的图象生成能力,DALL·E在社交媒体上引发了广泛的关注。人们在Twitter上发起了#DalleMeme话题,共享和讨论使用DALL·E生成的创意图象。Reddit上也有专门的栏目weirddalle,吸引了大量关注者。
一些用户乃至每天都利用DALL·E生成创意图象,并通过这些图象积累了大量粉丝,成为社交媒体上的知名创作者。
4. 与Shutterstock的合作带来更广泛的利用
为了进一步推动DALL·E的利用,OpenAI与Shutterstock展开了合作。Shutterstock开始销售使用DALL·E 2 AI生成的库存图象,为用户提供更多选择。
这一合作不但为OpenAI带来了商业机会,还为DALL·E提供了更广泛的利用场景,并推动了AI技术在图象生成领域的创新和发展。
5. DALL·E API推出为企业带来更多可能性
除与Shutterstock的合作,OpenAI还推出了DALL·E API。通过这一API,企业可以利用DALL·E的文本到图象生成技术,为创意和营销带来更多可能性。
企业可使用DALL·E API生成与产品或服务相关的图象,增加创意和营销的效果。这为企业提供了更多利用AI技术的机会,进一步拓宽了营销和创造的边界。
综上所述,OpenAI的DALL·E 2是一项使人兴奋的技术升级,使得文本到图象生成更加出色。这一技术的利用潜力引发了广泛的兴趣,并与Shutterstock的合作为其带来了更多的商业机会。DALL·E API的推出也使得企业能够利用这一技术为创意和营销带来更多可能性。这些进展进一步推动了AI技术在图象生成领域的创新和发展。