DALL·E 2 是 OpenAI 发布的一种人工智能模型和上一代相比,DALL·E 2 的分辨率提升了 4 倍,从 256x256 提升到了 1024x1024,并且生成图像的准确率也更高它不仅可以生成图像,还能对现有图像进行二次创作。
DALL·E 2 基于 CLIP 建立,其训练数据由一个数据对(x,y)组成,其中 x 是图像,y 是相应的图像标题给定一张图像 x,z_i 和 z_t 为对应的 CLIP 图像向量和文本向量DALL·E 2 是一个两阶段的模型:一个给定文本标题生成 CLIP 图像嵌入的先验,以及基于条件图像嵌入生成图像的解码器。
先验 p(z_i|y)为生成在标题 y 条件下的 CLIP 图像向量,解码器 p(x|z_i,y)为在 CLIP 图像向量 z_i 和标题 y 的条件下生成图像 x将这两个部分叠加起来,可以得到一个生成模型 p(x|y) 。
它能够生成各种风格和场景的图像,例如以特定风格画某个主题的作品,或者生成具有特定特征的写实图像等同时,DALL·E 2 还可以从自然语言的标题中对现有图像进行编辑,在添加和删除元素时会考虑阴影、反射和纹理等因素。
不过,OpenAI 对 DALL·E 2 的功能进行了一些限制,主要包括:1. 阻止生成有害内容:通过从训练数据中删除暴力、仇恨或少儿不宜的图像,限制其产生这类内容的能力,并使用技术手段防止生成人脸的超写实照片,尤其是公众人物的。
2. 防止滥用:内容政策规定不允许用户生成暴力、成人或政治内容如果过滤器识别到可能违反策略的文本提示词或图像上传,系统将不会返回生成图像系统中还有自动化和人工监测系统防止滥用3. 基于学习的分阶段部署:OpenAI 一直与外部专家合作,并对一定数量的可信赖用户开放预览 DALL·E 2 的权限,这些用户可以帮助开发人员了解技术的能力和限制。
开发团队计划通过学习,迭代地改善安全系统,随着时间的推移邀请更多人参与预览目前 DALL·E 2 还处于研究状态,尚未正式对外提供 API如果你想了解更多关于 DALL·E 2 的技术细节,可以参考其相关论文:https://cdn.openai.com/papers/dall-e-2.pdf 。
同时,也可以通过申请加入等待列表来获取试用权限:https://labs.openai.com/waitlist 但需注意,使用时应遵守相关规定和政策
今天就分享到这里吧,德斯软件资讯是一个软件分享基地,其中包括红包软件有微信,钉钉,支付宝,陌陌,QQ,星星优选,小马易荟,福瑞祥,思语,close,云集购物,云货淘,慎语,云鹿,顺胜,安信,伊蓝贝,频道chat,爱果go,梵星途,火箭通讯,品冠,聚美,玖玖购,艾特,微信多开,微信分身,牛牛,红包透视,秒抢,单透软件,机器人,埋雷软件,红包尾数控制,爆粉,红包辅助,埋雷辅助,辅助外挂等一些红包强项外挂辅助软件功能免费下载使用。