OpenAI发布最新 AI 绘画模型DALL·E 3,集成ChatGPT并提升细节效果
利用 DALL · E 生成的 AI 图像(图片来源:OpenAI)
OpenAI 又公布了最新重磅消息。
北京时间 9 月 21 日凌晨,美国 OpenAI 公司宣布,文生图 AI 工具迎来了第三个版本 DALL · E 3,比上个版本仅过去 17 个月左右。
OpenAI 表示,DALL · E 3 比以往系统更能理解细微差别和细节,让用户更加轻松地将自己的想法转化为非常准确的图像。同时,DALL · E 3 还将与 ChatGPT 集成,原生实现多模态输出,Plus 和企业版用户通过文本就能直接在 ChatGPT 中生成各种类型图片,不仅加强提示词的生成图像体验,而且增强模型理解用户指令的能力,图像效果也有巨大提升。
OpenAI 公司 CEO 奥特曼(Sam Altman)表示,在他看来新的 DALL · E 3 效果相当惊人,它将在接下来的几周内向所有 ChatGPT Plus 付费版 / 企业版用户开放。" 如果不尝试的话,很难理解这是多么了不起的事情。"
据悉,OpenAI 成立于 2015 年,致力于开发和应用人工智能(AI)技术造福全人类。目前,OpenAI 公司估值高达 270 亿美元左右,年营收已接近 10 亿美元。
2021 年,OpenAI 推出了 DALL · E 和 CLIP(对比图文预训练),能连接文本与图像的神经网络。其中,DALL · E 基于文本直接生成图像,而 CLIP 是一个单独的模型,其作用是理解输出图像并为其打分。DALL · E 生成的图像由 CLIP 模型进行筛选,以呈现最高质量的图像。
2022 年,OpenAI 升级了文生图能力,发布 DALL · E 2,提供了更高的图像分辨率、更低的延迟以及编辑原始图像的能力。而且公开报道现实,DALL-E 模型是 GPT-3 的多模态实现,共拥有 120 亿个参数,使用从网络上收集的文本和图像对进行训练。而且使用零样本学习从描述和提示中生成输出,而无需进一步训练。
剑桥大学机器学习教授尼尔 · 劳伦斯(Neil Lawrence)曾认为,DALL · E 这类模型有能力存储世界信息,并以人类认为非常自然的方式进行推广。佐治亚理工学院交互计算学院副教授马克 · 里德尔(Mark Riedl)则认为,DALL · E 的演示结果表明它能够协调地融合概念,这是人类创造力的关键要素,同时他指出 DALL-E 绘制的插图比过去几年其他的 Text 2 Image(由文本生成图像)系统要出色许多。
时隔 500 多天后,此次发布的 DALL · E 3 拥有多个新特性,钛媒体 App 简单梳理如下:
DALL · E 3 具备更强大的图像细节和差异识别能力,使用户更易将想法转化为准确的图像,并解决了之前版本 DALL · E 不会写字的问题。
DALL · E 3 的一个主要特点是与 ChatGPT 的集成。此集成允许用户更简单地创建 prompt(提示词),因为当输入一个想法时,ChatGPT 会自动为 DALL · E 3 生成详细的 prompt。
DALL · E 3 在图像质量和对 prompt 的准确性上都有所增强。相比于上一代,新版本更能理解文本的上下文和更长的 prompt,处理效果更佳。
安全性方面,OpenAI 在 DALL · E 3 上制定了强有力的安全措施,以防止创建有害图像,它也不能生成公众人物的图像。同时,DALL · E 3 不会生成在世的艺术家的风格图像,避免了之前版本中的争议,而艺术家可以提交自己的作品并要求从未来的文本到图像 AI 模型中移除,保证其版权不被侵犯。
DALL · E 3 计划在 10 月先向特定用户发布,并计划在秋季向研究实验室及其 API 服务发布。OpenAI 还未明确是否会发布免费的公开版本。
简单来说,利用 ChatGPT,新的 DALL · E 3 实现了更准确的图像生成能力,更好的体验效果,以及更安全的文生图规范。
OpenAI 研究员 Sandhini Agarwal 表示,她对 DALL · E 3 的安全性 " 高度有信心 ",并表示该模型在不断改进。
值得一提的是,目前,国内外已经有多个对标 DALL · E 的文生图模型 AIGC 公司和应用,其中包括独角兽公司 Stability AI 的开源文生图模型 Stable Diffusion,Midjourney,英伟达的 Perfusion 模型,阿里巴巴的通义万象,智源研究院的开源双语模型 AltDiffusion,HiDream 智象未来的 Pixeling(千象),阿里大文娱旗下妙鸭相机,网易伏羲旗下模型丹青等。
然而,当前 AI 生成的图像仍存在一些问题。华盛顿特区一家法院 8 月裁定,根据美国法律,未经任何人工输入而由人工智能创作的艺术作品不能获得版权。
当前,OpenAI 仍面临多起诉讼。其中,美国作家贸易组织代表约翰 · 格里沙姆(John Grisham)和《权力的游戏》小说家乔治 · 马丁(George RR Martin)等作家起诉该公司,指控 ChatGPT 非法训练学习他们的作品。
(本文首发钛媒体 App,作者|林志佳)
同类文章排行
- 关于印发《企业会计准则解释第17号》的通
- 案例展示二
- 案例展示四
- 案例展示七
- 视频展示三
- 王健林又悄悄卖了几家万达广场!保险、信托
- 【热岗/编制】南宁市疾病预防控制中心/实
- 为什么互联网产品越来越难做了?
- 生产基地三
- 贯彻《全民科学素质行动规划纲要(2021
最新资讯文章
- 出国留学硕士研究生推荐信范文
- 2021英国32所大学的A-level/
- 行业深度!一文了解2021年中国留学服务
- 国际商务
- 2022美术生就业前景最好的专业
- 加拿大留学最好的大学有哪些学校
- 新西兰留学买教材怎样省钱
- 英语本科生必须要过英语专业八级吗
- 最新出国留学推荐信范文_1
- 英语专业留学读研英国几年
- 【分享】非985非211,30+岁换专业
- 申请攻读博士学位研究生相关模板资料(包括
- 商务英语专业就业前景和就业方向 毕业以后
- 出国留学介绍信英文
- 学摄影去哪留学好?重磅国家推荐
- 美术生出国留学哪里好_1
- 2024年新高考选科指南!(附上12种选
- 助力求职者端牢饭碗——从好就业到就好业
- 留学申请推荐信范文大全
- 教育部印发《关于深入推进学术学位与专业学