月亮链 月亮链
Ctrl+D收藏月亮链
首页 > BNB > 正文

ALL:颠覆想象的AI绘画:Dall-E 2使用指南_NAI

作者:

时间:1900/1/1 0:00:00

围绕OpenAI推出的第二代DALL-E 2系统的讨论一直处于两极分化的状态,甚至在其推出了几个月后依旧如此。

有用户认为这是一项可以重新定义艺术的突破性创新,而批评者则将其视为人工智能图像生成器给创意产业带来厄运的开始。

然而毫无疑问的是,DALL-E 2为我们创造和消费艺术开辟了新的可能性和挑战。本文详细介绍了AI图像生成器DALL-E 2的用法和缺点。

DALL-E 2是一款人工智能图像生成器,它可以根据自然语言的文本描述创建图像和艺术形式。换句话说,它是一个根据文本生成图像的人工智能系统。

2021年1月,OpenAI推出了DALL-E模型,DALL-E 2是其升级版。“DALL-E”这个名字源于西班牙著名艺术家Salvador Dalí和广受欢迎的皮克斯动画机器人“Wall-E”的组合。

2022年7月,DALL-E 2进入测试阶段,可供白名单中的用户使用。同年9月28日,OpenAI取消了白名单的要求,推出了任何人都可以访问并且使用的开放测试版。

贝莱德高管:区块链技术具有“令人难以置信的”颠覆性和创新性:6月24日消息,投资巨头贝莱德 (BlackRock) ETF 和指数投资全球负责人 Salim Ramji 在最近接受 Financial News 采访时对区块链给予了高度评价,称这项技术是比特币和其他加密货币的基础,具有“令人难以置信的”颠覆性和创新性。这位高管强调了区块链提高金融市场效率的潜力。Ramji 表示,尽管富达 (Fidelity)等主要金融公司已经提出了他们的 ETF 申请,但贝莱德仍然无意推出自己的比特币产品,因为该公司希望在质量和监管合规方面达到预期。[2022/6/25 1:30:19]

与最初的DALL-E一样,DALL-E 2也是一种语言生成模型,它使用文本提示来创建原始图像。

尽管和之前DALL-E具有的120亿个参数的模型不同,DALL-E仅仅具有大约35亿个参数,但DALL-E 2生成的图像分辨率是DALL-E的四倍,这是一次令人印象深刻的升级。同时,DALL-E 2在真实感和字幕匹配方面似乎也做得更好。

听起来,DALL-E 2很有未来感,可能会让新用户望而生畏,但它使用起来非常简单。我们不进行详细介绍,仅通过迷你教程为大家提供快速概览。

金色相对论丨郭宇:以太坊提出的无状态客户端协议可能是最具颠覆性的新架构:在今日举行的金色相对论中,针对“以太坊目前采用的无状态以太坊、多客户端、信标链staking、rollup等技术,给各位印象最深刻、认为最有应用价值的是哪一个?”的提问,安比实验室创始人郭宇发言指出:个人非常看好路印的 DEX 系统以及 zkRollup 技术。zkRollup 是一个一般性的区块链扩容架构,完全可以移植到其它公链或者区块链平台中。并且对于底层平台的要求并不高。只要区块链底层平台能支持相关的密码学原语,主要是零知识证明原语,然后就可以支持 zkRollup。

除此之外,个人认为以太坊提出的无状态客户端协议有可能是未来最具颠覆性的新架构。区块链验证节点不再需要存储区块,通过零知识证明来实现交易的验证和打包。这将打开更广阔的想象空间。目前这一技术的相关理论还是快速迭代过程中,相信很快这一技术就可以在一些试点场景中得到应用。[2020/6/18]

首先,登陆DALL-E 2的官网并创建一个帐户,如果您此前已经拥有OpenAI的帐户,登陆即可。需要注意的是,系统会要求您提供电子邮件和电话号码以进行验证。

一旦帐户准备就绪,我们就可以开始生成图像。用户最多提供400个字符的描述性文本,AI艺术生成器将对其进行处理。根据测试,我们可以从文本提示中得到许多原创且有趣的结果。

声音 | 复星集团联合创始人梁信军:区块链即将颠覆行业生态系统的供应链优势:近日,复星集团联合创始人梁信军在香港科技大学发表演讲称,人工智能对全球生产力的影响,是未来两三年内就会发生的事情。在未来七八年内,另一个重大趋势是区块链技术的成熟。区块链即将颠覆行业生态系统的供应链优势,深刻改变企业和社会的组织形态。人工智能对全球生产力的影响,是未来两三年内就会发生的事情。在未来七八年内,另一个重大趋势是区块链技术的成熟。区块链即将颠覆行业生态系统的供应链优势,深刻改变企业和社会的组织形态。(复旦金融评论)[2019/9/12]

比如,我们输入“狼群在满月时嚎叫”就收到了如下的结果。

输入“一个3D渲染的罗马士兵正在休息”则获得了以下的图像。

DALL-E 2为AI图像生成器的质量提供了新的基准。它与之前的同类产品相比,能够更好地理解文本描述。

京杭区块链CEO徐海洋:区块链可以颠覆BAT:近日,京杭区块链CEO徐海洋接受采访时表示,“区块链不是简单的新软件技术,而是巨大的技术浪潮,我们应该更深入地参与其中。”对于现今互联网三巨头BAT的垄断地位,徐海洋认为,在区块链领域BAT也不见得有领先优势,区块链技术甚至可能颠覆BAT。“BAT在区块链影响力目前较小,也很难成为区块链巨头,就像以往的软件公司转型成互联网公司很难一样。互联网是中心化、传递信息,区块链是去中心化、传递资产和价值,这对互联网公司来说并不容易。”他说。[2018/2/26]

其卓越的自然语言理解能力可以更严格地控制图像的风格、主题、角度、背景、位置和概念,并获得更高质量的图像和令人印象深刻的艺术形式。

那么让我们来看看DALL-E 2的工作原理。

要了解AI图像生成器的工作原理,我们首先需要了解CLIP、先验模型和解码器扩散模型(unCLIP)。

什么是CLIP?CLIP指的是对比语言图像预训练,是DALL-E 2架构中最关键的模块。

该训练基于用户可以用自然语言教计算机不同图像之间如何相互关联,并由文本和图像编码器这两个神经网络组成。

文本和图像编码器都接受了大量不同的图像文本对集合的训练。该模型分析这些图像-标题对以创建称为文本/图像嵌入的矢量表示。换句话说,CLIP充当文本(输入)和图像(输出)之间的桥梁。

真格基金创始人徐小平:区块链+AI可能是未来五年最具颠覆性的创造性力量 中国要抓住这世界性、历史性机遇 :在2017钛媒体T-EDGE年度国际盛典上,徐小平发表演说:几年前是互联网+,但是未来五年一定是AI+。任何一家公司,如果你没有人工智能,如果你没有大数据支撑,你可能会被淘汰。虽然ICO叫停了,但是我认为区块链技术、比特币还会继续持续不断的发展,这是中国要抓住的世界性、历史性机遇。区块链的崛起有可能取代移动互联网的既有的各种技术。所以说,区块链技术+AI技术,可能是未来五年最具颠覆性、破坏性的创造性力量。[2017/12/15]

先验模型采用标题/CLIP文本嵌入,并以此为基础生成CLIP图像嵌入。

unCLIP则是使用CLIP图像嵌入生成图的原始CLIP模型的逆模型。DALL-E 2通过先验模型和unCLIP模型来创建输出。

下图大致概述了其基本过程。

如图所示,unCLIP模型创建了图像的“心理”表示。基于此,创建了原始图像。

这些“心理再现”保留了语义一致的核心特征和特点,例如“动物、物体、颜色、风格和背景等关键要素”。然而,因为扩散学习是变化的,每一次输出的图像也会有所不同。

请注意,上文只是DALL-E 2工作原理的简要表述,实现的技术细节和数学更加复杂,我们就不在这里赘述。如果您对DALL-E 2的技术规格感兴趣,可以参看OpenAI在今年早些时候发表的论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。

只要用户给出精确和具有描述性的文本提示,就可以通过AI艺术生成器得到多个高质量的图像,甚至在几秒钟的时间里实现画家或数字艺术家需要数小时甚至数天才能达到的质量水平。

用户可以免费查看所有这些视觉创意,无需支付场地费,也无需向创意人员和模特支付工资。

然而这也对我们的内容创作经济带来了一定的影响。

DALL-E 2使用自己对主题、风格、调色板和所需概念意义的“理解”,生成相应的图像。

每个图像最多可以产生四个变体。每一个都与原作的外观、感觉和意义相呼应,但又具有自己独特的风格。

您也可以在DALL-E 2中编辑图像,无需任何照片编辑经验。与Adobe Photoshop不同,使用DALL-E进行编辑非常简单。

例如,用户想要在火星上行走的宇航员的肖像中添加一只狗,只需要输入“在宇航员身后放一只狗”。同样,用户还可以要求程序通过放大和缩小来更改图像的视图框架,直到获得所需的结果。而就DALL-E 2的功能而言,这些只是冰山一角。

同时,根据设计,该系统无法生成涉及、血腥或元素的内容。也就是说,该程序有其合理的局限性和缺点。

DALL-E 2的输出质量很大一部分取决于用户提供的文本提示的质量,文本越具体,获得所需输出的机会就越高。然而,该系统有一些内在的局限性。

例如,当前它还不具有很精确组合性,尽管似乎会随着时间的推移而改善。这意味着DALL-E 2通常无法有意义地合并多个对象或对象属性,例如形状、方向和颜色。

同时在一些意料之外的情况下,有一些相对简单的文本,程序也可能无法充分执行。

例如,我们输入文本“一百只打扮成罗马士兵的青蛙在沙漠中行进”。即使我们尝试了多种提示变体,结果也不尽如人意。

另一个例子是当我们尝试相当简单的提示时,如“霸王龙骑着独轮车在艾菲尔塔前”。不知道为什么,程序拒绝画独轮车,取而代之的是自行车。而当我们从提示中删除“Eifel Tower”,产生预期图像则没有任何阻碍。

这些只是DALL-E 2局限性的几个例子。更令人担忧的问题本质上很复杂,可能会对公司及其用户造成严重不良影响。

OpenAI限定DALL-E 2不创建公众人物和名人的图像。事实上,它完全拒绝生成包含真实面孔或真人的图像,这是朝着防止滥用该程序迈出的重要一步。

随着DALL-E 2越来越受欢迎,版权侵权也可能成为一个大问题。OpenAI坚持认为,用户“获得了将他们使用DALL-E创建的图像商业化的全部权利,包括转载、销售和商品化的权利。”

然而,人工智能艺术生成器依赖于分析、学习人类艺术家的作品来创造艺术。因此,不能排除潜在的侵犯知识产权法的可能性,无论是否有意。

DALL-E 2完美吗?作为一项正在完善的项目,答案是否定的。

但是,正如机器学习的本质一样,随着时间的推移,该程序正变得越来越聪明,也越来越有能力。从纯技术的角度来看,DALL-E 2是AI技术演进的一大进步。

人们普遍认为人工智能系统在创意领域实际上无法超越人类,至少不会很快。但是DALL-E 2已经使这个论点受到了冲击。

然而尽管OpenAI已经采取了一系列措施来预测和防止DALL-E 2的潜在滥用,但这并非万无一失。在没有任何道德界限的情况下可以使用的AI系统将在多久后出现?需要我们保持警惕。

无论如何,我们都需要密切关注这个新兴行业。因为AI艺术生成器及其背后的技术只会在未来的岁月里变得更加普遍。

元宇宙之心

企业专栏

阅读更多

金色财经

金色财经 子木

金色早8点

去中心化金融社区

虎嗅科技

CertiK中文社区

区块律动BlockBeats

深潮TechFlow

念青

Odaily星球日报

标签:ALLDAL区块链NAIFNK walletDAL币区块链运用的技术中不包括哪一项内容Baby Doge Billionaire

BNB热门资讯
NFT:一图读懂Web3:DID行业的公司有哪些?_USD

报告:四分之一的游戏开发者对区块链技术感兴趣:金色财经报道,尽管加密货币、NFT和Web3等区块链技术越来越多地被投资者采用并扩展到主流,但游戏开发者似乎并不像以前那样热衷于它们.

1900/1/1 0:00:00
TER:一文对比去中心化社交协议 Nostr 和 Farcaster_AST

撰文:pourteaux长期以来,我一直在批评这样一种观点 : Twitter 是一个“城市广场”,在那里,适度管理被称为“审查”,用户有权成为平台会员,并成为受控制的受众.

1900/1/1 0:00:00
WEB:在Web3赚钱 你准备好了吗_WEBAI币

图片来源:由无界版图AI工具生成马克思在《哲学的贫困》一文中曾指出“手推磨产生的是封建主为首的社会,蒸汽磨产生的是以工业资本家为主的社会.

1900/1/1 0:00:00
RAMP:金色观察 | 加密自我托管现在有哪些出入金服务_ramp币创始团队

文/William M. Peaster,Bankless;译/金色财经xiaozou中心化加密交易所(CEX)托管着你的钱.

1900/1/1 0:00:00
JOE:拥抱 Arbitrum 的 Trader Joe 能否迎来第二春_Joey Inu

图片来源:由 无界版图AI 工具生成在与 Avalanche 生态系统共兴衰之后,Trader Joe 还是选择了扩展到 Arbitrum 上.

1900/1/1 0:00:00
EDA:金色观察 | Bankless:链上数据洞察FTX轰然崩塌影响_SQUIDGAMES

文/Ben Giove,Bankless;译/金色财经xiaozhou最近几天可以说是加密货币史上又一个黑暗时刻.

1900/1/1 0:00:00