月亮链 月亮链
Ctrl+D收藏月亮链
首页 > DOGE > 正文

WEB:a16z:机器学习和零知识证明的制衡_区块链

作者:

时间:1900/1/1 0:00:00

原文标题:Checksandbalances:Machinelearningandzero-knowledgeproofs

原文作者:ElenaBurger

原文来源:a16zcrypto

编译:Kate,Marsbit

本文作者ElenaBurger,是a16zcrypto的交易合伙人,专注于游戏、NFT、web3媒体和去中心化基础设施。在加入团队之前,她在Gilder,Gagnon,Howe,andCo担任了四年的股票分析师。她拥有哥伦比亚大学巴纳德学院的历史学学士学位。

在过去的几年里,区块链上的零知识证明在两个关键目的上非常有用:(1)通过处理链下交易和验证主网上的结果来扩展计算受限的网络;(2)通过启用屏蔽交易来保护用户隐私,只有拥有解密密钥的人才能看到。在区块链的背景下,很明显为什么这些属性是可取的:像以太坊这样的去中心化网络如果没有对验证器处理能力、带宽和延迟无法维持的需求(因此需要有效性Rollup),就无法增加吞吐量或区块大小,并且所有交易对任何人都是可见的(因此需要链上隐私解决方案)。

但是零知识证明对于第三类功能也很有用:有效地验证任何类型的计算是否正确运行(不仅仅是EVM链下实例化中的计算)。这远远超出了区块链的范畴。

利用零知识证明的能力来简洁地验证计算系统的进步,现在使得用户可以从现有的每个数字产品(最关键的是机器学习模型)中要求区块链确保相同程度的不可信任和可验证性。对区块链计算的高需求激励了零知识证明研究,创建了具有更小内存占用和更快证明和验证时间的现代证明系统,使得现在可以在链上验证某些小型机器学习算法。

到目前为止,我们可能都体验过与一个极其强大的机器学习产品交互的潜力。几天前,我使用GPT-4帮助我创建了一个在国际象棋中不断击败我的AI。这感觉像是过去几十年机器学习领域所有进步的一个缩影:IBM的开发人员花了12年时间开发出DeepBlue,一个运行在32节点IBMRS/6000SP计算机上的模型,能够每秒评估近2亿步国际象棋,在1997年击败了国际象棋冠军加里·卡斯帕罗夫(GaryKasparov)。相比之下,我只花了几个小时,我只编写了很少的代码,就编写了一个能够战胜我的程序。

a16z Crypto建议开发人员在部署ERC-4626前使用其编写的标准属性进行测试:10月28日消息,a16z Crypto编写了代币化资金库标准(ERC-4626)的标准属性,并针对约100个ERC-4626 Vault测试了该属性,发现许多Vault未能遵循标准要求。

a16z Crypto表示,ERC-4626的创建旨在使协议整合更加容易,但调整现有Vault并不简单,每一个ERC-4626 Vault都必须准确执行标准的描述要求,这种复杂性很可能导致安全漏洞。因此 a16z编写了ERC-4626标准属性以捕捉要求中容易被忽视的细节差异,建议开发人员在部署前进行测试以检查潜在问题,Vault集成商也可以在将集成前检查给定的Vault是否符合标准。

根据介绍,ERC-4626于3月正式推出,目前支持该标准的协议包括 Balancer、Maple Finance、Yearn Finance V3、Convex等。[2022/10/28 11:52:25]

诚然,我怀疑我创造的人工智能能否在国际象棋中击败GaryKasparov,但这不是重点。关键是任何玩GPT-4的人都可能有类似的获得超能力的经历:不费什么力气,你就可以创造出接近或超过你自己能力的东西。我们都是IBM的研究人员;我们都是GaryKasparov。

显然,这是令人兴奋和有点令人生畏的思考。对于任何在加密行业工作的人来说,自然的冲动(在惊叹于机器学习可以做什么之后)是考虑潜在的中心化向量,以及如何将这些向量去中心化到一个人们可以透明地审计和拥有的网络中。目前的模型是通过吸收大量公开可用的文本和数据来构建的,但目前只有少数人控制和拥有这些模型。更具体地说,问题不是“人工智能是否具有巨大的价值”,而是“我们如何构建这些系统,使与之交互的任何人都能获得经济利益,如果他们愿意,还能确保他们的数据以尊重他们隐私权的方式使用。”

Web3音乐创作平台Arpeggi Labs完成510万美元种子轮融资,a16z Crypto领投:9月15日消息,Web3音乐创作平台ArpeggiLabs完成510万美元种子轮融资,a16z Crypto领投,1 confirmation、Palm TreeCrew、WndrCoVentures、Steve Aoki、3LAU、WyclefJean、DiscoFries、Electric FeelVentures、LouisBell、JoeZadeh、Audius Foundation、Shayne Coplan、Paul Veradittakit和Cooper Turley参投。Arpeggi为用户提供创作、发布和混合音频的Web3音乐创作平台,后续更新包括推出免费浏览器DAW、集成其它Web2和Web3音乐平台以及推出网站原生社交功能等。[2022/9/15 6:57:23]

最近,有一种声音呼吁暂停或减缓Chat-GPT等大型人工智能项目的进展。停止进展可能不是这里的解决方案:相反,更好的做法是推动开源模型,在模型提供者希望其权重或数据是私有的情况下,用链上和完全可审计的隐私保护的零知识证明来保护它们。如今,后一种围绕私有模型权重和数据的用例在链上尚不可行,但零知识证明系统的进步将使其在未来成为可能。

可验证和可拥有的机器学习

像我使用Chat-GPT构建的象棋AI在这一点上感觉相对良性:一个具有统一输出的程序,它不会使用侵犯有价值的知识产权或侵犯隐私的数据。但是,当我们想要确保我们被告知的模型在API后面运行时确实是运行的模型时会发生什么?或者如果我想将经过验证的数据提取到链上的模型中,并确保数据确实来自合法方?如果我想确保提交数据的“人”确实是人,而不是试图攻击我的网络的机器人,该怎么办?零知识证明,凭借其简洁地表示和验证任意程序的能力,是实现这一目标的一种方式。

Clockwork Labs完成2200万美元A轮融资,a16z领投:金色财经报道,区块链游戏公司Clockwork Labs宣布完成2200万美元A轮融资,Andreessen Horowitz(a16z)领投,Supercell、Baszucki、Roblox 创始人兼首席执行官 David Baszucki、CCP Games 首席执行官 Hilmar Petursson 和 Unity 联合创始人 David Helgason 等私人投资者参投。Clockwork Labs将利用这笔最新融资开发其社区沙盒大型多人在线角色扮演游戏 BitCraft,并为游戏、Web应用程序和Web3 APP革命性新数据库技术提供支持。[2022/6/17 4:33:49]

值得注意的是,今天,在链上机器学习环境中零知识证明的主要用例是验证正确的计算。换句话说,零知识证明,更具体地说,SNARK(简洁的非交互式知识论证),在ML上下文中因其简洁属性而最有用。这是因为零知识证明保护了证明者(及其处理的数据)的隐私不受窥探验证者的侵害。像全同态加密(FHE)、功能加密或可信执行环境(TEE)这样的隐私增强技术更适用于让不受信任的验证者对私有输入数据运行计算(更深入地探索这些技术不在本文的范围内)。

让我们退一步,从更高层次上理解你可以用零知识表示的机器学习应用程序的类型。(要想更深入地了解ZK,请参阅我们关于零知识证明算法和硬件改进的文章,JustinThaler关于SNARK性能的工作,或者我们的零知识标准。)零知识证明通常将程序表示为算术电路:使用这些电路,证明者从公共和私人输入中生成一个证明,验证者从数学上计算该语句的输出是正确的——而不获得关于私人输入的任何信息。

我们仍然处于在链上使用零知识证明进行计算实用验证的非常早期阶段,但算法的改进正在扩大可行的范围。以下是零知识证明在机器学习中的五种应用方式。

A16z合伙人引用名言回击Jack Dorsey:Web 3离胜利已经不远了:金色财经报道,针对Jack Dorsey发表的Web 3言论,a16z合伙人Chris Dixon再次做出回击,他引用名言称:“首先他们无视于你,而后是嘲笑你,接著是批斗你,再来就是你的胜利之日。”Chris Dixon表示,Web 3现在处于“被批斗”的阶段,暗示距离胜利已经不远了。[2021/12/21 7:54:18]

1.模型真实性:你希望确保某些实体声称已经运行的机器学习模型确实是运行过的模型。例如,可以在API后面访问模型的情况,并且特定模型的提供者有多个版本——比如,一个更便宜、不太准确的版本和一个更昂贵、性能更高的版本。如果没有证据,你就无法知道模型的提供者是否为你提供了更便宜的模型,而你实际上已经支付了更昂贵的模型(例如,模型的提供者想要节省服务器成本并提高他们的利润率)。

要做到这一点,你需要为模型的每个实例化单独的证明。实现这一目标的一种实用方法是通过DanBoneh、WilsonNguyen和AlexOzdemir的功能承诺框架,这是一种基于SNARK的零知识承诺方案,允许模型所有者向模型提交数据,用户可以将数据输入模型并收到已提交模型已运行的验证。一些构建在RiscZero(一种基于STARK的通用虚拟机)上的应用程序也支持这一点。DanielKang、TatsunoriHashimoto、IonStoica和YiSun进行的其他研究已经证明,可以验证ImageNet数据集上的有效推断,准确率为92%(与性能最高的非ZK验证ImageNet模型相当)。

但是仅仅收到提交的模型已经运行的证据是不够的。模型可能不能准确地表示给定的程序,因此希望提交的模型由第三方进行审计。功能承诺允许证明者确定它使用了一个已提交的模型,但它们不能保证关于已提交模型的任何内容。如果我们能够使零知识证明具有足够的可执行性来证明训练(参见下面的示例#4),那么有一天我们也可以开始得到这些保证。

a16z已投资至少32个加密初创公司和相关协议:2月2日,The Block发文更新硅谷顶级风投a16z的加密投资版图。根据其披露,截至目前,a16z的活跃投资组合包括至少32个加密初创公司和协议,横跨11个垂直领域。[2021/2/2 18:42:49]

2.模型完整性:你希望确保相同的机器学习算法以相同的方式在不同用户的数据上运行。这在你不希望应用任意偏见的领域非常有用,例如信用评分决策和贷款申请。你也可以使用功能承诺。为此,你将提交一个模型及其参数,并允许人们提交数据。输出将验证模型是否使用每个用户数据的提交参数运行。或者,模型及其参数可以公开,用户自己可以证明他们将适当的模型和参数应用于他们自己的数据。这在医疗领域可能特别有用,因为法律规定患者的某些信息必须保密。在未来,这可能会使医疗诊断系统能够从完全私密的实时用户数据中学习和改进。

3.证明:你希望将来自外部经过验证的各方(例如,任何可以产生数字签名的数字平台或硬件)的证明集成到一个模型或任何其他类型的链上运行的智能合约中。为此,你将使用零知识证明来验证签名,并将该证明用作程序的输入。AnnaRose和TarunChitra最近与DanielKang和YiSun一起主持了一集零知识播客,探讨了这一领域的最新进展。

具体来说,Daniel和Yi最近发布了一项工作,研究如何验证由经过验证的传感器拍摄的图像是否经过裁剪、调整大小或有限的编辑等转换——这在你想证明图像不是深度伪造而是经过某种合法形式的编辑的情况下很有用。DanBoneh和TrishaDatta也做了类似的工作,使用零知识证明来验证图像的来源。

但是,更广泛地说,任何经过数字认证的信息都可以进行这种形式的验证:正在研究EZKL库的JasonMorton(下一节将详细介绍)将其称为“给区块链眼睛”。任何签名的端点:(例如,Cloudflare的SXG服务,第三方公证员)都会生成可验证的数字签名,这对于证明来自受信任方的出处和真实性非常有用。

4.去中心化推理或训练:你希望以去中心化的方式进行机器学习推理或训练,并允许人们向公共模型提交数据。要做到这一点,你可以在链上部署一个已经存在的模型,或者构建一个全新的网络,并使用零知识证明来压缩模型。JasonMorton的EZKL库正在创建一种方法,用于提取ONXX和JSON文件,并将它们转换为ZK-SNARK电路。最近在ETHDenver的演示表明,这可以用于创建基于图像识别的链上寻宝游戏等应用程序,其中游戏的创造者可以上传照片,生成图像的证明,玩家可以上传图像;验证者检查用户上传的图像是否与创建者生成的证明充分匹配。EZKL现在可以验证多达1亿个参数的模型,这意味着它可以用于在链上验证ImageNet大小的模型(有6000万个参数)。

其他团队,如ModulusLabs正在对不同的证明系统进行链上推理的基准测试。Modulus的基准运行高达1800万个参数。在训练方面,Gensyn正在构建一个去中心化的计算系统,用户可以输入公共数据,并通过一个去中心化的节点网络来训练他们的模型,并验证训练的正确性。

5.身份证明:你想要在不损害他们隐私的情况下验证某人是独一无二的人。为此,你需要创建一种验证方法——例如,生物识别扫描,或以加密方式提交政府ID的方法。然后,你将使用零知识证明来检查某人是否已被验证,而不透露有关该人身份的任何信息,无论该身份是完全可识别的,还是像公钥那样的假名。

Worldcoin通过他们的身份证明协议来做到这一点,这是一种通过为用户生成唯一的虹膜代码来确保抗女巫攻击的方法。至关重要的是,为WorldID创建的私钥(以及为Worldcoin用户创建的加密钱包的其他私钥)与项目的眼睛扫描球在本地生成的虹膜代码完全分离。这种分离完全将生物识别标识与任何形式的用户密钥分离开来,这些密钥可能来自于一个人。Worldcoin还允许应用程序嵌入一个SDK,允许用户使用WorldID登录,并利用零知识证明保护隐私,允许应用程序检查该人是否拥有WorldID,但不支持个人用户跟踪(更多细节,请参阅这篇文章)。

这个例子是用零知识证明的隐私保护特性来对抗更弱、更恶意的人工智能形式的一种形式,所以它与上面列出的其他例子有很大的不同(例如,证明你是一个真正的人,而不是一个机器人,而不透露任何关于你自己的信息)。

模型架构和挑战

实现SNARK(简洁的非交互式知识论证)的证明系统的突破是将许多机器学习模型放在链上的关键驱动因素。一些团队正在现有的架构(包括Plonk、Plonky2、Air等)中制作定制电路。在自定义电路方面,Halo2已经成为DanielKang和JasonMorton的EZKL项目等在工作中使用的流行后端,。Halo2的证明时间是准线性的,证明大小通常只有几千字节,验证时间是常数。也许更重要的是,Halo2拥有强大的开发人员工具,使其成为开发人员使用的流行SNARK后端。其他的团队,比如RiscZero,则致力于一个通用的VM策略。其他人正在使用JustinThaler基于求和校验协议的超高效证明系统创建自定义框架。

证明生成和验证时间绝对取决于生成和检查证明的硬件,以及生成证明的电路的大小。但这里需要注意的关键是,无论所表示的程序是什么,证明的大小总是相对较小,因此验证者检查证明的负担是有限的。然而,这里有一些微妙之处:对于像Plonky2这样使用基于FRI的承诺方案的证明系统,证明大小可能会增加。(除非它被包装在一个基于配对的SNARK中,如Plonk或Groth16,它们的大小不会随着语句的复杂性而增长。)

这里机器学习模型的含义是,一旦你设计了一个证明系统,准确地表示一个模型,实际验证输出的成本将非常便宜。开发人员必须考虑最多的事情是证明时间和内存:以一种可以相对快速地证明模型的方式表示模型,并且理想的证明大小在几千字节左右。为了证明机器学习模型在零知识下的正确执行,你需要对模型架构(层、节点和激活函数)、参数、约束和矩阵乘法操作进行编码,并将它们表示为电路。这涉及到将这些属性分解为可以在有限域上执行的算术运算。

该领域仍处于起步阶段。在将模型转换为电路的过程中,准确性和保真度可能会受到影响。当一个模型被表示为一个算术电路时,那些前面提到的模型参数、约束和矩阵乘法操作可能需要近似和简化。当算术运算被编码为证明的有限域中的元素时,一些精度可能会丢失(或者在没有这些优化的情况下,使用当前的零知识框架生成证明的成本将高得离谱)。此外,为了精确起见,机器学习模型的参数和激活通常被编码为32位,但今天的零知识证明不无法在没有大量开销的情况下以必要的算术电路格式表示32位浮点运算。因此,开发人员可以选择使用量化的机器学习模型,其32位整数已经转换为8位精度。这些类型的模型有利于表示为零知识证明,但被验证的模型可能是高质量初始模型的粗略近似。

在这个阶段,无可否认,这是一场追赶游戏。随着零知识证明变得更加优化,机器学习模型的复杂性也在增长。已经有许多有前景的优化领域:证明递归可以通过允许证明用作下一个证明的输入来减少整体证明的大小,解锁证明压缩。也有一些新兴的框架,比如LinearA的Apache张量虚拟机(TVM)的分支,它改进了一个转译器,用于将浮点数转换为零知识友好的整数表示。最后,我们a16zcrypto乐观地认为,未来的工作将使在SNARK中表示32位整数变得更加合理。

“规模”的两种定义

零知识证明可通过压缩进行扩展:SNARK允许你使用一个极其复杂的系统(虚拟机、机器学习模型),并以数学方式表示它,以便验证它的成本小于运行它的成本。另一方面,机器学习通过扩展来扩展:今天的模型随着更多的数据、参数和GPU/TPU参与训练和推理过程而变得更好。中心化的公司可以以几乎不受限制的规模运行服务器:按月收取API调用费用,并支付运营成本。

区块链网络的经济现实几乎以相反的方式运行:鼓励开发人员优化他们的代码,使其在计算上可行(并且便宜)。这种不对称有一个巨大的好处:它创造了一个证明系统需要变得更有效的环境。我们应该推动在机器学习中要求区块链提供同样的好处——即可验证的所有权和共享的真理概念。

虽然区块链激励了zk-SNARK的优化,但计算的每个领域都将受益。

标签:WEBNARARK区块链METAWEB3PA价格NAR价格MARKS币区块链域名选什么后缀好

DOGE热门资讯
元宇宙:迪士尼裁员7000人 元宇宙研发部门遭整体解散_ETA

据《华尔街日报》报道,作为7000人裁员计划的一部分,迪士尼公司已经解散旗下的元宇宙部门。首席执行官RobertIger周一表示,迪士尼的裁员将于本周开始以控制成本并发展“精简”业务,而元宇宙部.

1900/1/1 0:00:00
GAME:Why Bring Games On-chain?从游戏核心乐趣漫谈全链游戏设计_GAM

作者:Simon,IOSGVentures前言任性地下个定义:全链游戏是使用智能合约构建,且coregameloop直接运行在区块链上的复杂应用.

1900/1/1 0:00:00
GWC:跨链对战GameFi领头羊GWC 用AI打造完美元宇宙_元宇宙专业委员会

元宇宙作为“宇宙”这样的宏大的概念并不是指代一种技术、一个产业,而是一个庞大的社会经济系统或者是虚拟世界。然而一个虚拟世界要建设谈何容易.

1900/1/1 0:00:00
区块链:美国议员提交更改链上交易的法案遭群嘲 有可能实现吗?_Libre DeFi

作者:Kason2023年2月9日,美国伊利诺伊州参议员RobertPeters悄悄地提交了一项名为《数字产权保护和法律执行》的法案,该法案要求:对于在州内发生的区块链交易,在收到法院命令后.

1900/1/1 0:00:00
元宇宙:元宇宙营销 被百事可乐玩明白了_PEPS

在百事一百多年的发展历史中,产品营销是绕不过去的部分,而其本质是打造声量、教育心智、销售产品?01?百事的元宇宙是跟风装样,还是真的有点东西?如果从爆发时间来看,“元宇宙”成为风口不过两年左右.

1900/1/1 0:00:00
以太坊:以太坊上海升级 DeFi 3.0的序章_DEF

出品:欧科云链研究院作者:毕良寰引言距离以太坊Shapella升级仅剩一天的时间!自2015年以太坊上线以来,它已成为世界排名第二的加密虚拟资产.

1900/1/1 0:00:00