原文作者:Flashbots团队XinyuanSun
感谢AlejoSalles、HongboZhang、AlexObadia和KushalBabel对本文的反馈和审阅。
原标题:《关于加速EVM的几种方法,实现更好的可扩展性和更高效的MEV提取》
借助性能更高的以太坊虚拟机(EVM),我们可以实现更好的网络可扩展性和更高效的最大可提取价值(MEV)提取。本系列文章分析了几种加速EVM的方法,重点是并行化和共享数据冲突分析。
出于多种原因,以太坊虚拟机(EVM)的性能至关重要。首先,如果我们有更快的虚拟机,那么以太坊客户端将能够更快地处理和验证交易,从而让每个人都更容易运行一个完整的节点,并加强网络的去中心化和安全性。第二,作为以太坊上的MEV提取变得更加突出,我们需要使MEV提取更容易,以便从中获得的利润可以更均匀地分配,以防止网络经济集中化。性能更高的EVM通过帮助搜索者产生更有利可图的完整区块和中继以具有更好的延迟来实现这一点。这意味着建设者市场将变得更有效率,从而吸引更多的搜索者并使市场更具竞争力,这反过来又使人们更难以进行危及网络稳定性的重组。
为了通过向后兼容性和对共识规则或存储实现方式的最小更改来提高EVM性能,我们需要并行性。在本系列的第1部分中,我们认为需要并行EVM,并介绍实现它的一般方法,例如EIP648、EIP2930和推测执行。在第2部分中,我们研究了静态分析和形式化方法如何使EVM可并行化,具体来说,我们提出了两种实现并行化的简单算法。
OneKey Card 注册已恢复,目前正处于测试阶段:4月17日消息,硬件钱包OneKey发推称,OneKeyCard注册已恢复,目前正处于测试阶段。此前4月15日,OneKeyCard因大量用户涌入,新注册已暂停。OneKeyCard是一个虚拟Visa卡,支持微信、支付宝等支付渠道。[2023/4/17 14:08:28]
背景
去中心化对区块链安全至关重要:去中心化网络的参与者很难串通。理想情况下,这是通过尽可能多的单独方运行节点来验证正在进行的交易来实现的。然而,拥有个人电脑的普通用户通常需要3天以上的时间才能在以太坊上启动一个完整的节点。这种低效率的背后是以太坊的大存储容量,更具体地说是EVM的存储设计:
对于节点性能,EVM存储维护是一大瓶颈,目前占用了超过70%的事务处理时间。而对于另外20%+的实际EVM指令解释时间,最耗时的操作码是SLOAD,因为在涉及IO访问的大型数据库中,Merkletrie节点的随机访问。
Celsius:符合条件的托管用户将能够提取约94%的符合条件的托管资产:2月1日消息,加密借贷平台Celsius推特发文称:“Celsius提供了有关某些托管账户中某些资产即将进行的提款流程的更新。出于安全和监管原因,在处理任何提款之前,将要求合格用户使用某些所需信息更新其Celsius帐户。此时,符合条件的托管用户将能够提取约94%的符合条件的托管资产。符合条件的用户是否可提取余下的6%,将由法院稍后决定。符合条件的用户还将收到与取款活动相关的GAS和交易费用相关的特定信息。账户中没有足够资产来支付这些费用的合格用户将不允许提取其资产。符合条件的用户有望在2月15日左右收到来自Celsius的电子邮件和Celsius应用程序通信,告知他们的资格。”[2023/2/1 11:40:23]
那么,要在不影响去中心化的情况下扩展以太坊,我们能做些什么呢?
提出了几个方向:
无状态,它在以太坊节点中引入了角色分离,一些节点是“存储节点”,而另一些是“验证节点”。验证者节点将仅在验证块时接收部分存储。通过传输其合法性证明来确保存储的正确性。但这会产生额外的网络IO开销。解决方案是为以太坊存储使用新的数据结构,例如Verkle树来压缩存储验证证明。RainBlock,也是一个分离节点功能的提议。除了存储节点和验证节点之外,它还引入了一个特殊的IO-helper节点。这个提议遇到了同样的问题,即产生额外的网络IO开销,它使用他们称为DSM-tree的自定义数据结构解决了这个问题。分片类似于节点功能的垂直分离,将计算卸载到不同的网段。这些提议虽然很有希望,但都涉及对基础客户端或共识规则的重大改变。
作为正交方向,我们现在可以做的是使EVM并行。这有助于直接增加EVM的吞吐量,因此我们可以提高gas限制并在一个块中包含更多交易,从而提高每秒交易量(tps)。此外,这还可以横向帮助现有的可扩展性提议,如分片。
CZ:币安从一开始就有限制员工炒币的规则:金色财经报道,对于何一表示,币安在内部控制上特别严格,币安内部无论多么高级的员工,也不允许炒币,买入后必须持仓90天以上才能交易。CZ表示,币安从一开始就有这个规则,早期是30天,大约2年前,将其更改为90天。[2023/1/11 11:05:12]
高效的MEV提取
下图显示了可用于MEV提取的具有多个相关AMM交易的区块数量。作者仅在2021年5月之前从三个DeFi协议中对确定性单块MEV机会进行抽样,但结果令人震惊。
今天,MEV机会要复杂得多,典型的验证者在每个区块中看到超过10个MEV发射交易。
由于区块构建和捆绑利润优化是一个NP完全问题,而且我们有太多的MEV捆绑要考虑,因此蛮力是不现实的,区块构建者很难有效地生产最优的完整区块提议者建造者分离,巨型捆绑)。
对EVM并行化的研究可以帮助解决这个日益具有挑战性的捆绑合并问题。本质上,并行化算法设计的双重问题是理解冲突是如何在搜索包中发生的:它们都需要知道事务的共享数据访问信息。此外,并行EVM可以帮助完整的区块构建者进行更多的模拟,从而产生更有利可图的捆绑包。
并行化问题的细分
并行化EVM可能并不像看起来那么简单。像投机并发这样的幼稚解决方案已经表明,随着以太坊变得越来越拥挤,乐观执行的冲突率也会增加。仅就2017年的交易而言,冲突率已经高达35%。
OKX上线储备金证明页面,储备金率超100%:11月23日,据官方消息,欧易OKX今日宣布正式上线储备金证明(POR),所有用户可以在官网页面主动查询,对比OKX的链上钱包地址资产和默克尔树(Merkle Tree)内的用户总资产,从而验证其资产储备情况。据OKX官网查询显示,其BTC、ETH、USDT等币种储备金率均超过100%。[2022/11/23 8:01:07]
高冲突率表明我们需要设计更精细的并行化算法,这将需要更精确的存储访问信息。接下来,我们正式确定这些任务的范围。
设当前区块号为k,以太坊区块链的状态为s/k,顺序EVM的状态转换函数为δ(tˉ,s),它返回一个新的EVM状态给定的交易ˉt和状态s的列表。假设在列表ˉt中有n个事务,从txn_1到txn_n,顺序为
意味着我们只有在完成txni执行后才开始执行txnj?。
我们的目标是设计一个并行的EVM执行状态转换函数δp,例如δ(tˉ,sk?1?)=δp?(tˉ,sk?1?)。请注意,δ总是按照它们传入的顺序执行tˉ。而在δp?中,tˉ的执行没有按顺序。例如,在两个不同CPU内核上运行的两个事务可以同时完成执行,或者txnj?的执行将在我们开始执行txni?之前完成。
为了让我们获得一个好处,我们有两个作业要做:
加州将暂停BlockFi在该州的借贷许可证:金色财经报道,加州金融保护与创新部发布通知,暂停加密贷款机构BlockFi在该州的执照30天,等待对该公司的公告进行调查。该公司宣布,在FTX交易所崩溃后,它已停止客户取款。(the block)[2022/11/12 12:53:31]
1.为每个事务获取有关可能的共享数据冲突的信息。这意味着如果我们只在事务级别进行并行化,共享数据冲突将只是EVM存储,因为来自一个事务的信息可以溢出到另一个事务的唯一方式是通过存储。如果我们在更深层次上并行化,比如EVM操作码,那么我们得到的信息也将包括EVM堆栈和内存。
形式上,这意味着对于每个txni,我们都有一些关于其共享数据访问κ(txni?)的信息。此信息可以是任何东西,例如,κ(txni?)可以在交易调用的合约代码中返回一组存储位置文字。假设完美信息函数是k_perfect,那么我们推导出的κ是对Kperfect的估计。
2.基于信息的准确性,我们设计了我们的算法δp?(tˉ,sk?1?,κ),它现在将k作为附加参数。我们并行化的确切策略和抽象级别取决于k的精炼程度以及我们容忍冲突的程度。例如,有了关于每个事务的调用数据、堆栈、内存和存储的完美信息Kperfect?,我们可以设计一个在操作码级别并行化而没有冲突的δp?。
为简单起见,我们在这篇文章中只考虑事务级并行性。也就是说,我们假设κ仅包含有关存储访问的信息。我们将更精细的并行化模型留给以后的帖子。
我们意识到这种形式化不同于通常用于实现并行EVM所采用的形式。我们选择这种形式化的原因是,通过分离κ,我们可以轻松地将算法重新用于优化操作批处理和缓存等优化。
存储访问信息
要检索有关存储访问的信息,可以直接从手动输入中获取。例如,更改交易的传递方式并要求开发人员/用户列出他们将使用的地址的高估,或者像Solana或其他基于UTXO的链一样,让每笔交易都包含与之交互的帐户签名列表.这似乎是一个简单的解决方案,因为我们不会为κ的生成产生运行时开销并且始终可以确保其稳健性。但是这些方法至少需要更改客户端或在客户端之前实现一个附加层。此外,它们极大地改变了用户/开发人员的习惯,因此可能难以实施。
或者,来自Optimism的BenJones在一次演讲中提议,我们将工作外包给flashbots搜索者,因为他们需要在想出一个有利可图的捆绑包时以任何方式模拟交易。这种方法通过提供k=K_perfect来实现最佳精度,但它依赖于搜索者诚实地传递附加信息及其捆绑包,并且仅涵盖使用mev-geth的客户端。更重要的是,如果不设计一些额外的激励系统,就很难在像flashbots这样的无权限系统中执行。
另一个想法是在运行时之前使用推测生成的存储信息并将其缓存。因为这种方法是推测性的,所以收集到的存储信息是不健全的,在这种情况下,我们会退回到正常的存储访问。如果我们在Rainblock中进行节点功能分离,则此建议效果最佳。但如前所述,假定不存在。
另一个有趣的想法是形式化方法辅助字节码分析以实现高性能并行化,我们将在下一篇文章中介绍。其中一个例子是Forerunner,它与rawgeth相比实现了8倍的性能提升,也是基于推测执行的思想,并且与我们在第二篇文章中的方法最相似,因为它们也使用形式方法技术来帮助生成的κ。
并行化算法
在这个阶段,我们应该已经使用我们选择的任何方法获得了必要的共享数据访问信息κ。现在,出于演示目的,我们使用κ的特定示例。假设我们有两个事务txn_i<txn_j?都访问存储位置σ,我们将它们的访问信息记录为元组{(r,w),(r,w。的元组。第一个元组(r,w)表示txn_i的读/写操作,第二个元组表示txn_j的元组。例如,写入{(r),(r,w。表示txn_i?读取但未写入σ,而txn_j既读取又写入σ。
使用这种形式化,我们可以想到四种简单的情况:
{(r),(r。:txn_i和txn_j是可并行的,假设\sigmaσ只是这两个事务的“读取”集中的一个。
{(r),(w。:txn_i和txn_j必须按照tˉ的顺序依次执行。
{(w),(r。:txn_i和txn_j必须按照tˉ的顺序依次执行。
{(w),(w。:如果对s'的写操作是可交换的,那么txn_i和txn_j是可并行的,否则它们必须按照tˉ的顺序执行。
但是,txn_i和txn_j不仅访问σ,还访问更多位置,因此我们扩展了我们的四个简单规则,包括每个事务的读取集和写入集,并且在搜索要执行的可并行事务时,我们循环遍历每个事务的存储访问信息\kappaκ并应用上述规则。
或者,我们可以使用Vitalik在EIP648中描述的简单算法:每个事务都包含它访问的地址的集合β,如果两个事务txn_i和txn_j满足β_i∩β_j=?,则并行执行它们,否则不。
最终,这一切都取决于我们的κ有多精细,以及我们希望并行执行有多精细。例如,它可能不仅仅是二次的,这意味着我们的κ不仅包含存储访问信息,还包含内存/调用数据上的信息,因为我们也在单个事务中进行并行化。
当然,在这四种情况下,有很多复杂性。例如:{(w),(w。。在这种情况下,我们可能让txn_i先读取s'然后更改它,但分配给s'的值始终等于txn_j的分配值,因为智能合约是如何编写的。所以这有效地减少到{(r),(r。的情况。或者这很容易反其道而行之,简化为{(w),(r。,{(w),(w。或{(r),(w。。即便如此,也可能是编写器以某种方式不会更改存储的值,或者读取器不会影响EVM中的状态更改。
这些例子的重点只是说有很多特定类别的情况我们的并行化算法不能以最佳方式工作。所以这意味着根据κ的确切结构,我们有很多长尾优化设计截然不同的并行化算法以获得最佳性能。我们将在下一篇文章中回到精确的优化。
结论
EVM并行化促进了以太坊的吞吐量增加,而不会影响去中心化或需要对协议进行重大更改。并行EVM研究的采用和开放共享还有助于通过允许更多个人使用更好的捆绑合并和生产来最大限度地减少MEV的经济中心化。
在这篇文章中,我们探索了以太坊可扩展性解决方案的前景,并讨论了为什么当前的并行化技巧不能顺利运行。我们还通过将并行化问题分为两部分来展示我们对并行化问题的形式化:生成共享数据访问信息和设计利用该信息的并行化算法。
作者:娄底市区块链产业发展领导小组办公室执行副主任谢纬,国有资本投资运营有限公司总经理,湖南链城私募股权投资基金管理公司总经理.
1900/1/1 0:00:00证券日报记者:王?宁交割作为确保期现货价格趋合的重要环节,在价格发现和服务产业客户方面发挥着重要作用.
1900/1/1 0:00:00原标题:《以太坊的使命与多链时代》*以太坊L1将不再适合普通用户直接交互;以太坊L1会与各种DAO、跨链及跨层协议交互为主.
1900/1/1 0:00:00来源:财联社编辑卞纯华尔街分析师预计,耐克的股价今年将创下新高,部分原因在于其进军元宇宙的战略.
1900/1/1 0:00:00据CoinDesk1月19日消息,学生贷款和金融服务提供商SocialFinanceInc.(SoFi)已获得美国货币监理署(OCC)的有条件批准,以创建一家提供全面服务的国家银行.
1900/1/1 0:00:00原文:PolygonPolygonZero的任务很简单:使用零知识证明将以太坊扩展到十亿用户,同时不影响去中心化或安全性。实现这一点就需要一种快速有效的证明系统.
1900/1/1 0:00:00