编按:本文为QuarkChain创始人兼CEO周期博士撰写的技术文章,并以此文章为基础,在DAppLearning进行了技术分享讲座。
DeFi、GameFi等去中心化应用的蓬勃发展,极大地增加了对低交易费用的高性能区块链的需求。然而,构建高性能区块链的一个关键挑战是存储爆炸。下图是取自Etherscan的图表,它说明了一个以太坊全节点的区块链数据大小。
从图中我们可以看出,节点的链数据规模稳步增长,现在已经达到~9TB。由于去中心化区块链的一个目标是允许普通配置的计算机运行节点,因此在普通配置的计算机上强制要求9TB存储会难以达到。
区块
状态
交易收据
这其中,状态是这8.7TB的主要组成部分。所以有时,我们将存储爆炸称为“状态爆炸”。但是为什状态会如此之大?
以太坊域名服务ENS:6月份产生150万美元协议收入:7月7日消息,以太坊域名服务ENS表示,该项目在6月份产生了150万美元的协议收入,已全部流入ENS DAO,此外,6月份有3.6万个新 .eth域名注册,目前总共有272万个域名。[2023/7/7 22:23:35]
什么是以太坊状态?
以太坊状态是一个MerklePatrica树,其中
叶子节点是地址(0x...)=>帐户的映射,其中帐户存储与地址关联的余额、nonce等
内部节点维护树结构,以便可以快速计算整个树的哈希根
由于存档节点将保留所有区块的所有历史状态,这意味着MPT中的任何更新都将创建O(log(N))个内部节点,并且不会删除旧的内部节点。
前以太坊联创抨击以太坊:技术不完善是以太坊社区追求合并的根本原因:9月26日消息,前以太坊联创兼 Cardano 创始人 Charles Hoskinson 在个人社交媒体上发布文章表示,以太坊核心开发者并不能客观看待 Cardano,此行为结果是挫伤整个行业发展、用户采用以及相互协作。
以太坊基金会社区经理 Hudson Jameson 对此做出回应称,Charles 曾在四年前构建 Cardano 时蓄意抹黑以太坊,以太坊开发者忽略 Cardano 是由于 Charles 言行恶劣。Charles 回复称,他承认四年前的言论,当时以太坊技术并不完善,现在也一样。这也是以太坊社区追求合并的根本原因。如果没有大规模链下基础设施,无法实现网络扩张。托管的、非流动性质押不可取。[2022/9/26 22:30:08]
通过定期存储MPT,状态的存储大小显著减少。据Etherscan数据,目前Geth全节点的区块链数据大小约为1TB。
数据:以太坊网络最近30天新增517万枚NFT资产:4月18日消息,根据NFTScan数据显示,以太坊网络最近30天新增517万枚NFT资产,平均每天新增铸造17.2万NFT。[2022/4/18 14:31:00]
在不存储历史MPT的情况下,一个Geth节点的存储大小可以进一步减少到447G。通过减去300GB的区块数据,我们推断状态大小约为150GB。
币安智能链。截至2021年12月8日,BSC已有:
约984GB链上数据,其中区块约占550GB,状态约占400GB。
20.6623亿笔交易,100TPS
如果我们进一步用交易数量来预测数据大小,我们可以得到:
如果TPS为100,即~3,153MTPY
以太坊非零地址数量创历史新高:金色财经报道,Glassnode数据显示,以太坊非零地址数量达51,491,730个,创历史新高。[2020/12/31 16:07:03]
1年后,总TX~5,219M,区块~1.375TB,状态~1.085TB
3年后,总TX~11,525M,区块~3.025TB,状态~2.387TB
如果TPS为150,即~4,730MTPY
1年后,总TX~6,796M,区块~1.809TB,状态~1.427TB
3年后,总TX~16,256M,区块~4.327TB,状态~3.414TB
综上所述,对于BSC来说,如果保持目前的速度甚至更高,则很快就会达到以太坊存档节点相同的存储大小,这是普通计算机几乎无法运行的。
USDC Treasury在以太坊链上增发近1000万枚USDC:Whale Alert数据显示,北京时间8月29日14:13,USDC Treasury在以太坊网络上增发9,999,994枚USDC。哈希值为:0x6f05b2937bfe6a5207f7ad772643e9c39df4533b7cd5db3bb9d08d64c2ba57d5。[2020/8/29]
具有极高TPS区块链的存储爆炸问题
如果我们对一个极高TPS的区块链做一个更大胆的假设,这个数字会变成多少?我们来考虑一个具有1000TPS的区块链并分析其区块和状态大小,将是:
假设tx大小约为100字节,每年区块所需的存储量为1000(TPS)*100*365*24*3600=2.86TB
假设MPT有100亿账户,我们预计状态大小将为150G/0.18B*10B=8.3TB
将这些数字放在一起,我们很容易得出一个结论,这是大多数普通配置计算机将无法承受的要求!
优化
为了优化存储成本,我们必须将限制放宽为兼容EVM而不是兼容以太坊。即,我们必须构建/运行另一个支持EVM的链,而不是高度优化的以太坊客户端。
~10B*50100GB=600GB,大约是MPT版本的1/10!
虽然使用普通KV会带来巨大的好处,但一个主要问题是我们无法在如此短的区块间隔内计算每个区块的状态后哈希,这意味着我们将失去以太坊的以下好处:
快速同步:下载任何区块的状态并通过重放剩余的区块来快速同步网络
分叉检测:来自对等方新创建的区块是否会导致与本地执行区块的状态不同。
为了启用快速同步,我们有一个周期性的快照区块。一个快照区块包含前状态哈希这一附加信息,即前一个快照区块的后状态哈希:
非快照区块不维护状态哈希,而是具有增量哈希,其中包含该区块的所有交易事务的原始数据库操作的哈希。这使得分叉检测成为可能!
我们使用交易前状态哈希来代替以太坊中区块的交易后状态哈希。原因是节点不能立即计算状交易后的状态哈希,但是通过使用交易前状态哈希,节点可以使用整个epoch间隔来计算哈希。例如,假设状态哈希计算每秒处理10M的状态数据,那么计算600GB的整个状态将需要600GB/10M~16.67小时
计算状态前哈希的流程如下:
1.当一个快照区块被接收并最终确定时,它的KV状态被快照,并创建一个后台线程来迭代所有KV条目并计算哈希。
2.当下一个快照区块被创建时,计算出的状态前哈希值将存储在该区块中。同样,节点将创建KV的另一个快照并在后台计算其哈希。
3.当下一个快照区块被创建时,节点除了存储状态前哈希之外,节点现在可以释放快照区块的KV快照,这意味着来自快照区块以来所有被删除/更新的数据将被自动垃圾回收
其结果意味着,要存储状态,节点只需要最多两个KV快照。
最新的快照区块的交易执行前状态快照,即快照区块的交易执行后状态
快照区块之后的完整区块
我们可以对存储成本进行简单的数学计算:假设epoch持续时间为2周,则区块重放大小为
2*14*24*3600*100*1000=224GB!
而且,这里的数字不会随着时间的推移而增长!
不仅是区块,状态存储消耗了很多的空间
当TPS>1000时,存储空间用量高得令人望而却步
我们提出对区块和状态进行优化:
区块大小从每年2.86TB减少到224GB
状态大小从8.3TB减少到600GB
一台2TB的普通配置计算机应该能满足长时间运行节点的条件
缺点:轻节点无法验证状态中的一个数据
致谢
感谢dapp-learning主办此次活动。
这是多么美好的一年啊!2021年即将结束,UmbrellaNetwork展望未来。UmbrellaNetwork一直在努力为DeFi及其他领域构建市场领先的预言机解决方案.
1900/1/1 0:00:00Fairyswap即将开启冷启动。Fairyswap作为隐私公链龙头Findora推出的首个Dex,吸引了不少原Findora社区群体的关注,本文将带大家体验Fairyswap的创新,以及我们用.
1900/1/1 0:00:00Gate.iohasissuedofevent“GateUnion-ShareTradingExperiencesThroughYourVideos,Share$30.
1900/1/1 0:00:00親愛的ZT用戶:ZT創新板即將上線CHER,並開啟CHER/USDT交易對。具體上線時間如下:充值:已開啟;交易:2022年1月4日18:05;CHER項目簡介:Cherry是一個社區管理的開源.
1900/1/1 0:00:00Theyear2022isnearlyuponus.Gate.iowishesallofyouaHappyNewYear!TocelebratetheNewYear.
1900/1/1 0:00:00作者基于交易成本视角,提供了一个理论上统一的交易演变的过程,且当下进化前沿是加密货币和去中心化金融。作者表明,随着货币的每一个新发展,新的交换形式或媒介必须降低相对于相关替代品的交易成本.
1900/1/1 0:00:00