可能你也注意到了,在跟智能合约交互时,你的事务会自动包含inputdata。在MyCrypto钱包界面,这些数据有个简单的标签:“Data”——它是做什么的呢?
这篇文章就是从技术上解释事务输入数据是怎么一回事,它实质是什么,又是怎么工作的。
-MyCrypto钱包的高级事务设定-
什么是InputData?
我们先来看看这笔token转账交易。某个人发送了0ETH到?0xd26114cd6ee289accf82350c8d8487fedb8a0c07,而且Etherscan网站呈现了这是一笔意图发送0.19OMGtoken到这个地址的事务。那么,EVM究竟是怎么知道,这个人想要转账某个数额的token到另一地址的呢?
你再仔细看Etherscan,就能看到这笔事务带着inputdata。inputdata是发送者为这笔事务附加的额外数据,既可以是普通的文本,也可以是数字。但在这笔交易中,发送者使用这部分数据来“告诉”合约,让合约运行特定的函数。智能合约本身是由一系列函数组成的。举例而言,一个ERC-20token合约使用比如“transfer”来把token从A账户转移到B账户,使用“balancerOf”函数来获得某个地址的余额,等等。在我们研究的这笔交易中,你可以看到它调用了?transfer(address_to,uint256_value)?函数。
美国说唱歌手Megan Thee Stallion与Cash App合作发布比特币科普视频:美国说唱歌手Megan Thee Stallion与由Square开发的移动支付服务Cash App合作发布了一段名为“Bitcoin for Hotties”的视频。该视频从她的角度解释了什么是比特币,为什么比特币有价值等内容。Megan Thee Stallion在Instagram上拥有超过2410万粉丝,在 Twitter上拥有640万粉丝。(Bitcoin News)[2021/8/8 1:41:10]
这笔事务的输入数据为0xa9059cbb0000000000000000000000004bbeeb066ed09b7aed07bf39eee0460dfa26152000000000000000000000000000000000000000000000000002a34892d36d6c74。你可以把这一长串的?十六进制?数据分解一下。开头的0x表示这是一个十六进制数值,紧接着的8个字节是函数标识符,再然后就全部是以32字节为一组的函数参数。所以第一组是?0000000000000000000000004bbeeb066ed09b7aed07bf39eee0460dfa261520?而第二组是?000000000000000000000000000000000000000000000000002a34892d36d6c74。
人大附中物理老师李永乐科普拜占庭将军问题和区块链:5月14日,人大附中物理老师、科普视频网红李永乐在其公众号发布视频《拜占庭将军问题是什么?区块链如何防范恶意节点?》。李永乐老师在视频中对拜占庭将军问题和区块链进行了讲解,他表示,拜占庭将军问题本质上指的是,在分布式计算机网络中,如果存在故障和恶意节点,是否能够保持正常节点的网络一致性问题。在近40年的时间里,人们提出了许多方案解决这一问题,称为拜占庭容错法。例如兰波特自己提出了口头协议、书面协议法,后来有人提出了实用拜占庭容错PBFT算法,在2008年,中本聪发明比特币后,人们又设想了通过区块链的方法解决这一问题。区块链通过算力证明来保持账本的一致性,也就是必须计算数学题,才能得到记账的权力,其他人对这个记账结果进行验证,如果是对的,就认可你的结果。与拜占庭问题比起来,就增加了叛徒的成本。[2020/5/14]
-InputData分解-
如果你在Etherscan上查看这些数据,你会看到它以下文这个形式呈现:
Function:transfer(address_to,uint256_value)
MethodID:0xa9059cbb
:0000000000000000000000004bbeeb066ed09b7aed07bf39eee0460dfa261520
:00000000000000000000000000000000000000000000000002a34892d36d6c74
十六进制是啥?
十六进制是一种计数系统,就像十进制和二进制一样;十六进制使用数字0到9和字母A到F,来对应表示十进制的0到15。下面这种图展现的就是这样的对应关系。十六进制常常用来更直观地表示大数字。
人民数字FINTECH推出区块链科普动画:人民日报数字传播发布微博称,人民数字FINTECH出品《趣味科普|区块链动画》。[2020/3/31]
-十进制数字与对应的十六进制字符-
单个十六进制字符所能表示的最大数值是15,长度是4个比特。多个十六进制字符相连时,你要把每个字符的二进制表示前后拼接在一起,才能得到其十进制数值。举个例子,0x5C,可以写成0101(=5)和1100(=C),前后拼接就是01011100,这就是二进制形式的92,所以十六进制数0x5C的数值就是92。
大多数编程语言都使用前缀0x作为绝对标识符,将十六进制数与其他的计数类型区别开来。这个前缀本身没有任何意义,只是为了清晰。我们这篇文章也会采取一样的做法,十六进制数都用0x开头。
讲完这些,我们继续。如果你还是没能理解十六进制,也不用担心——对于理解inputdata来说不是必需的。
InputData与智能合约
InputData的首要用途就是与智能合约交互。大部分智能合约都使用?合约ABI规范,使得Etherscan这样的网站能自动解码inputdata并显示事务所调用的具体操作。在我们上面那个例子中,这是一笔有关代币合约的事务,而且代币合约遵循ERC-20标准。这也就意味着,我们都知晓所有可能调用的函数,以及它们的?签名。举例,用于ERC-20合约的transfer函数的完整签名总是?transfer(address,uint256),意味着这个函数需要两个参数,所传入的第一个参数会被解读为一个地址,第二个参数会被解读为一个未签名的256位的数字。
动态 | 新浪财经:官媒针对区块链的报道从科普宣传转向打假监管:据新浪财经今日消息,“1025新政”满月,一个月间,官媒对区块链的态度风向已转。据11月初的一项统计,七家党媒在新政一周内发布了65篇直接相关报道,当时文章中的关键词是数据、产业、安全、创新等,大量文章偏向于科普区块链的概念以及应用介绍,提醒警惕虚拟货币炒作的仅有3篇。近期,官媒的批评焦点则纷纷指向借区块链之名进行的虚拟货币发行和炒作行为。据统计,新华网、人民网收录转载的,以打击虚拟货币或揭露假借区块链行为主题的文章,自10月25日到11月25日午间,共28篇;其中,11月19日至11月25日的一周内就高达15篇。这些文章主要围绕三个观点展开:厘清区块链和虚拟货币的关系,说明二者概念不等;打击伪“区块链”局,或是虚拟货币局揭露;提醒民众,区块链不能成为炒作的噱头,更不是行的招牌,需警惕此类活动,理性投资。[2019/11/26]
Solidity语言有多种参数类型。如果你有兴趣学习Solidity语言和智能合约,你可以在Solidity文档页面了解更多。
函数签名
如你所见,transfer函数的签名是?transfer(address,uint256),这个对所有ERC-20合约都是一样的。如果某个合约给转账函数安排不一样的参数类型,比如一个地址和一个uint128,这个合约就不是“ERC-20兼容”的。
要获得一个函数的签名的十六进制形式,我们先要获得这个函数的SHA-3哈希值的前面4个字节。而要想知道一个数据的Keccak-256哈希值,你可以使用JavaSceript语言的web3库,或者求助于这样的在线工具。在这个工具页面填入?transfer(address,uint256),它会显示?0xa9059cbb2ab09eb219583f4a59a5d0623ade346d962bcd4e46b11da047c9049b?作为结果。取前8个字符,就是?a9059cbb,恰好跟上述事务的MethodID一致。
声音 | ETC Labs主管:科普教育是未来几年公链面临的巨大挑战:ETCLabs主管Darin Kotalik认为,科普教育是未来几年公链面临的巨大挑战,人们必须要对区块链有基本的认识,分清楚公链和私链的区别。[2019/8/25]
另一个例子:ERC-20标准合约的approve函数的函数签名是?approve(address,uint256),其SHA-3哈希值是?0x095ea7b334ae44009aa867bfb386f5c3b4b443ac6f0ee573fa91c4608fbadfba,首8个字符是?095ea7b3,因此,调用许可函数的inputdata开头就会是0x095ea7b3。这笔发往DAItoken合约的事务就是如此。
地址和数量
每一个参数的长度都是32字节,或者说64个十六进制字符。但以太坊地址只有40个字节长。为了解决这个问题,地址参数要用0来填充。在十六进制里面,0x0000123和0x123是一样的,因此?0x0000000000000000000000004bbeeb066ed09b7aed07bf39eee0460dfa261520等同于?0x4bbeeb066ed09b7aed07bf39eee0460dfa261520,而且?0x00000000000000000000000000000000000000000000000002a34892d36d6c74?也就等于?0x2a34892d36d6c74。那为什么我们要填充这些0呢?
就像我们上面说到的,Solidity合约可以接受的最大数值是2256?-1,刚好是32字节。使用固定的长度可以让EVM和其他应用在解码数据时候更轻松,因为你可以假设每一个参数的长度都是一样的。
那数组和字符串呢?
如上所述,在inputdata中使用数组和字符串,情形会有些许不同。因为数组本质是多个东西组成的一个列表。举个例子,1、2、3三个数所组成的列表在大多数编程语言中都可以写为。要在事务中发送这种数据,列表中的每一个对象都要作为32字节一组的数据发送,列在inputdata的结尾。指明数组长度的指针就作为参数。
假定我们有一个叫做?calledmyFunction?的函数,接收一个地址和数字的数组作为参数,即?myFunction(address,uint256)。该函数的函数签名是0x4b294170。地址这一项,我们照上面所说的操作。因为我们的数组包含3个对象,数组的长度用十六进制表示为0x3。然后每个对象都要占据恰好32自己的空间,且数组要放在所有其它参数之后,所以数组会从32+32=64字节之后开始。
000000000000000000000000000000000000000000000000000000003000000000000000000000000000000000000000000000000000000000000000100000000000000000000000000000000000000000000000000000000000000020000000000000000000000000000000000000000000000000000000000000003
-例子:input数据要按照32字节一组来切分-
因为字符串的长度是任意的,它们要按32字节一组来切分,处理方式跟数组相同。
像Etherscan这样的网站是如何解码inputdata的?
哈希函数是单向函数,所以如果你只有函数签名的哈希值,是不可能会恢复出函数签名的。合约的所有者可以将合约的ABI作为JSON文件上传,就像这个例子,这可以用来拿到函数签名的哈希值。
即使合约的所有者不上传合约的ABI,也能够解码input数据。因为,ERC-20合约函数的签名都是一样的,因此Etherscan只需使用一个预定义的合约ABI即可服务大部分合约。举个例子,ERC20合约的转账函数的合约ABI如下文所示
如果输入数据里的签名与任意一个预定义的函数相匹配,Etherscan都能解码inputdata。
inputdata的大小有没有什么限制?
既有,也没有。以太坊协议没有为inputdata的长度设固定的上限,但inputdata也消耗gas。单个区块可用的Gas数量是有上限的,在本文撰写时是800万。每一个0字节都要消耗4gas,而非零的字节要消耗68gas。一笔标准的ETH转账事务要消耗21000单位gas,所以,如果不考虑调用合约的交易,当前inputdata的最大长度是2MB,或者全部用非零字节的话,就是0.12MB。因为inputdata不会只有零,也不会一个0也没有,所以实际的大小会在两者之间。
如果你想看实时的区块Gas上限,可以看ETHStats.net。
-特定区块的Gas上限-
只需将鼠标停留在“GasLimit”部分的某个区块上,就可以看到其Gas上限。
更多信息
合约ABI规范
ERC-20Token标准
以太坊虚拟机
参考
以太坊黄皮书
Solidity文档
原文链接:
https://blog.mycrypto.com/why-do-we-need-transaction-data-/
作者:?MaartenZuidhoorn
翻译:?阿剑
标签:ATADATDATAPUTKATA币DATADOGEdatashieldcoinbankintelligencefogcomputerchain
据U.Today5月11日报道,抗量子混合区块链平台QANplatform完成210万美元风险融资。根据路线图,QANplatform计划5月12日上线Uniswap.
1900/1/1 0:00:00(图片来源于网络)V神12号在Uniswap治理论坛上发了一个提案。提案立意新颖,脑洞大开,令社群击节赞叹。消息一出,UNI大幅上涨.
1900/1/1 0:00:00国内ATM总保有量在2018年第三季度达到历史最高峰后,呈现整体下滑态势。作为线下服务渠道,ATM机长期扮演着银行网点的有效补充角色.
1900/1/1 0:00:00谁也不曾想到,马斯克大佬的几条“推特”便让动物园系列币风潮汹涌,并直接影响着加密世界的发展节奏,一场凝聚人心的“社区共识“在这个5月被演绎的淋漓尽致.
1900/1/1 0:00:00今天的加密货币市场迎来史诗级大崩溃,虽然24小时跌幅不是历史最高,但考虑到最近一周以来持续下跌,还是引起了前所未有的市场恐慌。可以说刚才整个加密货币市场都迎来了瀑布.
1900/1/1 0:00:00最近一周,根据CoinGecko的统计,主要以动物币构成的MemeCoin板块普涨了192.54%,其中.
1900/1/1 0:00:00