概述
IPFS的介绍在《IPFS文件存储详解》已经详细介绍过,本文主要介绍IPFS中的文件系统MFS以及文件的GC机制。
MFS和传统的文件系统一样使用目录对文件进行管理,区别在于MFS中的目录和文件都有哈希,该哈希由文件内容或者目录下面所有目录以及文件的内容唯一确定,如果目录下面的文件或者目录有变化则该目录的哈希也会变化,所以根据哈希可以判断该文件或者目录下面的内容是否有修改。
文件的GC机制主要介绍IPFS是如何进行文件删除的。
本文所述的IPFS的版本为v0.6.0。
MFS
本版块主要介绍IPFS的文件系统,即文件及目录结构是如何生成、组织和存储。
MFS中文件及目录结构如下图所示,最上层是root目录,表示该文件系统的根目录,所有文件夹以及文件都在该目录下面,MFS中用Root,Directory,File这三种类型分别表示root目录,文件夹,文件。root目录通过link链接到文件夹或者文件,文件夹又通过link链接到文件夹或者文件。
火币推出《一分钟读懂DeFi》系列科普视频:据官方消息,8月24日,火币推出《一分钟读懂DeFi》系列科普视频,并与微博财经合作冠名播出,布道DeFi认知,助力行业发展《一分钟读懂DeFi》是由火币成长学院打造的业内首个系统全面讲解DeFi的系列科普动画,继推出《区块链100问》后的再续佳作。《一分钟读懂DeFi》系列动画对DeFi的发展进行系统梳理,适合想要由浅入深、全面系统了解区块链DeFi的人们轻松了解DeFi。目前视频已由火币网官方微博发布。[2020/8/24]
其中,root目录、文件夹都会存储在IPFS的DAG中进行持久化,另外root目录的CID存储在IPFS内置的LevelDB中,当IPFS启动的时候从LevelDB中取出root目录的CID,然后在IPFS的DAG中取出根目录,最后加载出整个目录结构。
人民数字FINTECH推出区块链科普动画:人民日报数字传播发布微博称,人民数字FINTECH出品《趣味科普|区块链动画》。[2020/3/31]
下面详细介绍创建文件夹和增加文件的过程:
创建文件夹的过程如下图所示:
1.新建文件夹;
2.将该文件夹的父文件夹添加一条link,link包含该文件夹的Name、CID和Size;
3.调用该文件夹的update函数,通过parent递归更新父级文件夹的状态,逐级向上层文件夹更新,直到更新root结束递归过程。
删除文件夹和创建文件夹类似,只需要unlink和递归update即可。
动态 | 链客社区联合北京交通广播推出区块链技术科普节目:12月11日15:15—16:00,区块链技术社区——链客区块链技术社区将联合北京交通广播FM103.9从零开始为大众科普解码区块链技术,蜻蜓FM及北京广播网同期进行全球直播。首期做客嘉宾为链客区块链技术社区创始人郄建军和百度区块链产品负责人于雅楠。[2019/12/11]
增加文件的过程如下图所示:
1.?上传文件
2.将该文件的父文件夹添加一条link,link包含该文件夹的Name,CID和Size;
3.调用该文件的flush函数,通过parent递归更新父级文件夹的状态,逐级向上层文件夹更新,直到更新root结束递归过程。
动态 | 浙江卫视节目科普支付宝区块链防伪溯源产品:昨日,在浙江卫视播出的科普综艺栏目《智造将来》现场,支付宝首次展示了支付宝区块链防伪溯源产品,以接地气的方式公开向大众展示区块链在生活中的应用。[2019/3/4]
删除文件和增加文件的过程类似,只需要unlink和flush即可。
文件GC机制
IPFS中删除文件时并不会立即删除掉该文件,而是将该文件的CIDunpin,下次GC的时候则可以真正的删除该文件。
下图是IPFS的配置文件,其中红色部分是GC相关的配置。
StorageMax是存储文件的最大容量,默认是10GB,可以根据项目需要进行修改,当存储的文件超过该最大容量时会有warning,文件还是可以继续存储的。
动态 | 美国演说家Anthony Robbins开始科普什么是比特币:美国演说家安东尼·罗宾(Anthony Robbins)在自己的网站上发布了一篇比特币的科普文章,并在推特上向自己的粉丝介绍什么是比特币,目前他的推特账户共有粉丝304万人。[2019/1/1]
StorageGCWatermark是GC的阈值,默认是90,即90%,触发GC的阈值容量为10GB*90%=9GB。
另外,GCPeriod是GC的间隔,默认是1h。GC触发的机制是每一个GC间隔时间,触发GC的检查,当存储容量超过阈值时则开始GC,将需要删除的文件或者块进行删除。
文件或者块的Pin模式如下图所示,文件的Pin模式是recursive,即递归Pin文件的所有的块。
如下图所示,pinner是块的GC管理器,其中recursePin是递归的pin的集合,里面存储所有文件的根CID:
每次触发GC时会进行ColoredSet,如下面两张图所示,将所有recursePin中的CID依次遍历,深度遍历该CID所有的links,这些links的CID都会存储到gcs这个集合中:
然后通过bs.AllKeysChan(ctx)可以获得所有的块的CID集合,最后遍历这些CID集合,判断gcs中没有的该CID的块都需要删除掉,具体见下图,从而实现了所有unpin的块GC触发的时候都会删除的效果。
注意:GC的时候会lock,此时上传文件和删除文件都会阻塞,GC需要占用的时间和文件存储量以及删除的文件大小有关系,可以将GC时间固定在每天用户操作最少的时间点,例如每天的凌晨3点,减少用户操作和GC的冲突。
总结
IPFS中MFS提供了一套基于CID的文件系统,目录结构也存储在IPFS的DAG中,目录的树状结构和DAG的结构本身是很类似的,所以将目录结构存储在DAG中巧妙地解决了文件系统目录结构地存储问题,最后只需要存储文件系统的根目录的CID从而可以方便地加载整个文件系统的目录。
IPFS中的文件GC机制目前不是很高效,通常文件存储10GB容量左右时,触发GC可能就需要几分钟到十几分钟的时间,由于IPFS是一个面向公网的一个用户一个IPFS节点的模式,所以该问题对于IPFS项目本身并不明显,但是如果将IPFS的存储以及GC机制作为投产项目使用,则需要对GC机制进行优化,减少GC占用的时间间隔。
另外IPFS本身每隔一段时间触发GC也不是很合理,针对项目的用户使用情况可以将GC触发时间固定在每天的凌晨某个时间,然后每24小时的GC触发间隔也是一种比较简单的解决IPFS的GC冲突问题的办法。
作者简介
姚文豪
来自数据网格实验室BitXMesh团队,数据平台架构师
1月11日午间,合成资产发行平台Synthetix官方发文称,上周Synthetix官方在发行多抵押贷款业务中发现了一个Bug。该错误导致一些仅需要进行部分清算的贷款被标记为全部清算.
1900/1/1 0:00:00据Trustnodes消息,RufferInvestment的JonathanRuffer详细阐述了关于该公司于去年11月购买5亿英镑比特币的想法,他说:“我们的根本理由是.
1900/1/1 0:00:00作者:0x13,律动BlockBeats你知道吗,你每天发布的推文也可以被铸造成NFT并进行交易了.
1900/1/1 0:00:00AAVE创始人StaniKulechov在推特上询问全栈Web3开发者AndrewSchmidt是否考虑过将杠杆信用委托添加到AAVEtrage,并告知其工作流程.
1900/1/1 0:00:00领先的数字资产基金Grayscale仍在继续积累比特币。技术分析师凯文·罗克指出:“Grayscale的BitcoinTrust在一天之内就向$GBTC添加了12,319枚BTC,这比上周比特币.
1900/1/1 0:00:0012月28日晚间,“我与无限——玲听2021区块链跨年演讲”在杭州大剧院重磅开启。巴比特副总裁/主编、《玲听区块链》发起人汤霞玲汤霞玲在演讲中说,区块链充满着暴富神话,一度也成为了犯罪的重灾区.
1900/1/1 0:00:00