月亮链 月亮链
Ctrl+D收藏月亮链
首页 > TUSD > 正文

COI:“至暗时刻” Filecoin运维工程师在做什么?_STCoin

作者:

时间:1900/1/1 0:00:00

前言

固然运维这个职能范畴对于绝大多数人来说认知模糊,特别是在分布式存储领域,“运维”常常和“机房”“IDC”等名词相伴,导致很多异业者对于运维的了解停留在物理层面,以搬运机器、上下架服务器、管理网电等为标杆,好似网管般维护机器运行。事实上运维工程师从工作方式上分为多类,如:运维工程师、运维开发工程师、运维平台研发工程师、数据库工程师、数据库研发工程师等,体现运维能力更多于针对业务的定制化原生工具开发的方面。

运维工程师负责维护并确保整个服务的高可用性,同时不断优化系统架构提升部署效率、优化资源利用率提高整体的ROI。

伴随着Filecoin的主网临近,“运维”重要性的共识在业界基本达成一致,随着行业布道信息量和内容程度的升级,越来越多的投资参与者也步入理性分析,无论是从Filecoin项目的阶段性动态,亦或是对挖矿服务商的甄选,在主网上线的黎明前夕,现阶段最重要的运维工程师们,确定准备好了么?

初识运维

1.1运维是什么

运维普遍是指互联网运维,是和研发、测试、系统管理并头的4大技术部门。

细分来说运维的技术方向包含服务监控技术、服务故障管理、服务容量管理、服务性能优化、服务全局流量调度、服务任务调度、服务安全保障、数据传输技术、服务自动发布部署、服务集群管理、服务成本优化、数据库管理、平台化的开发、分布式存储平台的开发优化等等,分布式是其中很明确的一个技术要领。

同时在运维工作中,运维人员要照顾到Web服务器、监控、自动部署、配置管理、负载均衡、传输工具、备份工具、数据库、分布式平台、分布式数据库、容器、虚拟化、安全、问题追查等大而全、小而细的事项。

0xScope:某EOA地址现持有约5900万枚ARB,或为Upbit热钱包地址:3月31日消息,Web3知识图谱协议0xscope在社交媒体上发文表示,某EOA地址在过去一日内收集了大量ARB,目前已持有约5900万枚,价值约合8440万美元。0xScope补充表示,据活动数据显示,0xScope认为该地址可能是Upbit热钱包地址,若推测是正确的,那么Upbit平台持有的ARB数量将仅次于Binance。

此前报道,韩国加密交易平台Upbit昨日表示将上线ARB,设有ARB/KRW以及ARB/BTC交易对,计划于北京时间3月30日14:00开始交易。[2023/3/31 13:37:05]

运维工程师通过软件或命令行实时与第三方系统做数据同步,实现可视化监控平台与各系统的无缝对接,确保系统数据的精准与稳定,及时处理告警信息,提高动环监控管理效率。

动环监控自2008年出现至今已有十二年的时间,主要包括以下模块:

配电系统:UPS及直流电源、自备发电机、配电柜、防雷检测等。

环境系统:空调、温湿度监测、漏水监测、气体监测等。

消防系统:烟感、温感、早期预警系统、其它消防设备等。

保安系统:图像监控、门禁监控、红外探测、玻璃破碎探测等。

IT网管监控:网络设备、PC服务器、操作系统、数据库及应用等。

除此之外,运维工程师们还需要关注:

联动控制:电子开关、联动录像、数据存储、运动操控等。

数据:Arbitrum日交易数连续六日超越以太坊:金色财经报道,Dune Analytics数据显示,自3月21日起,Arbitrum日交易数已连续六日超越以太坊,其中3月23日ARB上线时Arbitrum日交易数接近273万笔,是以太坊同日交易数(108万笔)的2.5倍。[2023/3/27 13:28:28]

事件记录:操作记录、状态记录、异常记录、确认记录等。

异常报警:声光报警、语音广播、电话报警、短信报警、邮件通知等。

运维人的一天从上班打卡开始到下班打卡结束,忙忙碌碌周而复始,“007”的工作模式屡见不鲜。

1.2运维发展史

运维要做的是将系统运行存在的变量做到可控,但运维环境的异构和复杂化导致日常运维工作需要付出的人力、时间成本越来越高。

从初级运维发展到最高新的智能化运维,主要是四个阶段的过渡:

脚本时代

工具时代

自动化时代

智能化时代

两年前,“智能化运维”开始被大家广泛关注,随着大数据分析、APM、智能异常检测、机器学习等技术的兴起和逐渐成熟,运维需求也逐渐向自动化和智能化过渡。

自动化的意义

2.1自动化的运维方式?

自动化是智能化的前提。自动化的运维方式解决硬件和网络的自动管理、虚拟机的自动管理、操作系统和软件的自动化安装、配置,我们看到了很多“管理”,自动化的意义一方面是提高效率、优化成本、优化资源,更好的做一些弹性,把资源释放出来去干点别的;另一方面更是将运维结果标准化可复制。

Chain CEO:蒂芙尼的“NFTiffs”展示了奢侈品对web3的承诺:金色财经报道,区块链技术公司Chain首席执行官Deepak Thapliyal 在 The Block 采访中表示,Chain 与奢侈珠宝公司蒂芙尼去年合作向 CryptoPunks 持有者推出了“NFTiffs”,并附赠实物版钻石吊坠,这种“phygital”项目(一种具有数字表现的物理项目)的创建揭示了此类奢侈品 对 web3 的承诺。他说:“NFTiff 是一个非常成功的项目,将一个著名的奢侈品牌带入了 Web3,我们在几分钟内就销售一空,全球范围内的买家能够收到一个与他们的 CryptoPunk 一比一匹配的吊坠”。

此前报道, 250个NFTiff在去年8月7日首次亮相后的20分钟内售罄,并为公司净赚了1250万美元。[2023/1/4 9:50:12]

当然,从工具化到自动化的过程并没有那么的容易,对整个行业来讲,目前更多的工作是在探寻自动化,深耕分布式存储多年和Filecoin源代码近两年的IPFS原力区作为为数不多的实现自动化运维服务的提供商,在此致敬为行业发展服务努力的技术大佬们。

说回运维,在Filecoin这个领域,标准的运维软件研发和其他相对传统的运维软件不太一样。比如说阿里从工具化到自动化这个过程中,笔者认为工具化挑战相对小,即使传统的运维人员也很容易写一些工具,比如用Python去写更多的工具体系。但是如果开发者的工具最终要变成能够到自动化这个阶段,就意味着对工具的要求会越来越高,比如说工具的质量,如果开发者写出来的工具经常有问题,规模一大就扛不住压力,这时从人性的角度来讲,开发者将会慢慢失去信任感,最后会很难完成这个过程。

ETH接收地址数量创两年新低:金色财经报道,据Glassnode数据显示,ETH接收地址数量在过去一小时(7日均值)达到7,538.863个,创近两年新低。[2022/12/30 22:15:33]

当自动化运维实现监控、问题诊断、可视化等,运维人只留下一部分手工任务包括容灾切换、应急操作、应用部署和起停等,这样留下的大量精力就可以倾注于运维开发,给用户带来更好的服务体验。

2.2实现自动化的方式

一套完善的综合动环监控系统可以对分布的各个独立的动力设备、机房环境、安保监控等进行实时采集、实时监视系统和设备、安保的运行状态,记录和处理相关数据;及时侦测故障,并作必要的遥控遥调操作,适时通知驻场和远程运维处理;实现机房的少人甚至无人值守,以及电源、空调的集中监控维护管理,提高供电系统的可靠性和通信设备的安全,为机房的管理自动化甚至智能化和决策科学化提供有力的技术支持。

但目前Filecoin领域业内真正的自动化运维的落地实践占比不大,突出的、原生的定制运维系统更是少之又少,原力矿池占其一。

运维对Filecoin的重要性

3.1DEVOPS理念

3.1.1DevOps的工作原理

在DevOps模式下,开发团队和运维团队不再“孤立”,他们会在应用程序的整个生命周期内相互协作,开发出一系列不限于单一职能的技能。这些团队会使用实践经验自动执行之前手动操作的缓慢流程,使用能够帮助其快速可靠地操作和发展应用程序的技术体系和工具,进一步提高团队的工作速度。

Aave通过在以太坊合并前关闭ETH借贷市场的提案:9月6日消息,Aave关于计划在以太坊合并前关闭ETH借贷市场的提案现已获得通过,可能会在1天之内执行。该提案旨在减轻以太坊合并带来的相关潜在市场风险。此外,该AIP还将与提案相关的一次性支付60AAVE从Aave国库转移到Maker DAO暂停代理。[2022/9/6 13:11:09]

3.1.2DevOps的文化理念

向DevOps的过渡需要文化理念和心态上的转变。DevOps的宗旨是消除两个传统上孤立的团队之间的壁垒。他们力求频繁沟通、提高效率,并改善客户服务的质量,他们能够完全掌控自己的服务,并且经常越过自己的既定角色或职能的传统工作范畴,思考最终用户的需求以及解决这些需求。?

3.1.3DevOps实践说明

有一些重要的实践经验能够通过自动实施和简化软件开发与基础设施管理流程,帮助组织加快创新速度,这些实践经验有大部分需要通过适当的工具来完成。其中一个基本实践经验就是要频繁地进行小规模更新。

这是组织能为客户快速提供创新的有效方式。与传统发布实践中偶尔的更新相比,这种更新通常更具渐进性质。频繁的小规模更新能够降低每次部署的风险。它们可以帮助团队更快速地处理错误,因为团队能够确定引发错误的最近一次部署。虽然更新的节奏和规模可能有所不同,但使用DevOps模式的组织与使用传统软件部署实践的组织相比,会更频繁更新。

此外,组织还可以使用微服务架构来提升应用程序的灵活性,从而加快创新步伐。微服务架构将大型的复杂系统拆分为简单的独立项目。应用程序被拆分为许多单个组件,每个服务限定到单个目的或功能,这些服务既可以与其同级服务相互独立运行,也可以与应用程序一起作为整体运行。这种架构降低了更新应用程序的协调开销,当每个服务都与掌控各项服务的敏捷小型团队一一对应时,组织就可以实现更快的发展。

但是,微服务与较高的发布频率相结合会导致部署量大幅度增加,会带来运维挑战。因此,持续集成和持续交付等DevOps实践经验有助于解决这些问题,让组织能够以安全可靠的方式快速交付。与基础设施即代码和配置管理一样,基础设施自动化实践经验也有助于维持计算资源的弹性和对频繁变更的适应性。此外,进行监控和记录这一实践经验可帮助工程师追踪应用程序和基础设施的性能,以便他们快速应对出现的问题。

3.2Filecoin运维与传统运维的区别

Filecoin矿商的运维相较传统互联网运维难度呈数倍甚至数十倍提升,这主要受挖矿模式影响,比如当用整机串联并行方式参与时,难度仅围绕单一固件上的程序稳定性做工,但如果采用集群化或者分布式矿池的形式,集群间的各种请求调度和需求分钟级部署的高标准对于运维工程师来说是一大挑战。当Filecoin全网算力需求急剧提升时,集群化矿池模式的运维依然可以自如面对,而其他模式的运维就需要堆人堆资源来解决此类情况。

如果说Filecoin运维和传统运维的具体不同,这里举几个方向的例子:

物理层:因类似阿里云的服务商,没有标准化的服务支持,Filecoin云服务更需要注重底层架构,需要定制化的自建IDC,这远远不止硬件范畴。

SaSS:Filecoin软件服务层也需要大量运营工具以支持数据可视化,这样运维需要将开发平台化,将工具可视化,这个过程中运维参与了大量的研发工作。

运维流程:传统运维因参与个体少、逻辑简单,多以Web形式访问接口,做好端口监听,反馈结果基本可控绝大多数变量,流程简单;而Filecoin流程复杂,需要维护的模块多、自动化难度高、监听数据复杂且高频,特别是惩罚机制,犹如达摩克立斯之剑,时刻告诫矿工们即使如此难度也不容出错,客户的数据存储需求服务是Filecoin第一要务。

准确性:运维需要物理层监控,但对于Filecoin来说,监控出块时间、出块率、算力走势、Lotus同步高度准确性等维度的重要程度不亚于物理层运行状态。在传统运维场景下,一个异常处理的要求可能在小时级,千万级用户的应用服务可能在分钟级,但Filecoin网络任何一个参数的异常都有可能对矿工造成巨额收益的损失及抵押的惩罚,易造成得不偿失的情况。

除此之外,原力区运维要针对官方的Lotus代码给予优化,考验运维的开发能力、程序运行结果的稳定性,要实现健康状态检查、故障自动重启、故障自愈等,这一切的一切为的是提升CPU使用率,从而提升算力、出块量、收益,效率提升达2-3倍。

3.3?项目发布的区别

3.3.1频率

传统互联网项目发布的频率固定、时间固定,如每周三,部署的原因多为修复BUG及功能新增,而就当前Filecoin网络状况,目前原力运维要做到的是灵活部署、随时可部署、随时更新链版本,实现在第一时间可以推倒已有集群,并重新部署一遍全流程,对于任何细节的调整要有数十倍的复查测试,实现对网络变化的快速反应,这也是实现实时最优挖矿收益的前置准备。

3.3.2颗粒度

Filecoin挖矿服务在实现数据监控可视化、运维应用状态监控可视化之外,颗粒度也是极细,比如做Sector的过程中自动化监控P1-P7状态及返回值。

当原力区运维工程师将数据化、自动化、精细化、平台化颗粒度足够精细后,海内外的自动化部署即达到分钟级执行完毕,通过后台一键管理全部服务器,并行部署新代码,自动化工具压缩部署时间,实现节省99%耗时的效率优化,这少则百兆的数据包的分钟级远程部署对行业来说是一个挑战,对Filecoin矿池技术的推进却是一个跨越。

自动化大体量运维

Filecoin大矿工测试中原定“5PB”的大矿工标准,在目前看来对行业已然不是挑战,据评估Filecoin主网在上线前3-6个月将达到1000PB,这个数据带来的是Filecoin运维工程师们提前准备的一项作业:如何大体量运维?

目前看来自动化运维是解决大规模集群运维的唯一方式,也是运维工程师面对的最大挑战。如何管理好几十万台服务器上的服务,同时保障服务的高可用性,这里需要集群复制能力,但相较传统运维项目,复制部署复杂度数十倍增长。做好24小时驻场维护保障设备上架;高频定时环动监控及日志记录保障设备运行;自动化分布式部署、分布式监控系统保障系统运行;核心网络监控,护航设备&系统&应用连通率;成熟的1保5冗余保护策略保障数据安全;攻防防护保障等等等等,这依然远远不够,运维的路很长,没有尽头……

总结

当我们翘首以盼的主网来临,Filecoin开发工程师将逐渐归隐,Filecoin的发展终将交付于社区,网络运行状况且看大矿工的运维工程师们的本领。

在太空竞赛这最后一关,运维工程师们的忙碌将得以回报,具体当前未可知,我们且看8月25日。

标签:COIOINLECECOINdynamiccoinSTCoinBLEC价格Edgecoin

TUSD热门资讯
以太坊:以太坊的Layer 2生态 现在发展的怎么样了?_LGCY Network

今年7月以来,流动性挖矿大热。但DeFi的繁荣带来以太坊的拥堵,用户频繁进行资产转移以获取最大流动性挖矿利润的行为不断推高Gas费用.

1900/1/1 0:00:00
比特币:「易天说」比特币下方目标11000关口,中途曲折向谁诉说?_比特币行情

2020年8月22日周六农历七月初四大家好,我是你们的老朋友易天说。专注从K线形态角度摸索市场动向分析行情走势,观点明确,一针见血,争取为广大币友传递最有价值的币市信息.

1900/1/1 0:00:00
加密货币:加密货币大盘熄火 跨链大涨_DEF

行情调整了几天,开始看到DeFi是不是结束了的疑问,可见高位震荡下市场自信心下降严重。在我看来,DeFi的泡沫终究会破灭,但现在谈崩盘为时过早,就像DeFi兴起时多数人后知后觉一样,DeFi的退.

1900/1/1 0:00:00
加密货币:香港监管机构向加密交易所 OSL 发放首个临时交易许可_加密货币市场最新消息新闻

链闻消息,香港监管机构为加密交易所OSL授予临时许可批准,这意味着香港可能很快出现首个获得完全许可的加密货币交易所.

1900/1/1 0:00:00
DEFI:DeFi 项目 YFValue 针对包括小玩家在内的所有用户启动流动性挖矿计划_Definex

链闻消息,DeFi项目YFValue协议于本周启动流动性挖矿计划,致力于通过通货膨胀率可链上投票、自动推荐等独特功能为包括小玩家在内的所有用户提供流动性挖矿收益.

1900/1/1 0:00:00
稳定币:一文了解DeFi目前包含的产品与服务_DEFI

探索DeFi生态系统的不同组成部分。正如我们在前一篇文章中讨论的那样,去中心化金融的运作方式对潜在用户有很多好处。DeFi生态系统中涉及的各种产品和服务有时被统称为“开放式金融”.

1900/1/1 0:00:00