月亮链 月亮链
Ctrl+D收藏月亮链
首页 > 火币APP > 正文

人工智能:在数据泄露“成瘾”的时代, 联邦学习如何实现AI在机器学习过程中的数据保护?_SOL

作者:

时间:1900/1/1 0:00:00

AI作为一种通用技术,在各个领域赋予了我们生活极大的便利。进入元宇宙,数据的开放共享必成为一种趋势,在数据生产力的时代中,数据价值创造的效率提升将带来质的突破。AI技术带来巨大机遇和效益的同时,也面临着数据孤岛和数据隐私泄露的问题。

首先,数据和AI是一种共生的发展模式。我们收集数据,然后通过AI对其进一步解释和细化数据,数据需要精心管理、高质量且易于获取,成功做到这几点并不是非常容易的。

对于收集用户数据,必须保持公开、透明的原则。毫无疑问,在这种情况下,数据孤岛会逐渐显现。AI作为一项企业技术,构建能够打破数据孤岛并使信息可操作的IT基础设施,同时确保安全性,这已经是企业面临的主要挑战。

同时由于竞争关系、安全问题、审批流程等因素,数据之间的流通存在着难以打破的壁垒,事情就变得更具挑战性了,在5G时代更是如此。

而在数据的世界里,最了解你的是你常用的软件和平台,将这些大大小小的信息整合,就是一个完整、精确的数据画像。这些数据一旦泄露,将使你完全暴露在数据的世界中,被陌生人窥视,甚至被用于非法商业交易。

如今AI的工作优化模式是基于数据的,也就是所谓的数据驱动。随着AI落地场景越来越丰富,社会对于数据隐私的关注也越来越重。同时市场数据AI的商业化应用,让人们在享受便利的同时也在承担着数据泄露的风险。

如今,数据孤岛、数据隐私已是传统行业应用AI技术所面临的共性问题。在这种情况下,有人就提出了联邦迁移学习的方法来解决问题。

前SEC互联网执法主任:现任SEC不会批准比特币现货ETF的申请:8月13日消息,前SEC互联网执法主任John Reed Stark在X上表示,现任美国证券交易委员会(SEC)不会批准比特币现货ETF的申请。

此外,Stark表示,如果共和党人在2024年入主白宫,美国证券交易委员会可能会减少加密货币执法力度,并“变得更愿意批准比特币现货ETF,并且更有可能采取其他重要的加密货币友好监管行动” 。

Stark还认为,如果下一任总统是共和党人,现任SEC主席Gary Gensler“可能会辞职”,而业内被称为“加密货币妈妈”的Hester Peirce可能会成为代理主席,而“与加密货币相关的SEC混乱将戛然而止。”[2023/8/13 16:23:36]

什么是联邦学习?

联邦学习实际上是一种加密的分布式机器学习技术,参与各方可以在不披露底层数据和其加密形态的前提下共建模型。

联邦学习旨在实现企业的私有数据不出本地,通过加密机制下的参数交换,即在不违反数据隐私法规情况下,建立一个虚拟的共有模型。

用更通俗的语言来讲,各个企业的数据之前就像不同的小国家,它们自成体系,无法很好地完成统一建模。联邦学习则将它们管辖在一个大国家之下,将不同的企业看作是这个国家里的“州”,就算彼此之前不互通数据,它们之间都可以获得模型效果的提升。

联邦学习有三大构成要素:数据源、联邦学习系统、用户,并且具有数据隔离,保证模型无损,公平合作,保持独立四大显著优势。由于数据本身不移动,因此也不会涉及数据合规和泄露问题。

Solana联创:Solana有潜力成为加密领域的苹果:金色财经报道,Solana联合创始人Raj Gokal表示,“Solana有潜力成为加密领域的苹果,多年来Apple专注于两件事,用户体验和性能,它在触摸屏延迟方面研究了近十年,才让iPhone问世,这感觉就像魔法一样,要让iPhone、App Store和应用程序生态系统达到今天的水平,要在该平台之上构建很多东西,这一切都始于对必须完美运行的简单交互的不懈关注。Solana的核心工程和生态系统的重点是要创建一个感觉就像普通互联网,但它是一个全新的金融互联网的网络,Solana可能试图通过其自己的以Web3为中心的Android智能手机Saga与Apple竞争,该智能手机于4月向公众推出。Saga的推出是为了让用户更容易获得加密产品和服务,通过电话而不是传统的方式访问加密平台和应用程序。”[2023/5/30 9:49:30]

完成的模型将在各自的领域为本地的目标服务,在这样一个机制下,参与各方的身份和地位相同,成功实现了“共同富裕”的目标。

我们知道,推荐系统中算法的目标是挖掘用户和内容、商品之间的联系,根据不同特点,联邦学习可总结成三类:横向联邦学习、纵向联邦学习和迁移联邦学习。

在横向联邦学习中,主要用于解决参与方拥有大量相同的商品或服务,但用户群体不同时的系统协作问题。

纵向联邦学习是在参与方数据集的用户重叠较多而用户特征重叠较少的情况下,把数据集纵向切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练。

Animoca Brands本季度将为其Web3投资基金募资10亿美元:1月5日消息,Animoca Brands CEO Yat Siu 在接受彭博社采访时表示,Animoca Capital希望在本季度为其Web3和元宇宙投资基金募资约10亿美元,目前,正在与潜在投资者进行谈判,并将使用这笔资金支持区块链和元宇宙初创公司。此外,Yat Siu还表示,“加密市场是一个充满挑战的市场。但Animoca Brands仍对其保持相当大的兴趣”。

此前报道,去年11月30日,Animoca Brands联合创始人兼首席执行官Yat Siu表示,该公司计划推出规模最高达20亿美元的基金Animoca Capital,以投资元宇宙业务,并将这支计划中的基金描述为是“Web3业务的良好切入点”。(彭博社)[2023/1/5 10:23:04]

而迁移联邦学习指在两个数据集的用户与用户特征重叠都较少的情况下,利用迁移学习来克服数据不足的情况。

联邦学习有哪些应用场景?

联邦学习技术能够实现多个机构间构建统一的数据安全、高效、合规的多源数据应用生态系统,实现跨机构的数据共享融合,具备隐私保护、打破数据孤岛等优势,因此该技术逐渐成为了互联网巨头、金融机构以及人工智能企业等的关键技术支撑。

而随着隐私计算技术的成熟,联邦学习的商业化落地正在引来爆发,其在医疗、金融、政务等领域的应用也日渐丰富,为行业发展创造出更大的价值。

LooksRare更新挂单奖励规则,提升合规用户获得奖励的价值:10月20日消息,NFT交易所LooksRare平台对挂单奖励规则进行更新:1.更新后,每个钱包地址只有5个NFT系列合集的挂单可以获得奖励;更新前,每个钱包地址有资格同时获得奖励的有15个NFT系列合集。

2.更新后,每个钱包地址的每个合集最多200个符合条件的挂单获得奖励,这将由挂单价格按升序确定;更新前,在1.4 倍以内的所有挂单都可以获得奖励。

以上规则从2022年10月20日上午9:00 (UTC) 开始的挂单奖励期开始生效。本次更新(连同上一次更新)旨在为合规用户增加挂单奖励的价值,同时更有效地为热门NFT系列创造有意义的流动性。[2022/10/20 16:32:28]

金融

近年来,越来越多的金融机构相继开展联邦学习应用,主要集中在风控、营销以及反方面。金融行业需要各个行业维度的数据去覆盖各类业务产品与风控需求,而目前恶意欺诈、过度消费、重复授信等乱象层出不穷,传统的风控手段并不能满足复杂场景的应用需求。

尽管大数据的发展给予了风控手段有力的支持,但是数据的滥用又带来了数据隐私安全的问题,因此隐私计算便成为了这些问题的有效解决方案。

联邦学习技术能够保证在用户信息不泄露的前提下将更多维度、多元的数据纳入联合风控模型中,以构建更精准的风控模型。除此之外,隐私计算的技术在金融机构反侦测问题上同样有着较好的效果。

ETHGlobal公布HackMoney 2022中10家决赛入围项目:ETHGlobal公布HackMoney 2022中的10家决赛入围项目,包括带有DAO策略回测的金库风险分析仪表板Whip、跨链和跨协议存取款和流动性迁移项目Wido Router、反向竞标拍卖生成OK Vault、ETH波动率期货和永续合约协议EVIX、复杂指数项目Yield Index、DeFi产品发现游戏Hash Space、使用NFT作为抵押品的借贷协议Polypus、NFT链上期权交易平台Jpex、允许通过平均美元成本购买加密货币的BTFDCA以及抗MEV(最大可提取价值)的去中心化交易协议TEX。[2022/5/26 3:43:45]

通过横向联邦学习,能够在不共享用户数据的前提下,联合大型金融机构或联合多家金融机构,可以共同建立横向联邦反模型,提高侦测能力。

医疗

现代医学研究主要依赖于大数据技术的支持,具有样本数量规模大、特征维度多、信息价值含量高的医疗领域数据,才能满足医疗数据分析结果的适用性和模型预测的准确性。

比如结构化电子病历、非结构化电子病历、基因数据和图像数据等,这些数据包括个人生物信息、药物使用情况、化验测试结果、门诊住院信息等。然而,这些数据涉及到个人隐私信息,要求在数据存储和数据使用方面能够保证保密性与敏感性。

因此联邦学习技术不仅能够满足在医学研究过程中用户隐私数据得以保护的条件,还能在医疗数据参与方在不共享原始数据的基础上,实现多方机构数据融合和机器学习联合建模,进而达到了数据价值共享的目标。

政务

数据作为数字经济发展的重要生产要素,一系列政策的颁布与执行,都对加快数据要素市场化流通、形成数据要素市场体系等提出要求。在政务领域,政务大数据、智慧城市、公共数据开放平台成为了推动数字经济发展的重要课题。

然而,政务大数据涉及税务、司法、交通、社保等多个方面,由于数据资产权利尚未获得有效的解决方案,导致政府部门共享数据意愿较低。除此之外,一些公共数据开放平台存在开放数据数量不多、质量不高、更新不及时等问题。

因此联邦学习相关技术呢能够与大数据开发组件集成,实现跨部门、与社会数据等安全共享。同时可以实现数据资源的定向使用,防止数据滥用所导致的隐私泄露问题。

联邦学习为何成为热门的新技术?

联邦学习为人工智能开了一扇窗

在隐私计算技术里,联邦学习算得上是发展最快、落地性最强的一个分支,而它的重要应用便是AI人工智能的机器学习。

为了更好地服务智能应用发展,人工智能技术正在不断演进。但若想要让人工智能真正做到接近人类的水平,需要海量且真实的数据支撑,对机器进行深层次训练,而数据安全、个人信息隐私等风险问题势必会成为影响人工智能赢得用户信任,从而实现大规模落地的重要因素。

然而事实上,人工智能市场一直由谷歌、微软、亚马逊等科技巨头主导,并且为了训练机器学习模型,传统机器学习通常采用集中式方法,需要将训练数据聚合在单台机器或数据中心中。而这种几近垄断化的机器学习方式可能会导致严重的数据安全问题。

尤其是对于手机用户而言,为了在这种集中式方法下训练或构建出更好的机器学习模型,手机用户必须通过将存储的个人数据发送到AI科技公司云端来交换所获得的个性化服务。但谁也无法保证,这些AI科技公司会不会未经用户允许而违法收集并利用用户的个人数据。

在这样的大环境下,可以实现数据保护以及数据边缘化的“联邦学习”应运而生。

与集中式训练方法相比,联邦学习在人工智能领域开辟了一个全新的研究领域,它使位于不同地理位置的移动设备能够协同学习、构建机器学习模型,同时保证用户的个人数据依旧保留在原始设备上。

在联邦学习的帮助下,机器学习能够获得更真实、有价值的用户数据,为用户提供更贴近需求的个性化服务,提升用户体验。但更重要的是,用户的个人数据不需要发送到云端集中处理,而是依旧保存在用户的移动设备中,保证用户数据不受侵害。

除此之外,联邦学习所实现的利用分布式计算资源来训练机器学习模型正在为AI人工智能开辟一种全新的计算范式。

随着手机等终端设备内部的计算资源变得越来越强大,特别是随着人工智能芯片组的出现,人工智能正在从云和数据中心转移到终端设备。考虑到全球有数十亿台移动设备,这些移动设备积累的计算资源远远超出了世界上最大的数据中心的能力范围。

从这个意义上说,联邦学习开辟了一种解决大规模人工智能的机器学习问题的新思维方式,成就了新的云计算范式。

联邦学习与区块链强强联合

2019年,人工智能发展迎来了春天,也是从那时开始,我们看到了去中心化人工智能市场的可能。

联邦学习对于人工智能的机器学习提出了重要的分布式概念,而区块链也是凭借透明化、分布式等优势获得了广泛关注和讨论。可以说,在分布式这点上,联邦学习与区块链有着异曲同工之妙,而融合发展似乎也是水到渠成的事情。

首先,联邦学习的应用不可能阻隔两个或多个机构共同协作,参与者间要有一定交流,并且参与方越多,越能体现数据结果的准确性。

而结合区块链技术,让更多数据上链,通过区块链的授权机制、身份管理等,将互不可信的用户作为参与方整合到一起,建立一个安全可信的合作机制,最后通过联邦学习模型,将计算的数据结果加密安全地传递出去。

并且,联邦学习的所有模型参数都可以存储在链上,区块链的不可篡改特性保证了模型参数的一致性与可靠性,也能保证模型数据同步与共享是安全、可信的。同时,区块链的经济模型也能帮助实现资源分配。

在模型训练完成后,可以根据训练过程中各参与者提供的训练数据数量和质量发放奖励资源,并将奖励资源写入区块链中,利用区块链的公开透明特性,引入更多的参与方加入、同时提升参与方的配合程度。

就上面列出的机会而言,联邦学习似乎是最能响应市场需求的应用,也是最贴近目前科技发展方向的一项热门的新技术。

不过,联邦学习目前依旧处于探索发展阶段,未来在技术升级及商业落地上还有很长的路要走,也许5年、也许10年,联邦学习仍面对着诸多可以改进的地方与挑战,但相信在这些改变来临之前,人们已经做好了迎接的准备。

联邦学习发展前景与趋势

根据信通院发布的《2020隐私保护计算技术研究报告》显示,2020年隐私计算平台和产品迎来了巨大的增长,而通过评测的联邦学习产品多达18款。

尽管国内2018年才兴起联邦学习,但从“隐私计算联盟”的成员单位来看,拥有联邦学习平台和产品的企业已经超过60多家,增幅喜人。

除了前文我们提到的联邦学习应用方向之外,广告领域在未来或许也会成为继续引领联邦学习发展的方向。我们知道,广告主和流量平台拥有各自的数据,但两者往往又不会交集,所以需要整合,而在此前提下,通过联邦学习可以很好地将广告主和流量平台的数据撮合在一起,从而实现最大效益化,这也是联邦学习应用的重要实践。

但这也引申出一些发展趋势,即联邦学习需要更好的安全监管,毕竟数据的融合可以让原本模糊的分析变得更加精准,这意味着能否既使用好数据,又能保护好原始数据,所以这也是为什么联邦学习常常会与其他隐私计算方式相结合,借助互相的优势达到数据使用的最好效果,或许这在未来一段时间会继续保持下去。

另外,由于不同联邦学习平台都有自己的一套规则,如果未来需要更大发展,还需要监管机构或者权威第三方介入,以建立比较主流的规则或者监管,以让联邦学习落到更多数据使用场景中。

总体来说,联邦学习作为隐私计算应用较广的一种方式,受到了前所未有的关注,但由于起步较晚,目前依然需要更多关注和组织互相协作起来,如此才能迎来大步前进。

本文为论道隐私计算团队原创,未经允许严禁转载,如需转载请联系我们。

来源:金色财经

标签:人工智能区块链NIMSOL人工智能币交易国内最好的区块链公司UNIM价格Soldex

火币APP热门资讯
CRE:9.10大饼多头发力强势拉升 以太陷入震荡_CREDIT

9.10比特币行情解析大饼昨日整体呈小碎步上涨,早间最高位至21600附近承压回落,整体维持在21000上方运行,震荡后再次选择走高,小时级别能量柱转为空心说明空头力度减弱,空头逐步缩量.

1900/1/1 0:00:00
SOL:尽管SOL有看涨趋势 但目前走势依旧看跌_SOLA币

在从9月2日的低点上涨近10%之后,Solana具有看涨势头。截至发稿时,SOL为30.5美元。在同一时期,比特币在1.96万美元至1.99万美元之间横盘整理.

1900/1/1 0:00:00
OIN:大盘箱体破位在即 向上还是向下?_MustangCoin

世界上只有两种人:一种是观望者,一种是行动者。大多数人都想改变这个世界,但没有人想改变自己。要改变现状,就得改变自己,要改变自己,就得改变自己的观念.

1900/1/1 0:00:00
WEB:思考 Web3 底层价值 如何用它做好投资_加密货币

我们该怎么定义Web3??Web3的底层价值是自由市场+信用机器。对于重要的概念,我们有必要根据自己的理解下一个定义.

1900/1/1 0:00:00
ETH:以太坊合并之际 有哪些不可忽视的安全问题?_区块链

本章节主要介绍以太坊合并使用PoS共识机制以后,可能面临的共识层面的攻击。小型质押者的攻击短程重组这是一种针对信标链的攻击,该攻击通常由攻击者向其他验证者隐藏部分信息,然后在某个特定时刻发布,从.

1900/1/1 0:00:00
比特币:孙宇晨携USDD登上美国知名科技博客TechCrunch_TRO价格

美国东部时间9月8日,波场TRON创始人孙宇晨携USDD稳定币登上美国知名科技博客TechCrunch。这是其在亮相纽约时代广场大屏后,首次登上网站类平台进行展示.

1900/1/1 0:00:00