月亮链 月亮链
Ctrl+D收藏月亮链
首页 > 火必下载 > 正文

atc:别再用平均池化层了!Meta AI把注意力塞到池化层,性能提升0.3_atc币是什么币FLOP币

作者:

时间:1900/1/1 0:00:00

编辑:LRS

注意力机制这么好用,怎么不把它塞到卷积网络里?最近MetaAI的研究人员提出了一个基于注意力的池化层,仅仅把平均池化层替换掉,就能获得+0.3%的性能提升!

VisualTransformer作为计算机视觉领域的新兴霸主,已经在各个研究任务中逐渐替换掉了卷积神经网络CNN。

ViT与CNN之间存在着许多不同点,例如ViT的输入是imagepatch,而非像素;分类任务中,ViT是通过对类标记进行决策等等。

classtoken实际上是ViT论文原作者提出,用于整合模型输入信息的token。classtoken与每个patch进行信息交互后,模型就能了解到具体的分类信息。

并且在自注意力机制中,最后一层中的softmax可以作为注意力图,根据classtoken和不同patch之间的交互程度,就能够了解哪些patch对最终分类结果有影响及具体程度,也增加了模型可解释性。

但这种可解释性目前仍然是很弱的,因为patch和最后一层的softmax之间还隔着很多层和很多个header,信息之间的不断融合后,很难搞清楚最后一层softmax是否真的可以解释分类。

Bakkt第二季度收入增至3.48亿美元,净亏损5050万美元:金色财经报道,总部位于纽约市的数字资产平台Bakkt报告称,今年第二季度其收入增至3.48 亿美元,较 2022 年同一季度的1400万美元大幅跃升。该公司表示其盈利数据包括 Bakkt在 4 月份收购 Apex Crypto 的交易,公司在收益声明中表示,这一收入反映了“Apex Crypto 交易活动推动的加密服务总收入大幅增长” 。

Bakkt 报告二季度净亏损 5,050 万美元,较去年第二季度的 2,760 万美元亏损有所扩大。

Bakkt第二季度交易量下降 51% 至 5.31 亿美元。此外,该公司的交易账户数量同比下降了20%,Bakkt将当前加密市场的“放缓”视为交易量下降的原因。Bakkt 表示,由于某些加密货币的价值上涨,该公司托管资产增加了3%,达到6.6亿美元。[2023/8/11 16:19:17]

所以如果ViT和CNN一样有视觉属性就好了!

最近MetaAI就提出了一个新模型,用attentionmap来增强卷积神经网络,说简单点,其实就是用了一个基于注意力的层来取代常用的平均池化层。

Chainge正式接入OKX Web3钱包,其TVL升至Dexes赛道前10:5月25日消息,据Chainge Finance官网显示,Chainge Finance现已正式接入OKX Web3钱包。作为全链去中心化DeFi应用聚合器,Chainge开创了跨链漫游功能。据DefiLlama数据显示,其目前在Dexes赛道的TVL已经进入前10行列,而所聚合的可供交易总流动性已高达350亿美元。

据了解,OKX Web3钱包是最全面的异构多链钱包,已支持近60公链,App、插件、网页三端统一,涵盖钱包、DEX、赚币、NFT市场、DApp探索5大板块。此外,OKX Web3钱包还支持Ordinals市场、创建MPC钱包、兑换Gas、iCloud/Google Drive备份助记词、自定义网络、连接硬件钱包等便捷功能。[2023/5/25 10:39:09]

仔细一想,池化层和attention好像确实很配啊,都是对输入信息的加权平均进行整合。加入了注意力机制以后的池化层,可以明确地显示出不同patch所占的权重。

SBF已同意被引渡到美国,其律师团队正制定引渡计划:12月20日消息,据外媒报道,前FTX首席执行官Sam Bankman-Fried(SBF)已同意被引渡到美国,当天的庭审结束后,他的律师团队正在制定引渡计划。SBF的律师希望最早在周二就此事举行新的听证会。

SBF的巴哈马刑事辩护律师Jerone Roberts与SBF及其美国律师Mark Cohen召开电话会议后,同意起草必要的文件。但他们警告说,SBF的法律计划仍在不断变化,可能会改变。(华尔街日报)[2022/12/20 21:55:31]

并且与经典ViT相比,每个patch都会获得一个单一的权重,无需考虑多层和多头的影响,这样就可以用一个简单的方法达到对注意力可视化的目的了。

在分类任务中更神奇,如果对每个类别使用不同颜色进行单独标记的话,就会发现分类任务也能识别出图片中的不同物体。

NEAR基金会发布透明度报告:每年5%的通胀率中的90%将发送给验证者以作为质押奖励支付:金色财经报道,NEAR基金会发布透明度报告。报告称,在创世时,NEAR区块链有十亿个代币。此后,供应数量增加到11亿。由于通货膨胀,这个数字稳步上升。作为参考,每年5%的通胀率中的 90%将发送给验证者以作为质押奖励支付,剩余的10%将返还给NEAR基金会金库。

真实账户总数一直在快速增长,总数达到2200万。目前,在 NEAR 上以平均每天 35,000 到 38,000 个新帐户的速度创建新帐户。这个数字比前一周有所下降,前一周平均每天有 37,000 -39,000 个帐户。[2022/11/27 20:56:56]

基于Attention的池化层

文章中新提出的模型叫做PatchConvNet,核心组件就是可学习的、基于attention的池化层。

安全团队:Mutant Cats项目Discord账户可能已被攻击:金色财经报道,据CertiK监测,Mutant Cats项目Discord账户可能已被攻击。请社区用户不要点击其中的任何链接。[2022/9/23 7:16:17]

模型架构的主干是一个卷积网络,相当于是一个轻量级的预处理操作,它的作用就是把图像像素进行分割,并映射为一组向量,和ViT中patchextraction操作对应。

最近也有研究表明,采用卷积的预处理能让模型的性能更加稳定。

模型的第二部分column,包含了整个模型中的大部分层、参数和计算量,它由N个堆叠的残差卷积块组成。每个块由一个归一化、1*1卷积,3*3卷积用来做空间处理,一个squeeze-and-excitation层用于混合通道特征,最后在残差连接前加入一个1*1的卷积。

研究人员对模型块的选择也提出了一些建议,例如在batchsize够大的情况下,BatchNorm往往效果比LayerNorm更好。但训练大模型或者高分辨率的图像输入时,由于batchsize更小,所以BatchNorm在这种情况下就不太实用了。

下一个模块就是基于注意力的池化层了。

在主干模型的输出端,预处理后的向量通过类似Transformer的交叉注意力层的方式进行融合。

注意力层中的每个权重值取决于预测patch与可训练向量之间的相似度,结果和经典ViT中的classtoken类似。

然后将产生的d维向量添加到CLS向量中,并经过一个前馈网络处理。

与之前提出的class-attentiondecoder不同之处在于,研究人员仅仅只用一个block和一个head,大幅度简化了计算量,也能够避免多个block和head之间互相影响,从而导致注意力权重失真。

因此,classtoken和预处理patch之间的通信只发生在一个softmax中,直接反映了池化操作者如何对每个patch进行加权。

也可以通过将CLS向量替换为k×d矩阵来对每个类别的attentionmap进行归一化处理,这样就可以看出每个块和每个类别之间的关联程度。

但这种设计也会增加内存的峰值使用量,并且会使网络的优化更加复杂。通常只在微调优化的阶段以一个小的学习率和小batchsize来规避这类问题。

实验结果

在图像分类任务上,研究人员首先将模型与ImageNet1k和ImageNet-v2上的其他模型从参数量,FLOPS,峰值内存用量和256张图像batchsize下的模型推理吞吐量上进行对比。

实验结果肯定是好的,可以看到PatchConvNet的简单柱状结构相比其他模型更加简便和易于扩展。对于高分辨率图像来说,不同模型可能会针对FLOPs和准确率进行不同的平衡,更大的模型肯定会取得更高的准确率,相应的吞吐量就会低一些。

在语义分割任务上,研究人员通过ADE20k数据集上的语义分割实验来评估模型,数据集中包括2万张训练图像和5千张验证图像,标签超过150个类别。由于PatchConvNet模型不是金字塔式的,所以模型只是用模型的最后一层输出和UpperNet的多层次网络输出,能够简化模型参数。研究结果显示,虽然PatchConvNet的结构更简单,但与最先进的Swin架构性能仍处于同一水平,并且在FLOPs-MIoU权衡方面优于XCiT。

在检测和实例分割上,研究人员在COCO数据集上对模型进行评估,实验结果显示PatchConvNet相比其他sota架构来说,能够在FLOPs和AP之间进行很好的权衡。

在消融实验中,为了验证架构问题,研究人员使用不同的架构对比了Transformer中的classattention和卷积神经网络的平均池化操作,还对比了卷积主干和线性投影之间的性能差别等等。实验结果可以看到卷积主干是模型取得最佳性能的关键,class-attention几乎没有带来额外的性能提升。

另一个重要的消融实验时attention-basedpooling和ConvNets之间的对比,研究人员惊奇地发现可学习的聚合函数甚至可以提高一个ResNet魔改后模型的性能。

通过把attention添加到ResNet50中,直接在Imagenet1k上获得了80.1%的最高准确率,比使用平均池化层的baseline模型提高了+0.3%的性能,并且attention-based只稍微增加了模型的FLOPs数量,从4.1B提升到4.6B。

参考资料:

https://arxiv.org/abs/2112.13692

标签:atcFLOPFLOatc币是什么币FLOP币FLOP价格FLO价格FLO币

火必下载热门资讯
DNA:国家卫健委发布《新型抗肿瘤药物临床应用指导原则(2021年版)》_ICP价格

行业政策 12月27日,国家卫健委发布《新型抗肿瘤药物临床应用指导原则(2021年版)》为规范新型抗肿瘤药物临床应用,提高肿瘤治疗的合理用药水平,保障医疗质量和医疗安全,维护肿瘤患者健康权益.

1900/1/1 0:00:00
APP:得到APP购课指南(六)——实操课和讲座_数字货币案例视频区块链工程专业学什么

得到APP购课指南得到APP购课指南得到APP购课指南得到APP购课指南得到APP购课指南继续向大家介绍得到APP内的课程,这篇主要介绍那些篇幅不长的有一定使用性的课程和小讲座.

1900/1/1 0:00:00
NFT:Highstreet与Taiko将于1月24日联合发售NFC-NEKO猫毯NFT_EKONFT价格

鞭牛士1月24日消息,NFT限量版产品兑换市场Highstreet与国际创意机构Taiko合作推出NFC-NEKO猫毯NFT.

1900/1/1 0:00:00
NFT:安全可靠的NFT项目 你知道都是如何审计的吗?_数字货币NFT价格

NFT项目审计概览 NFT是英语“NonFungibleToken”的简称,翻译过来即非同质化通证。一个NFT可以被理解为是存储在区块链上的一个独一无二的单元数据.

1900/1/1 0:00:00
数字人:数字人民币APP上架掀体验潮,多家平台下载量日均增超10倍_数字人虚拟主播软件

数字人民币(试点版)APP自1月4日上架后,掀起一波体验热潮。截至1月9日,华为应用市场的数字人民币(试点版)APP下载量已从上线首日的“不足万次”猛增至“超580万次”.

1900/1/1 0:00:00
NFT:Coinlist打新|币安Coinbase领投Project Galaxy 领先的WEB3数据_GAL价格API价格

我们很高兴地宣布,ProjectGalaxy代币销售的注册现已开放。ProjectGalaxy建立在开放和协作的基础架构之上,其使命是帮助Web3开发人员使用数字凭证数据和NFT来构建更好的产品.

1900/1/1 0:00:00