月亮链 月亮链
Ctrl+D收藏月亮链
首页 > Polygon > 正文

GPT:金融圈注意了 BloombergGPT来了_MGPT币

作者:

时间:1900/1/1 0:00:00

ChatGPT引爆的AI热潮也“烧到了”金融圈,彭博社重磅发布为金融界打造的大型语言模型——BloombergGPT。

3月30日,根据彭博社最新发布的报告显示,其构建迄今为止最大的特定领域数据集,并训练了专门用于金融领域的LLM,开发了拥有500亿参数的语言模型——BloombergGPT。

报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。该模型在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。

一般来说,在NLP领域,参数数量和复杂程度之间具有正相关性,GPT-3.5模型的参数量为2000亿,GPT-3的参数量为1750亿。

新加坡金融监管机构暂停Bitget的本地业务:12月5日消息,新加坡金融监管机构暂停Bitget的本地业务,该交易所涉及一项声称与韩国最大男子乐队BTS有联系的加密养老金计划。(AFR)[2021/12/5 12:51:54]

关于BloombergGPT

报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练:

彭博社主要是一家金融数据公司,数据分析师在公司成立的四十年的时间里收集了大量的金融文件,拥有广泛的金融数据档案,涵盖了一系列的主题。

我们将这些数据添加到公共数据集中,以创建一个拥有超过7000亿个标签的大型训练语料库。

使用这个训练语料库的一部分,我们训练了一个具有彭博风格的,达500亿参数的模型,该模型是根据Hoffmann和LeScao等人的指导方针设计,基于通用和金融业务的场景进行混合模型训练。

小米金融科技总经理姜永强:小米正在进行区块链新基建应用的研究:金色财经现场报道,8月5日“2020Cointelegraph中文大湾区·国际区块链周 ”在深圳举行。小米金融科技总经理姜永强在“机遇·抉择 新基建浪潮下,产业如何搭乘区块链快车”圆桌论坛上表示,小米正在进行区块链新基建应用的研究,也制定了比较好的方案策略,希望帮助实体经济,包括银行等机构解决目前中心化金融的问题和困局,基于小米的开放平台,更多的赋能新基建、帮助区块链产业发展应用。[2020/8/5]

结果表明,我们的混合训练方法使我们的模型在金融任务上的表现大大超过了现有的模型,而在通用场景上的表现则与之相当甚至优于现有模型。

加拿大一金融科技公司指控ConsenSys窃取商业机密:加拿大金融科技公司BlockCrushr在纽约提起诉讼,指控区块链科技公司ConsenSys窃取商业机密。BlockCrushr称在推出自己的产品前一天,ConsenSys推出了一个基于以太(ETH)的定期支付平台,名为“雏菊支付”(Daisy payments)。投诉称,被告在Tachyon加速器计划中披露的商业机密启动了Daisy Payments。(Cointelegraph)[2020/7/16]

1.BloombergGPT优势:特定领域模型仍有其不可替代性且彭博数据来源可靠

在论文中,彭博社指出,现阶段,通用的自然语言处理模型可以涵盖许多领域,但针对特定领域模型仍有其不可替代性,因彭博社的大多数应用均为金融领域,着手构建了一个针对金融领域的模型尤其优势,同时可以在通用LLM基准测试上保持竞争力:

除了构建金融领域的LLM外,本文的经验也为其他研究领域的专用模型提供了参考。我们的方法是在特定领域和一般数据源上训练LLM,以开发在特定领域和通用基准上表现优异的模型。

动态 | 青岛市将推进区块链等技术运用 建设国际航运贸易金融创新中心:据中国水运报8月12日消息,近日,《青岛市国际航运贸易金融创新中心建设攻势作战方案》对外公布,《方案》指出,青岛要发展绿色智能港航,推进互联网、大数据、物联网、区块链、人工智能等信息技术运用,建设青岛国际航运中心现代航运服务信息化支持保障平台。[2019/8/12]

此外,我们的训练数据不同于传统的网络爬取数据,网络上的数据总有重复和错误,但我们的数据来源可靠。

2.BloombergGPT的训练数据集:

BloombergGPT的训练数据库名为FINPILE,由一系列英文金融信息组成,包括新闻、文件、新闻稿、网络爬取的金融文件以及提取到的社交媒体消息。

韩国金融委员会宣布必要时将会探讨制定人均交易限额的计划:韩国金融委员会宣布将于明年1月中旬完成对虚拟货币反业务的指导原则对于虚拟货币账户实行实名制度,投资者使用的所有虚拟账户都必须转入银行账户。以后必要的时候将会探讨制定人均交易限额的计划。[2017/12/28]

为了提高数据质量,FINPILE数据集也使用了公共数据集,例如ThePile、C4和Wikipedia。FINPILE的训练数据集中大约一半是特定领域的文本,一半是通用文本。为了提高数据质量,每个数据集都进行了去重处理。

对金融领域的理解更准

报告指出,在金融领域中的自然语言处理在通用模型中也很常见,但是,针对金融领域,这些任务执行时将面临挑战:

以情感分析为例,一个题为“某公司将裁员1万人”,在一般意义上表达了负面情感,但在金融情感方面,它有时可能被认为是积极的,因为它可能导致公司的股价或投资者信心增加。

报告指出,从测试来看,BloombergGPT在五项任务中的四项表现最佳,在NER中排名第二。因此,BloombergGPT有其优势性。

测试一:ConvFinQA数据集是一个针对金融领域的问答数据集,包括从新闻文章中提取出的问题和答案,旨在测试模型对金融领域相关问题的理解和推理能力。

测试二:FiQASA,第二个情感分析任务,测试英语金融新闻和社交媒体标题中的情感走向。

测试三:标题,数据集包括关于黄金商品领域的英文新闻标题,标注了不同的子集。任务是判断新闻标题是否包含特定信息,例如价格上涨或价格下跌等。

测试四:FPB,金融短语库数据集包括来自金融新闻的句子情绪分类任务。

测试五:NER,命名实体识别任务,针对从提交给SEC的金融协议中收集金融数据,进行信用风险评估。

对于ConvFinQA来说,这个差距尤为显著,因为它需要使用对话式输入来对表格进行推理并生成答案,具有一定挑战性。

ChatGPT为彭博点赞

华尔街见闻就这个问题专门询问了ChatGPT,ChatGPT认为BloombergGPT是一项很有意义的技术进步:

它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务,并且在金融领域的基准测试中表现出色。

这将有助于金融从业者更好地理解和应用自然语言处理技术,促进金融科技的发展。同时,BloombergGPT还可以为其他领域的语言模型的发展提供参考和借鉴。总的来说,BloombergGPT是一个有益的技术创新。

标签:GPTBLOMBEERGMGPT币老版本blockchainNumbers ChainENERGYX

Polygon热门资讯
ARB:Arbitrum发起AIP-1提案,拟引入Arbitrum DAO并申请10亿美元拨款_arbitrum币中文名称

金色财经报道,Arbitrum就一项为新成立的去中心化自治组织(DAO)引入管理机构的提案进行了投票.

1900/1/1 0:00:00
IDO:再质押的残局风险:以太坊的长期挑战不是让更多的人参与 而是让更少的人参与_VSYS币会成为第二个以太坊吗

作者:Tripoli再质押协议可能为验证者带来巨大的财务收益,但其成功可能会影响以太坊自我调节质押参与度的能力,并加剧中心化力量.

1900/1/1 0:00:00
加密货币:盘点15个免费且实用的Alpha信息渠道_THE

作者:Hoeem编译:Biteye核心贡献者Crush在加密圈子中,信息的获取往往是投资的关键。好的信息渠道,人们常常称之为Alpha信息渠道.

1900/1/1 0:00:00
MEV:藏在以太坊水面下的疯狂套利活动 "黑暗森林"MEV_NFT

作者:Terry前不久,数个顶级的MEV机器人遭到黑客攻击,黑客将MEV机器人的交易包拆解后,将部分交易替换从而盗走了MEV机器人的资金,损失约2500万美元.

1900/1/1 0:00:00
FACE:Facebook宣布将于4月11日起结束对数字收藏品的支持_CEB币

金色财经报道,Facebook在其帮助中心发布公告称,将逐步结束对数字收藏品的支持。这些变更将于2023年4月11日起开始生效。用户第三方电子钱包内容不会受到影响.

1900/1/1 0:00:00
人工智能:强人工智能时代 区块链还有戏吗?_区块链技术通俗讲解ppt

最近很多人都在问我,ChatGPT把AI又带火了,区块链和Web3被抢了风头,以后还有戏吗?还有比较了解我的朋友问,当年你放弃AI而选择区块链,有没有后悔?这里有一个小背景.

1900/1/1 0:00:00