月亮链 月亮链
Ctrl+D收藏月亮链
首页 > MANA > 正文

MOS:成立2年每名员工价值2100万美元 MosaicML凭什么卖出13亿美元?_aic币是不是局

作者:

时间:1900/1/1 0:00:00

MosaicML以约13亿美元的价格被大数据巨头Databricks收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值?

近期,AI领域掀起了一股投资收购热潮。全球知名企业Salesforce向Anthropic注资4.5亿美元,而Runway则成功筹集到了1.41亿美元的资金。此外,雪花公司也宣布完成了对Neeva的收购,而中国国内巨头美团则以20.65亿收购了AI公司光年之外。

然而,最引人瞩目的交易无疑是初创公司MosaicML的收购案。据了解,MosaicML以约13亿美元的价格被大数据巨头Databricks收购,其估值在本次交易中翻了六倍,成为了今年上半年最大的收购案。仅成立2年时间,拥有60多名员工,是什么撑起了MosaicML的高估值?

Databricks近期正式宣布,以约13亿美元(约93亿元人民币)收购生成式人工智能初创公司MosaicML,以提供为企业构建类ChatGPT工具的服务。

该收购之后,MosaicML 将成为 Databricks Lakehouse 平台的一部分,MosaicML 的整个团队和技术都将纳入Databricks旗下,为企业提供统一的平台来管理数据资产,并且能够使用自己的专有数据来构建、拥有和保护自己的生成式 AI 模型。

中央企业区块链合作创新平台正式成立:10月24日,由国网电商公司联合20余家中央企业共同发起的中央企业区块链合作创新平台成立大会在京召开。该平台由国务院国资委科创局指导,中国产学研合作促进会支持,定位于发挥中央企业引领力和带动力,搭建中央企业区块链服务网络,构筑区块链产业新业态,切实推动区块链技术成果在更广泛领域的价值转化,助力我国新型基础设施建设和数字经济发展。?(证券日报网)[2020/10/24]

MosaicML是一家非常年轻的生成式AI公司,它于2021年成立于旧金山,目前只公开披露过一轮融资,员工仅62人。在上一轮的融资中,其估值为2.2亿美元,也就是说,此次收购MosaicML的估值直接跃升了6倍。此笔交易是截至目前今年生成式AI领域内所公布的最大一笔收购案。就在不久前,云计算巨头Snowflake刚刚宣布收购了另一家生成式AI公司Neeva。在经历了几个月的投资热之后,大型企业对生成式AI初创公司的大规模并购潮似乎正在开启。

Databricks起源于UC伯克利,曾参与Apache Spark项目开发。作为数据存储和分析巨头,截至2022年估值310亿美元,帮助AT&T、壳牌、Walgreens等大型公司处理数据。前段时间,刚开源了自己大模型Dolly,旨在以更少参数实现与ChatGPT类似的效果。而在云计算更加普及后,Spark提出的“湖仓一体”理念,深深影响了一批大数据初创企业。自2013年成立后,Databricks火速成长为全球最火的Data Infra公司。去年,Databricks公布的年收入超过10亿美元,而在2021年8月完成最新一轮融资后,其最新估值达到380亿美金。

澳大利亚三家银行巨头成立公司 在区块链上提供银行担保:9月1日消息,澳大利亚四大银行中的三家正在组建一家名为Lygon的新公司,利用区块链技术将银行担保数字化。澳大利亚和新西兰银行集团有限公司、澳大利亚联邦银行和西太平洋银行公司,以及另外两家股东:澳大利亚购物中心公司Scentre集团和科技巨头IBM在去年的成功试点后组建了这家公司。(Cointelegraph)[2020/9/1]

MosaicML的MPT系列模型是从HuggingFace PretrainedModel基类中子类化的,与HuggingFace生态系统完全兼容。MPT-7B模型是MosaicML最受欢迎的模型之一,拥有数十亿个参数,可以处理超过2,000种自然语言处理任务。其中,MPT-7B的优化层包括FlashAttention和低精度层范数等,可以让该模型比传统训练方法快2-7倍,资源的近线性可伸缩性确保了具有数十亿参数的模型可以在几小时内训练,而不是过去的几天。MosaicML还发布了新的可商用的开源大语言模型MPT-30B,拥有300亿参数,并且性能优于GPT-3。

数据来源:MT-Bench对MosaicML主流模型进行的评估MPT系列模型的优势在于它们的高效性和低成本。使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而MosaicML的MPT系列模型可以让企业以更低的成本和更高的效率训练自己的语言模型,从而可以更轻松地应用生成式AI技术,实现更好的业务表现。大多数开源语言模型只能处理最多具有几千个tokens的序列(参见图 1)。但是,借助 MosaicML 平台和 8xA100-40GB 的单个节点,用户可以轻松微调 MPT-7B 以处理高达 65k 的上下文长度。处理这种极端上下文长度适应的能力来自ALiBi,这是MPT-7B中的关键架构选择之一。

Hubble Chain哈勃公链近日倡议成立联合国区块链协会并提交申请:据悉,近日Hubble Chain哈勃公链拟向联合国相关机构提交申请,倡议成立跨国际区块链协作研发协会,用以推动区块链行业快速发展迭代,并制定区块链行业通行标准。该协会若成立,将以联盟链为主导,探索中心化与分布式协作共存的行业发展新思路。哈勃生态将联合全球其它重要合作伙伴作为理事成员单位共同推进发展。[2020/4/18]

例如,《了不起的盖茨比》的全文不到68k个Token。在一个测试中,模型StoryWriter阅读了《了不起的盖茨比》并生成了一个尾声。模型生成的尾声之一如图 2 所示。StoryWriter在大约20秒内(每分钟约15万字)读完了《了不起的盖茨比》。由于序列长度较长,其“打字”速度比其他MPT-7B型号慢,每分钟约105个单词。尽管 StoryWriter 的上下文长度为 65k 进行了微调,但 ALiBi 使模型能够推断出比训练更长的输入:在《了不起的盖茨比》的情况下为 68k 个Token,在测试中高达 84k 个标记。

图2:MPT-7B-StoryWriter-65k+ 为《了不起的盖茨比》写了尾声。尾声的结果是提供《了不起的盖茨比》的全文(大约 68k 个Token)作为模型的输入,后跟“尾声”一词,并允许模型继续生成。生成式AI技术的普及生成式AI技术是人工智能的一种分支,它利用大量的数据和深度学习算法,能够自动生成原始文本、图像和计算机代码等内容。这种技术的出现,让人们可以更加便捷地处理数据、分析数据,更好地服务于人类的需求。随着大数据和人工智能技术的快速发展,生成式AI技术已经被广泛应用于自然语言处理、图像识别和虚拟现实等领域。例如,在自然语言处理领域中,GPT-4已经成为了最受欢迎的生成式AI模型之一,可以用于生成文章、翻译语言和回答问题等任务。在图像识别领域,StyleGAN2能够生成高质量的图像,可以用于游戏开发、影视制作和虚拟现实等领域。

动态 | 韩国央行将成立央行数字货币(CBDC)研究专项工作组:金色财经报道,韩国央行(Bank of Korea)周五表示,将成立一个专项工作组,致力于央行数字货币(CBDC)的研究,以更好地了解加密资产。在“2020年货币政策”中,韩国央行表示,将继续在分布式账本技术、加密资产和CBDC等创新研究的基础上,发挥监管机构的积极作用,以增强结算系统的安全性。央行还表示,将招募更多CBDC专家。不过,这并不意味着韩国央行将很快推出数字货币,一位央行发言人澄清称:“我们只是计划加强对CBDC研究的努力。”(韩国时报)[2019/12/27]

MosaicML的CEO Naveen Rao此前曾表示,自 2018 年以来,使用大量数据进行“训练”的人工智能模型的复杂度急剧上升,训练一个模型现在至少要花费数百万美元,除了大公司之外,其他中小型企业普遍都无法承受。而此次收购之后,Databricks的Lakehouse 平台和 MosaicML 技术的联合产品将能够让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,可以进行自定义 AI 模型开发。根据Databricks的相关说法,在 Databricks 和 MosaicML的平台和技术支持下,企业训练和使用 LLMs 的成本将显著降低,预计可以降至数千美元左右。这为生成式AI的普及提供了便利。

声音 | 李东荣:部分城商行通过成立金融科技子公司等方式开展区块链等技术应用:金融科技研究今天发布中国互联网金融协会会长李东荣在在第十二届中国城市商业银行信息化发展创新座谈会上的演讲整理稿,李东荣表示,有的城商行出台数字化银行战略和金融科技战略,通过跨部门创新委员会、独立事业部等组织载体,积极推进全行数字化转型战略实施。部分城商行勤练内功,通过成立金融科技子公司、金融科技创新实验室等方式,开展云计算、大数据、人工智能、区块链、物联网等数字技术创新应用,为数字化转型提供技术支持。[2019/5/21]

Databricks收购MosaicML的主要目的是加速生成式AI技术的发展和民主化。通过将两家公司的技术和资源整合起来,Databricks可以更好地满足客户的需求,提供更高效、更便捷的解决方案。具体而言,该收购将带来以下几个方面的改变:

Databricks收购MosaicML后,可以将MPT系列模型集成到其Lakehouse平台中,为客户提供更高效、更低成本的大语言模型。这将有助于企业更好地处理自然语言处理任务,提高业务效率和准确性。

MosaicML的MPT系列模型具有快速训练的特点,这将有助于Databricks提供更快速的模型训练服务。这对于需要快速响应市场需求的企业来说尤为重要,可以帮助他们更好地满足客户的需求。

Databricks收购MosaicML也意味着生成式AI技术的民主化程度将会进一步提高。MosaicML的MPT系列模型可以让中小型企业更轻松地训练自己的语言模型,从而可以更好地应用生成式AI技术,实现更好的业务表现。这将有助于推动生成式AI技术的发展和应用,促进人工智能技术的普及和发展。

生成式人工智能应用程序旨在根据用户的自然语言提示生成原始文本、图像和计算机代码。自去年11月人工智能初创公司OpenAI推出在线生成AI聊天机器人ChatGPT以来,人们对这项技术的兴趣激增。“每个组织都应该能够从人工智能革命中受益,并对其数据的使用方式有更多的控制。Databricks 和 MosaicML 有一个难以置信的机会来实现人工智能的民主化,并使 Lakehouse 成为构建生成式人工智能的最佳场所。”Databricks 联合创始人兼首席执行官 Ali Ghodsi表示。

Databricks收购MosaicML的意义不仅在于加速生成式AI技术的发展和民主化,更在于将两家公司的技术和资源整合起来,为客户提供更高效、更便捷的解决方案。随着人工智能技术的快速发展和应用,生成式AI技术将扮演着越来越重要的角色,Databricks收购MosaicML的举动也体现了各企业对于这个方向的重视和投资。像Anthropic和OpenAI这样的公司将现成的语言模型授权给企业,然后企业在其上构建生成AI应用程序。在对这些模型的强劲商业需求的推动下,为像MosaicML这样的初创公司创造了机会。从Snowflake和Databricks接连的收购步伐中我们可以看到,大型科技公司对于生成式AI技术正在从自主研发、战略投资逐步迈向兼并收购阶段。

参考来源:

https://www.databricks.com/company/newsroom/press-releases/databricks-signs-definitive-agreement-acquire-mosaicml-leading-generative-ai-platform

https://mattturck.com/mosaic/

https://twitter.com/lmsysorg/status/1672077353533730817/photo/1

https://www.mosaicml.com/blog/mpt-7b#appendix-eval

https://www.mosaicml.com/blog/mpt-30b

-R3PO

个人专栏

阅读更多

极客 Web3

Foresight News

金色财经 Jason.

白话区块链

金色早8点

LD Capital

MarsBit

深潮TechFlow

标签:MOSOSAAICSAIMOSOLIDSOSAMZ价格aic币是不是局SPORTSAI

MANA热门资讯
奥德赛:星巴克探索Web3已达半年 奥德赛计划都做了哪些事情?_奥德赛币圈奥德赛

作者:Web3 品牌营销星巴克一直以其创新能力而闻名,目前已在海外展开了奥德赛计划,这在许多关于探索 Web3 的公众号上都有所提及.

1900/1/1 0:00:00
比特币:肖飒:Web3南下“捞金” 留守IT团队还能活下来吗?_web3.0币狗狗币

引言新加坡和香港,飒姐都不陌生,甚至非常熟悉,分别有我的亲人和师友。Web3.0这波操作,双方有些针尖对麦芒.

1900/1/1 0:00:00
KUSA:Gavin Wood 演讲全文:波卡如何从“链为中心” 转变到以应用为中心_AMA

作者 :Gavin Wood,PolkaWorld 6 月 28 日,波卡的年度旗舰活动 Polkadot Decoded 大会在丹麦哥本哈根举行.

1900/1/1 0:00:00
GOO:Google Play加入NFT和区块链游戏浪潮 你准备好了吗?_Single Finance

据VentureBeat最近的一篇报道,Google Play已经更新了政策,允许在其应用商店中使用基于区块链的数字内容,包括NFT和其他通证化的数字资产.

1900/1/1 0:00:00
EKE:明星项目MEKE公测火爆开启 带动BNB L2交易量增加_BIT

在一层网络中,ETH、BNB都属于第一梯队,且BNB链绝对是足以和ETH竞争第一名的候选人。前不久BNB Chain推出了自己的L2- OpBNB,一款名为MEKE的链上衍生品交易协议,在研发多.

1900/1/1 0:00:00
zkSync:zkSync抄代码?Polygon Zero与Matter Labs隔空互怼_sync币怎么样

Polygon 官方旗下零知识证明团队 Polygon Zero,公开批评 zkSync,称其未经许可地复制了 Polygon 的开源代码,并发布误导性言论.

1900/1/1 0:00:00