月亮链 月亮链
Ctrl+D收藏月亮链
首页 > USDC > 正文

CHA:AI“百模大戰”打響,誰能稱王?_CHAT

作者:

时间:1900/1/1 0:00:00

来源:《科创板日报》

记者张洋洋

“根据现在的反馈,任务性能测试上,包括ChatGPT在内,没有一个大模型能够全部达标。”这基本上是业内对雨后春笋般不断涌现的人工智能大模型的共识。

ChatGPT推出后,基于大语言模型技术的同类型产品还在加快涌现。进入4月以来,从互联网大厂,到A股上市公司,以及一众创业公司,再加上高校科研院校,都先后发布各自的大模型,总数已经超过30家。

短短数月,多个模型竞相涌现,各家模型实力究竟如何?国内大模型是否过剩了?行业终局,究竟是百花齐放,还是赢家通吃?在这场技术变革的讨论声中,大模型带来的新能力里,哪些是最为关键的,最有可能带来长期影响的?

AI大模型如雨后春笋任务性能测试还未有“满分答卷”

据民生证券的统计,国内已有超30个大模型亮相,行业俨然一副“百模大战”的场景。

Kanpai Pandas宣布推出动态稀有度系统:金色财经报道,NFT项目Kanpai Pandas在社交媒体宣布推出动态稀有度系统(Dynamic Rarity System),用户可以使用“熊猫积分”来购买新特征以提升或降低排名,但1 of 1 NFT(总共 15 个)和 Infinity Pandas(总共 247 个)不能改变特性,只能保持原样。上月底该NFT系列宣布成立Panda Lab并设置了六种不同的特征稀有度等级,每一种都会以不同的方式影响NFT稀有度,具有不同的成本、数量限制和稀有度分数。[2023/4/16 14:06:35]

根据《科创板日报》记者约访的人工智能行业人士反馈来看,业内目前还没有就具体模型给出直接的评判定论,但他们提供了一些维度,供外界做参考。

思必驰联合创始人兼首席科学家、上海交通大学教授俞凯在接受《科创板日报》记者采访时表示,一个必须要承认的事实是,现在的大模型,只有ChatGPT通过了通用性测试,国内大模型与之对比,均还存在差距。

俞凯告诉记者,衡量一个大模型实力,第一是可以基于任务的性能测试,即通过定义任务集的方式,去比较所有大模型在每个任务上面的完成度。这种性能测试与人类能力对齐,包括理解能力、推理能力、判断能力等。根据现在的反馈,任务性能测试上,包括ChatGPT在内,没有一个大模型能够全部达标。

前Polychain Capital 合伙人加入 Katie Haun 旗下风投机构 KRH:2月10日消息,前Polychain Capital 普通合伙人、前Coinbase高管Sam Rosenblum宣布加入前a16z合伙人Katie Haun 新创立的风险投资机构KRH,担任其交易团队成员。

此前,a16z前高管 Rachel Horwitz、Tomicah Tillemann 和 Nick Pacilio,及前Airbnb政策和传播主管 Chris Lehane加入KRH团队。

KRH 由Katie Haun 从a16z离开后,于去年年底成立,目前已通过两个基金筹集 9 亿美元。当前KRH 已参投OpenSea 3 亿美元融资及 NFT 初创公司Autograph的1.7 亿美元融资。(theinformation)[2022/2/10 9:41:46]

第二,从安全性角度去判断,这一点更多的体现为大模型与人类价值观的耦合程度。

第三,是模型运行角度,从工程特性去判断。“这是一个特别重要的能力。”俞凯强调,如该大模型能够接收多大的文本、回答反应的速度、运行的性能等。

俞凯所言,侧重于技术指标。当然,也有从资源禀赋层面作出判断的。

公告 | Binance Launchpad 将上线Fetch.AI售卖项目:币安发布公告称,Binance Launchpad 将于2019年02月25日22:00(香港时间)上线 Fetch.AI(FET)售卖项目,并开启 BNB专场。兑换比例:1 FET = 0.008584 BNB / 0.0867 美元(基于 10.1001 美元的BNB价格)。[2019/2/25]

大模型领域资深行业人士王钧则告诉记者,做大模型对团队要求非常高,资金、技术、工程、产品、商业化等多个方面都不能有短板,最终考验的是:核心成员对大方向、大节奏有没有真正想清楚,能不能获取足够多的资源和支持,能否吸引各方面的关键人才加盟,吸引了一群不同背景的牛人之后,能不能磨合好。

“其中最稀缺的是核心算法研究和平台工程的技术人才,这方面整个华人圈子人数都不多。”王钧强调。

人才之争,这在大模型市场的起势阶段已有十分鲜明的写照。

“先发制人”的百度,派出的掌舵者是CTO王海峰,创业者团队中,澜舟科技的周明,衔远科技的周伯文等,他们在人工智能行业的影响力已经无需多言。此前,高调官宣人工智能创业的王慧文,入局的第一步就是在其个人社交媒体平台发英雄帖,重金招聘顶级研发人才。

声音 | NUClain创始人赵华国:使用区块链至少能缩短现有跨境电商物流60%的成本:12月31日讯,近日,在上海区块链大会暨区块链结合实体经济创新峰会上,NUClain创始人赵华国表示,基于区块链的智能制造,非常看好。供应链金融、跨境电商、跨境电商的结算、支付以及跨境物流的问题,使用区块链技术至少能够缩短现有的跨境电商物流60%的成本。并提出十大应用场景的三个观点,一是ToC的应用,二是ToB的应用在增信类金融行业的应用,三是硬件。[2018/12/31]

“判断做得好不好的标准,不能看各公司自己的宣传,一些业界公认的评测基准当然也可以作为参考,但最重要的还是用户的认可,用户尤其是高频或者付费用户最多的才是最好的。”王钧称。

逼近了AGI核心产业应用“泛化性”才是关键

囿于各种商业原因,对于各公司大模型实际的数据、测试反馈指标、投入的资源情况,乃至用户数据等,外界很难全然知晓,那么对其实力情况,也很难去做全然科学的判断。

但记者注意到,受访者们均提到了一个显性的评测角度,那就是“用户反馈”,如回答的反应速度、准确性、可用性、上下文连贯逻辑等。这也是为何,每逢一个大模型新品推出,用户第一时间会去关注回答是否会“翻车”。

就国内当下几个代表性大模型,《科创板日报》记者此前均有过实际体验,结合多位用户的使用反馈,目前大模型整体呈现如下特征:

动态 | 巴西零售巨头与区块链支付服务Airfox达成合作:据cointelegraph报道,巴西零售巨头Via Varejo与区块链支付服务Airfox合作以“推动采用”。Via Varejo拥有家用电器和家具连锁店Casa Bahia,正在将Airfox的数字银行平台整合到其电子商务平台以及近1000家线下商店中。根据新闻稿,客户可以通过Airfox直接付款购买Casa Bahia的商品,或可以使用Airfox提供的小额贷款。据报道,客户还可以在其连锁店的位置使用该应用程序存入和取出现金。[2018/9/14]

ChatGPT-4是一个多模态大型语言模型,支持图像和文本输入,以文本形式输出,在“模拟人类”的文本输出方面,以及用户规模上,综合实力领先。

相比之下,国内大模型种类多样,能力各有千秋,目前更注重探索产业应用,用于解决产业技术壁垒问题。

在中文语义方面,国内包括文心一言、千义通问等各模型理解能力有高有低,并未明显拉开距离。在对刁钻中文语句的理解方面,因国内大模型的训练数据主要来自中文语料库,相比于ChatGPT主要来自英文语料库,国产大模型因而会更胜一筹。

但也有个例。复旦大学邱锡鹏教授团队发布国内首个类ChatGPT模型MOSS,其英文回答水平比中文高,原因在于,英文作为科研主流语言,在学术界和工业界中得到广泛应用,积累了大量高质量的语料数据,且相较中文数据,英文数据开源程度高。

另外,MOSS在设计时考虑了人类的伦理道德准则,不会产生有偏见或可能有害的回答,这在一定程度会避免一些潜在的法律风险和商业伦理问题。这一点上,ChatGPT则没有明确地处理。

大模型测评声仍在此起彼伏。但俞凯坦言,目前去评判各模型能力如何以及好坏,其实不是合适的时间点。

在他看来,现在已经面世的大模型,变革在于,基本都已实现思维链的涌现能力,逼近了AGI最核心的部分,业界现在更关注大模型是否有足够的“泛化性”,即广泛使用,但从产业角度而言,国内大模型的用户量级也还未达到泛在化。

“在未达到广泛的通用性之前,以通用性的标准去做评判,还是需要慎重。”俞凯强调。

大模型并未过剩先发者未必就是"王者"

多个模型短期内同时涌向市场,也有观点提出,现在需要这么多大模型吗?换句话说,大模型现在过剩了吗?

行业普遍认为,尽管现在这么多大模型出现,但还远达不到过剩的程度。

王钧认为,大模型对厂商的技术、资金、实力要求,目前只能说现在的产品刚刚能够用得上。

俞凯表示,未来的行业AI应用范式将从一个通用模型变成一簇通用模型,大模型会分化,如按照领域区分,按功能区分,结合具体行业具体场景。现在来看,非常专业的精深大模型还没出来,这些会在今后不断涌现。

达观数据创始人兼CEO陈运文在接受《科创板日报》记者采访时也表示,大模型赛道目前国内是处于探索赶超阶段,技术本身也还不成熟,未来还有很大的成长空间,“就像现在的饮料品牌一样,如果拉长时间线来看,今天的大模型数量其实并不多。”

那么在未来,行业的终局,究竟是百花齐放,还是赢家通吃?

俞凯和陈运文均表示,未来将会是百花齐放的状态,原因就在于现在正处于起步阶段,未来大模型在每个行业里面生长出来的产品形态都会不一样,而面向不同的行业,也将会出现垂直行业的应用模型。

王钧则表示,大模型的高门槛决定了这是少数玩家才能做的事情,未来不会是百花齐放的姿态,但究竟会不会像搜索引擎一样一家独大,还是操作系统只有两三家的局面,亦或是云计算多家发展的格局,“现在没法判断,还是有些变量。”

多位资深业内人士告诉《科创板日报》记者,在人工智能大模型上,OpenAI只是暂时一个暂时领先的“先发者”,微软绑定OpenAI后确实取得了一定的竞争优势,但要看到谷歌、亚马逊、Meta等也正在奋起直追。未来到底哪家公司能够携AI大模型取得类似苹果今天一样的全球市场地位,目前还极难判断。先发者并不是最后王者的案例太多太多,以中国互联网发展为例,最先出发的是新浪、搜狐、网易,但后面真正切得大蛋糕的却是腾讯、阿里和字节等。

要更多地关注和深入思考AI的应用场景

无论是诧异ChatGPT的惊人表现,还是对“百模大战”的思考,今日种种关于大模型的讨论,本质无外乎这场技术革命给人类带来的机会和挑战。

但在网易有道CEO、计算机科学博士周枫看来,在这场技术风潮讨论中,还有一个问题没有被充分讨论,那就是大模型带来的新能力中,哪些是最为关键的,最有可能带来长期影响的。

周枫认为,与之前众多的自然语言处理技术相比,大语言模型至少具有三项根本性新能力:涌现能力、作为基座模型支持多元应用的能力、支持对话作为统一入口的能力。

周枫表示,涌现能力之所以重要,不仅因为它们是大模型出现后才有的新能力,而且由大模型涌现出来的,多数是非常重要的能力。例如,常识推理能力一直是AI领域的重大难题,而大模型的出现使得常识推理取得了重大进展。再比如,一旦‘推理‘能力涌现,“思维链提示”策略就可以用来解决多步推理的难题。“因此,涌现能力的出现,是大模型带来的一项根本性变化”。

在基座模型方面,周枫说到,大型模型不仅可以缩短每个具体应用的开发周期,减少所需人力投入,也可以基于大模型的推理、常识和写作能力,获得更好的应用效果。因此,大模型可以成为AI应用开发的大一统基座模型,这是一个一举多得、全新的范式,值得大力推广。

本轮让大语言模型真正火爆的契机,是基于对话聊天的ChatGPT。周枫表示,虽然之前的聊天机器人存在各种问题,但大型语言模型的出现再次让聊天机器人这种交互模式可以重新想像。未来或将涌现出很多类似的以对话形态让助手完成各种具体工作的项目。

“这三项能力在学术界已经被广泛讨论,甚至被视为常识,但是在产业界和产品团队中却缺乏足够的关注。”周枫称,“这些大模型技术的特点已经改变了我们对业务和产品规划的思考方式,也会改变很多产品的经济模型。因此,产品经理和业务负责人需要更多地关注和深入思考这些新能力的应用场景。”

俞凯也认为,在这场技术变革,除了技术层面的参数量级,资源层面的算法、算力、数据、人才资金等的讨论,更需要关注的是,除大语言模型之外,其他与人工智能体系相关的东西。

这些就包括对语言的理解,对对话式人工智能的理解,以及对多模态人工智能的理解等。这些不仅是单独算法的问题,还关涉业务,训练策略,以及对人工智能技术历程的理解。

标签:CHAATGGPTCHAT最新版blockchain钱包Catge CoinGenerative GPTCHAT币

USDC热门资讯
APP:浅谈帐户抽象将如何推动DeFi的大规模采用?_WEB

原文作者:ValHolla原文编译:深潮TechFlow“我们还处于早期阶段”有点成为了一种Meme,但不可否认的是这是事实。试着让100个人说出以太坊上的五个应用程序.

1900/1/1 0:00:00
WEB:Web3 营销:项目方如何使用空投奖励以及激励真实用户_WEB3

Apr.2023,Daniel在GameFi中,举行成功的空投活动是最难做到的事情之一。虽然今年Arbitrum和Blur的活动再次使空投成为一个热门话题,但通过空投赚取收益造成了一个机器人问题.

1900/1/1 0:00:00
LET:慢雾:警惕 Web3 钱包 WalletConnect 钓鱼风险_trustwallet钱包下载

WalletConnect钓鱼风险介绍2023年1月30日,慢雾安全团队发现Web3钱包上关于WalletConnect使用不当可能存在被钓鱼的安全风险问题.

1900/1/1 0:00:00
ETH:「质押大战」即将到来?一文盘点主流LSD协议特点及优缺点_beth币关联

原文作者:Web3_buidl原文编译:YvonneDeFi战场已出现过几场知名「战争」,如Curve之战和DEX流动性之战。以太坊上海升级已启动下一个战争叙事——质押大战.

1900/1/1 0:00:00
区块链:a16z:代币模型设计的7个准则_BOSAGORA

原文作者:GuyWuollet原文标题:7SanityChecksBeforeDesigningaToken原文来源:a16z编译:Yvonne,MarsBit代币是一种功能强大的新原语.

1900/1/1 0:00:00
NFT:OG接连退场 NFT文化已死?_coin币官网

近期有一部分NFT投资者和大户因为一些状况或NFT市场变化而退圈,随之而来的是一些人对NFT的「唱衰」,NFT资深玩家wale.swoosh发文解释了NFT的现状.

1900/1/1 0:00:00