CHI:一文了解 ChatGPT 等 LLMs 得到明显改进的 3 个变化_CRYP

作者：

时间：1900/1/1 0:00:00

原文作者：TanyaMalhotra

来源：Marktechpost

近年来，大型语言模型在全世界受到了广泛赞赏，并在自然语言处理领域备受欢迎。这使我们能够使用比以往任何时候都更好、更清晰的语言理解来描述智能系统。

诸如GPT-3、T5、PaLM等LLMs的性能有了显着提高，并且这些模型将继续存在，因为它们可以完成从通过学习阅读来模仿人类，到生成文本和总结长段落内容的所有工作。而根据一些深入的研究，如果LLM的规模很大，那么它的表现就会很好。通过在大量数据上训练这些模型，它们可以理解人类语言的语法、语义和语用学。?

研究：TikTok上加密相关视频超三分之一具有误导性:4月22日消息，根据DappGambl研究显示，超过三分之一的加密TikTok视频具有误导性。其中，47%的TikTok创作者试图通过推动服务来赚钱，包括KimKardashian、JakePaul和SouljaBoy在内的主流创作者。此外，带有加密相关标签的TikTok视频，例如crypto、cryptok、cryptoadvice、cryptocurrency、cryptotrading和cryptoinvesting，累计产生了超过60亿次观看。[2023/4/22 14:20:11]

由OpenAI开发的流行的大型语言模型ChatGPT之所以发展得如此之快，正是因为采用了人类反馈强化学习等先进技术。通过RLHF，机器学习算法结合并使用人工输入提高了模型的性能。它针对预训练的LLM进行了微调，用于开发聊天机器人、虚拟助手等任务。

元宇宙音乐平台Authentic Artists宣布完成战略融资:6月22日消息，元宇宙音乐平台Authentic Artists宣布完成一轮战略融资，华纳音乐集团，CrushVentures，CrushMusic，耐克RTFKT创始人StevenVasilev和TheSandbox联合创始人SebastienBorget等参投。该轮融资旨在加速其人工智能(AI)驱动的元宇宙音乐平台的开发进程，塑造WarpSound音乐品牌，并寻求助力未来发展的合作伙伴。

据悉，Authentic的创世音乐NFT系列WVRPS by WarpSound是OpenSea上迄今为止排名第一的音乐NFT系列，包含9999种独特的视觉特征驱动的音乐声音，由Authentic的生成音乐技术实现。（businesswire）[2022/6/22 6:49:13]

此外，ChatGPT等LLMs所基于的预训练基础模型也得到了明显的改进。这主要是由于三个方面的变化：

Nansen以超过1000万美元的价格收购了Ape Board:金色财经消息，Nansen已经收购了DeFi投资组合仪表板Ape Board，具体的收购价格没有透露，但据说超过1000万美元。

两家公司表示，Ape Board的多链覆盖将为交易者提供市场的整体视图，而不需要他们使用多个平台来跟踪他们的投资和分析市场。Nansen计划将其分析与Ape Board的投资组合跟踪相结合，打造一款“一体化的超级应用”。（CoinDesk）[2022/5/18 3:23:48]

1.实践证明，模型的扩展性对提高其性能很有帮助。以Pathways语言模型为例，该模型通过扩展小样本学习大大影响了其性能，小样本学习可以减少根据具体应用调整模型所需的特定任务训练实例的数量。

通过使用Pathways语言模型在6144TPUv4芯片上扩展和训练5400亿个参数，PaLM展示了重复扩展的好处，其表现超过了各种传统模型，并显示出很大的进步。因此，深度和宽度的扩展都是提高基础模型性能的一个重要因素。

2.另一个变化是在预训练时增加标记数量的过程。像Chinchilla这样的模型已经证明，通过增加预训练数据，大型语言模型的表现会更好。

Chinchilla是一个计算最优模型。在相同的计算预算下，在70B参数和比Gopher模型多四倍的数据上进行训练，Chinchilla的表现一致优于Gopher，它甚至比GPT-3、Jurassic-1和Megatron-TuringNLG等LLMs效果更好。这清楚地描述了对于每一个计算最优的训练，标记的数量应该相应地缩放——即模型大小的两倍，因此训练标记的数量应该是两倍。?

3.第三个变化是使用干净和多样化的预训练数据。Galactica的性能证明了这一点，它是一种存储、混合和推理科学知识的大型语言模型。经过几篇科学论文文本的训练，Galactica的表现优于GPT-3、Chinchilla等模型。另一个大型语言模型BioMedLM是一种针对生物医学文本的特定领域LLM，在针对特定领域数据进行训练时，它表现出了巨大的性能提升。它清楚地表明，在特定领域的数据上进行的预训练胜过在通用数据上的训练。

结论

LLMs的成功无疑归功于多种因素的混合，包括RLHF的使用和预训练基础模型的发展。这三个变化极大地影响了LLMs的性能。此外，GLaM通过使用稀疏激活的混合专家架构，以更少的训练成本扩展模型的容量，从而显着提高了性能。因此，这些变化为更高级的语言模型开辟了道路，而这些模型将继续让我们的生活变得轻松。??

标签：CHI CRY CRYP CRYPT KODACHI价格 Cryptotem Global Anti Scam Crypto Tribalpunk cryptoverse