来源:钛媒体,作者|林志佳
图片来源:由无界AI工具生成
当ChatGPT引发中美科技行业狂热之后,它的缔造者美国OpenAI公司如今又在人工智能可解释性研究领域获得重大突破。
钛媒体App5月10日消息,OpenAI今晨发布一个关于GPT-4语言模型解析神经元的对齐性研究成果,利用自研基于GPT-4技术的开源工具,来尝试计算其他架构、更简单语言模型上神经元的行为并对其进行评分,而且可以将其应用于另一种语言模型中的神经元——本次选择4年前发布、包含307200个神经元的大模型GPT-2为实验样本,公开了这些GPT-2神经元解释和分数的数据集。
OpenAI遭集体诉讼 被控“窃取私人数据”:金色财经报道,一群匿名人士在一项集体诉讼中声称,ChatGPT的开发商OpenAI公司正在窃取“大量”个人信息,以训练其人工智能模型不顾一切地追逐利润。在这份长达157页的诉状中,这些匿名人士指责OpenAI从互联网上秘密抓取3000亿字,窃听了“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。克拉克森律师事务所(Clarkson Law Firm)在周三向美国旧金山联邦法院提交的诉状中表示,原告的姓名都是用职业或兴趣来描述的,但由于担心遭到反对,只能用首字母来标识。他们根据受伤害的个人类别估计有数百万人,提出了30亿美元的潜在损失。 (华盛顿邮报)[2023/6/29 22:08:43]
“我们的目标是使用Al来帮助我们理解Al”,OpenAI的这一研究对AI行业意味着,利用GPT-4和机器学习技术就能定义、测量AI可解释性,未来在神经元层将会产生“大模型比人脑更会思考”技术趋势。
OpenAI:ChatGPT网站的故障已得到解决:金色财经报道,OpenAI:ChatGPT网站的故障已得到解决。[2023/5/25 10:40:06]
OpenAI联合创始人GregBrockman则表示:我们迈出了使用AI进行自动化对齐研究的重要一步。
与此同时,OpenAI对此依然是一如既往的谦虚,文章称目前GPT-4生成的可解释实验还不完美,当比GPT-2更大模型时解释表现效果很差。OpenAI可拓展对齐团队的JeffWu直言,本次研究中大多数解释的得分很低,GPT-4或无法解释实际神经元那么多的行为,未来仍有技术改进空间。
0xscope:GenesisTrading及其相关的实体过去两周套现价值5亿美元USDC:11月29日消息,0xscope研究员Bobie发推表示,过去两周,GenesisTrading及其相关的实体套现价值5亿美元USDC;此外,孙宇晨套现了价值1.72亿美元USDC;Alameda相关实体套现了价值6亿美元USDC。[2022/11/29 21:09:49]
据悉,自去年11月底至今,人工智能聊天机器人大模型ChatGPT风靡全球。根据Similarweb公布的最新数据,截至今年4月,ChatGPT平台访问量达到17.6亿次,比3月份增长了12.6%,同时已达到谷歌的2%。
ChatGPT背后的大型语言模型,是基于大量文本数据训练、包含数千亿参数的语言模型。在大数据时代,这类AI机器学习模型可以在提升产品销售、辅助人类决策过程中能够起到很大的作用,但是计算机通常不会解释它们的预测结果,而语言模型想要变得更强大,部署更广泛,就需要研究可解释性,因为人类对模型内部工作原理的理解仍然非常有限,例如可能很难从中检测到有偏见、性内容输出。
Open Forest Protocol将在NEAR上推出碳中和绿化项目:7月26日消息,Open Forest Protocol(OFP)宣布正式上线,并将在NEAR上上线碳中和绿化项目。Open Forest Protocol是一个开放性平台,旨在使得绿化项目可以被透明地验证和资助。[2022/7/26 2:38:22]
站在OpenAI的角度看,大模型未来将和人脑一样拥有“神经元”,这些神经元会观察文本中的特定规律,进而影响到模型本身生产的文本。所以可解释性就是将模型能用通俗易懂的语言进行表达,把模型的预测过程转化成具备逻辑关系的规则的能力,从而通过查看模型内部来发现更多信息。
例如,如果有一个针对“漫威超级英雄”的神经元,当用户向模型提问“哪个超级英雄的能力最强”时,这个神经元就会提高模型在回答中说出漫威英雄的概率,或者是弄清楚为什么人类神经元,可以决定进行某些搜索引擎查询或访问特定网站,即逐步转化一种有数据可解释性的“无监督学习”模式。
Parity开发者:OpenEthereum和MultiGeth是支持ETC时间最长的客户端:7月23日,Parity开发者Wei Tang发推文称,一个很小但有趣的事实是,OpenEthereum和MultiGeth是两个支持ETC时间最长的客户端。其中,OpenEthereum是4年,MultiGeth为2年。其他客户端支持ETC的时间都没有超过一年。其中,Hyperledger Besu从去年9月开始支持ETC,CoreGeth在今年春天开始从MultiGeth分离出来支持ETC,OpenETC则是刚刚开始支持ETC。(注:7月22日,ETC官方宣布OpenEthereum已被分离并命名为OpenETC。)此前7月17日消息,Wei Tang发推称,OpenEthereum、MultiGeth宣布停止支持ETC。原因是在Phoenix硬分叉后,ETC网络放弃了遵循最大共识和用户选择的不变性原则。而随后这一说法遭到ETC亚太社区经理反驳,并称停止支持的原因是OpenEthereum维护者Gnosis希望将其有限的精力投入到以太坊主网开发中。随后,CoreGeth作为ETC Core官方维护客户端继续服务于ETC网络。[2020/7/23]
OpenAI这次使用GPT-4来解决可解释性的问题,就是希望能够使用自动化的方式,让机器提高AI数据准确性,文章称这是其对齐研究的第三支柱的一部分。据悉,“第三支柱”是公司2022年发布的《我们做对齐研究的方法》,具体对齐研究将由三大支柱支撑:利用人工反馈训练AI;训练AI系统协助人类评估;训练AI系统进行对齐研究。
具体到本次研究成果上,OpenAI开发了一套包含自动化工具和测试方法的评估流程:
首先,研究人员让GPT-2运行文本序列,等待某个特定神经元被频繁“激活”;
然后让GPT-4针对一段文本生成解释,例如通过GPT-4接收到文本和激活情况判断漫威是否与电影、角色和娱乐有关;
随后用GPT-4模拟GPT-2的神经元接下来会做什么,预测行为;
最后评估打分,对比GPT-4模拟神经元和GPT-2真实神经元的结果的准确度,在下图这个例子中,GPT-4的得分为0.34。
使用上述评分方法,OpenAI开始衡量他们的技术对网络不同部分的效果,并尝试针对目前解释不清楚的部分改进技术。OpenAI表示,他们正在将GPT-4编写的对GPT-2中的所有307,200个神经元的解释的数据集和可视化工具开源,同时还提供了OpenAIAPI公开可用的模型进行解释和评分的代码,从而希望学术界能开发出新的技术来提升GPT模型解释分数。
OpenAI还发现,有超过1000个神经元的解释得分至少为0.8分,这意味着GPT-4模型可以解释大部分人类神经元,同时目前GPT理解的概念似乎和人类不太一样。该团队称,希望随着技术和研究方法的改进,进一步提高AI模型可解释性能力:如通过迭代解释,可以让GPT-4想出可能的反例在根据激活情况修改解释;使用更大的模型作出解释;以及调整已解释模型结构等,用不同的激活函数训练模型有助于提高解释评分。
对于本研究局限性,OpenAI表示,目前GPT-4生成的解释还不完美,尤其要解释比GPT-2更大的模型时,表现效果很差;神经元复杂行为无法用简短的自然语言描述;OpenAI解释了神经元的这种行为,却没有试图解释产生这种行为的机制;而且整个过程算力消耗极大等。OpenAI希望在未来的工作中可以解决上述这些问题。
最终,OpenAI希望使用模型来形成、测试和迭代完全一般的假设,从而比肩人类大脑的想法和行为,以及将其大模型解释为一种在部署前后检测对齐和安全问题的方法。然而在这之前,OpenAI还有很长的路要走。
“我们希望这将开辟一条有前途的途径。”JeffWu表示,这一技术可以让其他人可以在此基础上构建并做出贡献的自动化方案,从而解决AI模型可解释性问题,很好地解释这些模型行为,比如AI如何影响人类大脑中的神经元等。
随着基于比特币BRC-20标准的Meme代币交易量飙升至两年高位,比特币周一跌破2.75万美元,链上数据显示,从历史数据来看,模因币的投机狂热预示着比特币短期“见顶”或者看跌逆转.
1900/1/1 0:00:00众所周知,以太坊的发展面临着新困境。以太坊每天支持大量的经济活动、结算数十亿美元的交易,在蓬勃发展的DeFi和NFT领域中运行成千上万的DApp.
1900/1/1 0:00:005月9日消息,专注于数字资产的金融服务和投资管理公司GalaxyDigital公布一季度财报,一季度营收为1.4674亿美元,净收入1.34亿美元,收入主要归因于数字资产收益和未实现的投资收益.
1900/1/1 0:00:00金色财经报道,稳定币发行商MakerDAO宣布推出Spark,这是一种以DAI稳定币为中心的DeFi借贷协议。DAI是第四大稳定币,市值为47亿美元,仅次于USDT、USDC和BUSD.
1900/1/1 0:00:00来源:FounderPark就算在新产品满天飞,商业文明正在被AI重建的当下,我们仍然不知道,这些令人惊叹的技术是如何运作的.
1900/1/1 0:00:00跟随smartmoney投资很重要。加密领域的一大smartmoney就是a16z。a16z投资了几乎所有的?L1?和?L2公链,包括?Sui、Aptos、zkSync、Avalanche、NE.
1900/1/1 0:00:00