
最新的模型是为了训练“得分滑动”的元模型,承认有漏洞,但否认作弊
2025年4月8日16:09 Pengpai新闻
这位科技巨头元数据回答了有关该公司最新的开放资源AI(人工智能)Llama 4的问题,该问题否认该模型在培训集中被欺骗了“标记”。
4月7日,当地时间,Meta上生物AI的负责人艾哈迈德·达勒(Ahmad al-Dahle)在社会平台上发表了一篇长文章,该文章回答了有关骆驼4的问题。艾哈迈德(Ahmad)说,自从发行时发行了Llama 4的发行时,该模型在开发时很快就发布了,该模型“表达了不同的服务的不均匀质量”,该公司很快就会调整弱点。同时,艾哈迈德(Ahmad)否认了骆驼4(Llama 4)在训练场上的“标记”中作弊的说法。
4月5日,梅塔(MetaNdard Maverick模型。此外,元数据还展示了Llama 4庞然大物模型的预览,被称为“今天最强大,最明智”。
据报道,Llama 4模型是采用混合专家(MOE)体系结构的Llama系列模型中的第一个模型,并且在多模式性能方面具有出色的性能。其中,最先进的骆驼4庞然大物的总参数为2万亿,是其他模型的“老师”。 Scout and Maverick have an active parameter of 17 billion, the scout is primarily aimed at summary of document and large-scale coding tasks, while Maverick focuses on multimodal capabilities.As a native Multimodal model, Llama 4 adopted early integration technology to pre-train the model using a large amount of text without label, photo and video data to seamless to combine tokens and visual tokens in a unified outline model.此外,Llama 4还取得了长期文字功能的突破。侦察模型支持骗局文本窗口具有多达1000万个令牌,而小牛模型则以100万个令牌为上下文窗口。
但是,一旦释放,骆驼4就被询问。 Meta Release接口表明,Scout和Maverick在LiveCodeBench测试集上表现良好,该测试集评估了聊天机器人代码和竞技场的功能。但是许多开发人员发现这些模型执行了小台面。
例如,一些网民指出,在一个名为Aider Polyglot的基准测试中,该模型可以完成225个编程活动,Llama 4 Maverick仅获得16%,小于Gemini 2.5 Pro和Claude 3.7旧模型,例如SONNET和DEEPSEEK -V3。
AI工程师兼技术作家Andriy Burkov在社交平台X上教授,Meta表示Llama 4 Scout的背景为1000万个令牌,这实际上是一个“虚假提议”:“实际上,实际上将没有超过256,000个标记的培训模型。如果您发送很多g,您只会发送GOUST G,您将只发送GOUST G,您将只发送GOUST G,您将仅发送GOUST gET低质量产出。”
关于Llama 4的性能失败,一些开发人员开始怀疑,为了在测试集中取得更好的结果,Meta为此测试组制作了“特殊版本”。例如,在AI2(艾伦人工智能研究所)的前元研究员兼现任高级研究员内森·兰伯特(Nathan Lambert)是在比较测试的比较后指导的,即在大型竞技场模型中实现了结果的Llama 4 Maverick与公众释放了该公司的释放,这是“对话”。
此外,在Llama 4发行前几天,AI Research的总监Joelle Pineau在Meta工作了8年,他宣布辞职。与Llama 4的表现有关,网民对骆驼的“盲盒操作”的怀疑。在国内社会平台上,一些网民说,内部元员工说“骆驼4存在严重问题”,并向公司提出了辞职的申请。一个AI研究主管的NG Pagremoval也是出于同样的原因。
Netizen说:“经过重复培训,内部模型的性能仍然未能达到开放资源SOTA(该模型在研究工作中表现最好),并且远非如此。该公司的领导建议建议将每个基准测试的测试集混合在培训后的过程中,以提交不同的指示器并提交不同的指标,并与ME”进行。”
请肯定的是,Llama 4的最初发布并未对AI社区产生重大的积极反应。目前,面对中国AI模型的快速发展,Meta渴望通过开放资源来加强Llama系列的领先地位。今年2月,阿里巴巴·汤蒂·Qianwen系列的下载模型数量达到1.8亿,衍生型号的数量高达90,000。衍生模型的数量已超过元美洲驼系列,并已成为最大的开放源代码系列世界上的模型。
7日,Meta(NASDAQ:META)股价上涨了2.28%,收盘价为516.25美元,总市场价值为1.31万亿美元。
(收费编辑:谭先生)
神性:中国净资金已印刷本文以提供其他信息,并不代表本网站的观点和立场。本文的内容仅用于参考,并且不投资投资。投资者在此基础上以自己的风险行事。