IBM 推出突破性 LLM 基准测试方法，成本降低 99%，加速算法迭代与创新

aixo 2024-06-05 10:22:19

2024-06-05 10:22:19

巨头动态1.【IBM推出突破性LLM基准测试方法，成本降低99%】

IBM研究实验室发布了一项颠覆性的LLM基准测试方法，该方法能显著降低评估LLM性能的计算成本，最高可达99%。传统基准测试如斯坦福的HELM成本高昂且耗时，对开发者构成负担。IBM新方案由以色列IBM研究实验室的团队开发，采用“微型”基准测试版本，仅需原始测试规模的1%，便能在98%准确度内预测全尺寸测试性能。通过AI技术精选问题，该方法高效且预测性强，已在IBM的平台上得到应用。新方法不仅大幅降低成本，还加速了算法迭代与创新。IBM研究人员等指出，新方法使得评估更为灵活高效，为LLM研究与发展开辟新途径。

技术突破1.【挑战者、新序列建模架构Mamba-2发布，性能显著提升】

新一代序列建模架构Mamba-2正式发布，该架构由和共同研发，成功融合了和状态空间模型（SSM）两大主流技术。Mamba-2在状态空间上扩大8倍，训练速度提升50%，并在中入选。在训练中，3B参数的Mamba-2表现超越前代及同等规模的，显示出对高状态容量任务的卓越适应力。

2.【澜舟科技开源轻量化大模型-8B】

澜舟科技开源了其全新轻量化大模型-8B，该模型在性能上媲美-13B，但参数规模更为精简，适用于个人开发者和AI爱好者。-8B支持文本生成、对话系统和代码生成等多种NLP任务，且性能高效，半精度下显存占用小于16G，原生推理速度领先。此外，其在中文、英语、世界知识、编程及数学等多个领域的知识处理能力均显著超越同尺寸开源模型，为用户带来高效、低成本的AI体验。该模型现已正式开源并支持免费商用。

3.【UC伯克利研究团队提出强化学习框架，推进多模态大模型再进化】

UC伯克利等高校的研究团队提出了一种名为的全新强化学习框架，成功地提升了多模态大模型在决策任务上的表现。的核心是一种新的算法框架，它直接使用强化学习方法对多模态大模型进行微调。这种方法的一个显著特点是，奖励信息直接来源于环境，不再依赖于人类反馈。这不仅提高了效率，也赋予了多模态模型自主决策的能力。为了全面评估的效果，研究团队设计了两类评测任务。第一类任务主要测试模型利用图像中的细粒度视觉信息进行决策的能力，包括数字识别和逻辑推理。第二类任务则主要考察模型在具身智能环境中的视觉语义推理能力。实验结果令人鼓舞。经过强化学习微调的多模态模型，在决策问题上的表现不仅超过了商用模型GPT-4v，同时也超越了传统的监督微调方法。特别是在的具身智能任务中，模型取得了最高的平均分，尤其在单物体拾取任务上表现突出。该模型在无需人类反馈的情况下，通过强化学习微调，已经学会了看图玩扑克、算“12点”等任务，并且其表现超越了GPT-4v。模型的研究团队由多位重量级人物组成，包括图灵奖得主、Meta首席AI科学家、纽约大学教授LeCun，UC伯克利的教授，以及香港大学数据科学学院院长、UC伯克利教授马毅等。

4.【Suno发布新功能，哼唱即可生成完整歌曲】

Suno公司宣布即将上线新功能，可让用户通过哼唱来生成完整歌曲。用户仅需哼唱一小段旋律，Suno便能创作出与原声自然融合的音乐作品，宛如专业歌手之作。Suno新功能能将任何声音转化为音乐作品，开拓了音乐创作的新可能性。用户将能够轻松体验音乐创作的乐趣，激发音乐内容生成的创意。

5.【Adobe发布超分辨率视频模型，革新超分辨率视频处理技术】

Adobe与研究团队联手推出，这是一款突破性的超分辨率视频模型，有效解决了帧率连贯性和细节丰富性的挑战。该模型基于框架，融合时序卷积、自注意力层和光流引导模块，实现视频帧间时间依赖性的精准捕捉，同时保留空间细节和纹理信息。以其视频超分辨率、时域一致性、丰富细节处理及抗锯齿处理等功能，为视频处理领域带来新可能，适用于多种应用场景。

6.【推出RFM-1模型，让机器人像人一样思考、学习】

三位来自的早期研究科学家创立的初创公司推出了新的RFM-1模型，开发的AI系统融合了大型语言模型的推理技能和先进机器人的物理灵巧性能够处理五种模态的输入类型，包括文本、图像、视频、机器人指令和测量数据以执行任务。此外RFM-1能够自主执行任务:例如，向模型展示装满运动器材的箱子图片，并给出指令，机器人能够识别并抓取指定物品。进行反馈与交互，机器人能够使用训练数据来适应环境，而不是依赖于特定任务的复杂代码。开发了一个与兼容的机器人AI平台，赋予机器人视觉识别、思考、行动和学习的能力。

AI安全与伦理1.【美国新闻媒体联盟致信贸易委员会、司法部，呼吁监管谷歌数字新闻垄断行为】

美国“新闻/媒体联盟”正式向美国联邦贸易委员会和美国司法部发出呼吁，要求调查谷歌在数字新闻领域的垄断行为，并制止其利用生成式AI在搜索产品中的进一步扩张。该联盟特别关注谷歌新推出的“”功能，该功能能够基于出版商的内容对用户查询进行全面回应，引发了对版权和新闻完整性的担忧。联盟指出，谷歌通过滥用出版商的专有资料，不仅可能剥夺内容创作者的关键流量，还威胁到数字新闻传播的核心价值。新闻/媒体联盟总裁兼CEO丹尼尔・科菲强调，谷歌的“肆意扩张”对新闻生态系统造成了严重破坏。他警告称，虽然人工智能与新闻出版物在理想状态下应相互促进，但谷歌的胁迫策略已经打破了这种平衡。科菲进一步指出，谷歌搜索结果页面的主导地位使得90%的用户很少涉足其他信息源，这对新闻出版商构成了巨大威胁。该联盟认为，谷歌的行为既削弱了新闻出版商的经济生存能力，也降低了用户获取信息的质量。因此，他们呼吁监管部门立即采取行动，制止谷歌的垄断行为，维护新闻生态系统的健康发展。

LLM

IBM 推出突破性 LLM 基准测试方法，成本降低 99%，加速算法迭代与创新

腾讯设计杰出专家:大模型加速产业进入全新智能时代

涉及量子计算！美国将中国科大、中国科学院物理所等37个实体列入“实体清单”｜硅基世界

站长之家：正筹备展示革命性的人机对话技术

AI搜索的战场，我们为什么要在意的？

联合创始人Mike被任命为首席产品官

微软 Phi-3-vision 基准测试,主打“视觉能力”

中国品牌人物500强前十回应：别在意低头做事

以专业知识内容助力民众跨越自媒体运营门槛

Temu们狂卷低价，亚马逊也坐不住了

微信加大“自媒体”造谣治理力度：限制增粉、阶梯封号