斯坦福团队抄袭清华系大模型事件后续:Llama3-V 团队承认抄袭并致歉
鱼羊 西风 发自 凹非寺 量子位 | 公众号 QbitAI 斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生
强化学习微调多模态大模型,无需人类反馈,学会做决策,超越 GPT-4v
Simon Zhai 投稿 量子位 | 公众号 QbitAI 只用强化学习来微调,无需人类反馈,就能让多模态大模型学会做决策! 这种方法得到的模型,已经学会了看
AI 大牛推荐:构建高质量网络规模数据集,提升 LLM 训练效果
机器之心报道 作者:蛋酱、小舟 众所周知,对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说,构建高质量的网络规模数据集是非常重要的。然
大模型时代,DataOps 助力 EtLT 架构成为数据处理主流
郭炜 本文由白鲸开源CEO郭炜投递并参与由数据猿联合上海大数据联盟共同推出的《2024中国数智化转型升级先锋人物》榜单/奖项评选。 随着大数据、人工智能技术的飞
动手做 AI Agent连续 18 天位列京东人工智能图书榜第一
Agent的应用还处于起步阶段,在通用性、准确性、交互体验等方面还有很大提升空间。黄佳希望,《动手做AI Agent》能成为读者了解和探讨Agent技术的起点。
GPT-4-Base 版免微调对齐靠谱吗?EPFL 团队研究探索
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI 除了OpenAI自己,居然还有别人能用上GPT-4-Base版?? 也就是未经微调的预训练版,还不会对话聊
阿里通义千问 Qwen2 大模型发布并同步开源,涵盖 5 个尺寸模型
拜登头疼了!另一个华为出现,阿里通义千问Qwen大模型发布,华为,大模型,阿里云,qwen,阿里通义,乔·拜登,阿里巴巴集团
本栏目的热门文章