首页 > TAG信息列表 > Llama
开源模型Tülu 3:超越Llama 3.1 Instruct,后训练扩展律引领AI新纪元
开源模型阵营又迎来一员猛将:Tülu 3。它来自艾伦人工智能研究所(Ai2),目前包含 8B 和 70B 两个版本(未来还会有 405B 版本),并且其性能超过了 Llama 3
阿里 Qwen2 大模型重磅发布,性能超越 llama3,支持超长上下文
阿里Qwen2重磅发布:全面超越Llama 3,成为开源第一模型,数学,代码,上下文,llama,阿里巴巴集团,阿里qwen2
Qwen 系列会成为大学实验室新默认基础模型吗?中国大模型赶超国外
阿里Qwen2正式开源,性能全方位包围Llama-3,代码,上下文,预训练,阿里qwen2
阿里云通义千问团队 Qwen2 大模型开源,性能超越众多模型
突发!阿里Qwen2重磅发布:全面超越Llama 3(附使用地址),代码,上下文,阿里qwen2
本周大模型 / AIGC 前沿研究:北大团队、苹果团队等成果汇总
原创 库珀 学术头条 本周值得关注的大模型 / AIGC 前沿研究: 北大团队提出 BoT:让 Llama3-8B 超越 Llama3-70B Mamba-2:
AI 大牛推荐:构建高质量网络规模数据集,提升 LLM 训练效果
机器之心报道 作者:蛋酱、小舟 众所周知,对于 Llama3、GPT-4 或 Mixtral 等高性能大语言模型来说,构建高质量的网络规模数据集是非常重要的。然
斯坦福团队抄袭清华系大模型事件后续:Llama3-V 团队承认抄袭并致歉
鱼羊 西风 发自 凹非寺 量子位 | 公众号 QbitAI 斯坦福团队抄袭清华系大模型事件后续来了—— Llama3-V团队承认抄袭,其中两位来自斯坦福的本科生
LlamaIndex:让大型语言模型访问和理解私有数据的框架
LlamaIndex:构建基于大型语言模型(LLM)应用程序的数据框架,索引,知识库,应用程序,语言模型,数据框架
自回归图像生成模型 LlamaGen 来袭,开启可扩展图像生成新时代
近期,来自香港大学和字节跳动的研究团队发布了一项名为 LlamaGen 的创新技术,将大型语言模型的原始下一个标记预测范式应用于视觉生成领域。
谷歌放大招:新一代最强开源模型 Gemma 2 震撼发布
谷歌最强开源模型Gemma 2发布!270亿参数奇袭Llama 3,单张A100可全精度推理
谷歌发布 Gemma 2 大模型,性能更优推理效率更高
蓝鲸新闻6月28日讯(记者 朱俊熹)全球开发者和研究人员在大语言模型上又多了一项高性价比的选择。当地时间6月27日
智谱推出 GLM-4-9B 系列模型,开源且能力超越 LLaMA38B
智谱宣布推出GLM-4-9B系列模型,包括基座模型、不同上下文长度的Chat模型和视觉模型,能力全面超越了LLaMA38B。据悉,GLM-4-
最新版本大模型 6 分钱 100 万 Token,智谱 AI 公布行业落地数字
GLM-4开源版本:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级,模态,glm,大模型,智能体
阿里云重磅推出通义千问2.5中文能力超越GPT-
阿里云通义千问2.5中文性能突破GPT-4Turbo,理解、逻辑、指令执行、代码能力全面升级。1100亿参数模型超越Meta,服务9万企业,下载量超700万。
白交发自凹非寺量子位|-120b
Llama 3首发阵容里没有的120B型号竟意外“曝光”,而且十分能打?!最近这样一个号称是「-120b」的神秘大模型火了起来,原因在于它表现太出色了——轻松击败GPT-4、gpt2-那种。比如,面对像「观察希格斯场
谷歌I/O开发者大会:AI平台转变的早期阶段
谷歌反击OpenAI!连夜发布十几款新品,喊了121次AI,最新长文本模型问鼎全球最强,https://m.jrj.com
人工智能(AI)或许具备了人类特有的能力
原创 学术头条 学术头条 一项新的研究发现,人工智能(AI)或许具备了人类特有的能力之一,即“心智理论”(Theory of Mind,ToM)。 也就是说,在
浪潮信息开源大模型源 2.0-M32:精度对标 Llama 3,算力消耗仅 1/19
32专家MoE大模型免费商用!5.28%单token推理消耗,性能对标Llama3,算法,大模型,预训练,token,视频生成模型
斯坦福 AI 团队抄袭清华系开源大模型,闹剧以公开道歉收场
一场斯坦福AI团队抄袭清华系开源大模型的闹剧在海外社交平台上吵得沸沸扬扬,6月3日,此事最终以作者团队向后者公开道歉收场。
斯坦福 AI 团队开源模型被指套壳抄袭清华&面壁智能模型
新浪科技讯6月4日上午消息,近日,斯坦福AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华&面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V2.5一事
热门文章