实测腾讯首个大模型App：秒读60万字财报，精准读图识猫，信息搜索有待提升

弦子 2024-05-30 19:00:13

2024-05-30 19:00:13

智东西5月30日报道，腾讯混元大模型首个App“腾讯元宝”今天正式上线。

腾讯元宝定位于全能AI助手，针对效率场景的信息获取、处理和生产三大核心需求进行了优化；面向日常生活场景，元宝提供了图像生成、生活帮手、UGC创作等特色AI应用，并新增了创建个人智能体等功能。

▲腾讯元宝App上线应用商城

据介绍，此次产品能力升级，背后来源于腾讯混元底层模型的持续迭代。腾讯混元大模型于去年9月发布，到目前整体性能提升超50%，包括参数规模从千亿升级至万亿、预训练语料从万亿升级至7万亿tokens、架构升级为混合专家MoE等。

发布会后，智东西等少数媒体与腾讯云副总裁、腾讯混元大模型负责人刘煜宏进行了深入交谈。

目前市面上已经有不少同类大模型App，元宝的差异化优势是什么？

刘煜宏称，腾讯的优势主要在于三个方面：一是产品工程能力较强，在工程方面能够压缩成本；二是腾讯的产品体系是最全的，对各个应用领域的适配度更强；三是混元大模型本身的性能优势，腾讯从去年就开始在文生图方面采用DiT架构，也很早就开始采用MoE架构，技术演进很快。

谈到与其他AI产品是否存在同质化现象，刘煜宏称，腾讯做大模型最初是为了满足公司内部业务需求，在这个过程中发现很多用户、企业也有这方面的需求，所以开放给大家使用。在产品化上，腾讯最优先考虑的是用户需求，用户是否需要这个产品、需要哪些功能，而不是去对标竞品。

在商业模式方面，刘煜宏称元宝App目前暂时没有在C端收费的计划。

作为腾讯推出的首款混元大模型原生应用，腾讯元宝表现如何？智东西第一时间上手体验了元宝App，发现其虽然与市面上已有的大模型App有一些重合的功能，但在生成速度、内容优质程度上，表现出一定的优势。

一、万亿参数、上下文窗口256k，面向三大核心需求定向优化

刘煜宏首先谈道，现阶段AI应用虽然层出不穷，但整体AI产品渗透率仍然很低。头部AI产品日活跃用户规模约为百万，按互联网用户规模12.32亿来看，在整个互联网渗透率不到1%。

▲AI产品渗透率低，行业处于起步阶段

在腾讯看来，渗透率低主要是因为大模型仍在发展期，产品解决方案不够成熟，应用场景有限；其次，用户层面的认知仍在建立，据腾讯调查，目前对AI的需求主要集中在搜索、效率场景，有约45%的人将其当作搜索引擎来用。

▲大模型应用渗透率低的原因

腾讯于去年9月发布了混元大模型并推出小程序版，当时的模型为千亿参数规模，预训练语料万亿tokens，4k上下文窗口。

经过不到一年的迭代，目前混元大模型效果整体提升50%，达到万亿参数，预训练预料7万亿tokens，上下文窗口扩展到256k。

目前，腾讯内部已有600+业务接入混元大模型。刘煜宏透露，混元每天调用量超2亿，公司内部有23%左右的代码都由AI生成。

基于用户洞察，腾讯认为大模型原生AI产品需要满足两大需求。一是贴近用户场景，包括职场办公、学习充电、休闲娱乐等；二是满足高频需求，如搜索问答、效率提升、创意生成。

针对这些需求，腾讯推出全能AI助手腾讯元宝App，面向效率场景的三大核心需求——信息获取、处理和生产，进行定向优化。

▲工作效率场景核心需求

据介绍，在AI搜索方面，腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎，并通过AI搜索增强，提升时新类和知识类问题效果；同时，内容覆盖微信公众号等腾讯生态内容及互联网权威信源，答案准确性更高；此外，元宝还会提供所引用的参考资料，并给出相关推荐，方便快速溯源及延伸阅读。

在AI总结方面，元宝可上传最多10个PDF、word、txt等多种格式文档，并能够一次性解析多个微信公众号链接、网址，支持256k原生窗口上下文，相当于一本《三国演义》或是英文原版《哈利波特》全集。

在AI写作方面，元宝支持多轮问答，能够将对话的内容整理成报告，按照要求进行结构化输出。

此外在日常生活场景，腾讯元宝也能有问必答，提供图像生成、内容创作、学习助手、生活帮手、UGC创作等多种AI应用。刘煜宏称，在腾讯看来，大模型AI产品的用户价值终点是“服务于每个普通人的生活”。

元宝网页端、小程序端也同步上线，同时将联合腾讯系业务、合作伙伴、腾讯元器创作者等，共创AI应用生态。

二、AI搜索一键总结实时热点，AI总结精准提炼英文财报

打开腾讯元宝App，主页面是一个对话框，顶部有两个小模块，分别显示日期、天气、实时资讯以及随机问题建议；下方提供了在AI搜索、文档总结、网页总结、AI作图等能力方面的随机提问建议。

▲腾讯元宝首页

提问入口设计比较简洁，同时丰富的提问建议也降低了普通用户首次使用的门槛。

点击顶部的“元宝”按键，会出现开始新对话、删除聊天记录的选项，此外还可以切换语音音色，目前有20多种音色可供选择，还提供了创建自己声音的功能。

▲音色选择界面

据刘煜宏介绍，元宝在工作场景目前主要的优化方向是AI搜索、AI总结、AI写作。

我首先试了一下在AI搜索场景下系统推荐的问题：“10元咖啡阿姨”是什么梗？

元宝很快给出了回答，从起源、背景信息、社会反响、社会意义等方面介绍了这个事情的发生经过和后续影响，并推荐了更多内容和可以进一步追问的选择。

▲AI搜索实时讯息

当我追问：阿姨的咖啡店在哪里可以找到？元宝准确地答出店铺地址，并补充了营业时间和相关注意事项。

▲AI搜索下的追问

除了了解当下的热点信息之外，我也想了解未来的趋势或可能发生的事。我问道：苹果下个月的WWDC可能会发什么？

元宝首先告诉了我WWDC的具体时间，随后按新产品、新功能、其他亮点等类别进行了归纳整理。

▲AI搜索

不过这个回答中存在部分不够准确的信息，如将Vision Pro划分为“新产品”等。点开这句回答的参考资料链接，可以看到是一篇去年6月Vision Pro发布的新闻稿。

在平日的搜索中，对图片的识别和提问也是很常见的需求。我上传了一张小猫实拍图，问元宝这是什么品种的猫。

元宝首先答出这是英国短毛猫，但我想进一步了解是英短里的什么品种，追问后，元宝准确地将范围缩小到银渐层或蓝金渐层。

▲图像识别

在AI总结能力上，元宝支持256k上下文窗口。我首先上传了一篇Llama的论文，让元宝替我解读。

元宝从引言、方法、主要结果等方面提炼了论文的主要信息，最后总结了该论文的主要贡献。

▲论文解读

英文财报的信息提取也是日常工作中的高频场景。我上传了一个187页的英伟达年度财报文件，元宝进行文件解析后，显示有64.2万字。

随后我要求元宝总结主要内容，它从财务表现、市场地位、业务战略等角度进行了总结。

▲英文财报解读

在财务表现部分，元宝提到了英伟达在2024财年取得的营收、净利润数据。平时在使用AI提炼这类内容时，有时会遇到数据不准确的问题，我还是打开财报文件自己核实了一下。值得庆幸的是，元宝提供的数据十分准确。

▲英伟达2024年度财报

随后我又上传了《三体》全集电子书，元宝解析后显示字数达到92.9万。我问道：云天明讲了什么样的童话？

元宝称，基于文档内容，云天明讲的童话故事是《国王的新画师》、《饕餮海》和《深水王子》。

故事的名字是准确的，不过我真正想问的是故事内容，于是追加道：总结这三个故事。

这次元宝的回答有些偏差，一方面没能完整地概括故事内容，另一方面出现了不停重复一句话的情况。

▲长文本

看来，90多万字的长度还是有些超出元宝的能力范围了。

发布会上提到，元宝可以一次性解析多个微信公众号链接。于是我输入了两个智东西公众号的文章链接，让元宝总结主要内容。

元宝精准提炼了文章内容，并在最后总结了两篇文章的共同点。

▲微信公众号文章提炼

最后再来试一下AI写作功能，我让元宝帮我写一份宣传智能汽车产业峰会的小红书文案。

元宝对小红书平台的风格拿捏得不错，用了丰富的表情符号，文章结构也比较合理，最后还补充了相关Tag。

▲宣传文案撰写

六一儿童节马上就要到了，我让元宝帮我策划一场适合小学的亲子活动。

元宝给出的策划方案十分详细，包括每个环节的时间内容，在内容上策划了运动会、手工制作、表演等形式，并贴心地提供了活动准备、注意事项相关的建议。

▲活动策划

体验下来，我的感受是元宝的生成速度比较快，搜索、总结内容方面虽然出现了一些小失误，但瑕不掩瑜，整体准确度还是比较高的。此外在标注出的参考资料上，能看到有不少出自微信公众号文章，这样的信息来源为元宝提供了内容上的差异化竞争力。

三、智能体打造多模态创意应用，化身种草达人、旅行规划师

除了对话式AI，元宝还提供了多种智能体功能，主要分为工作、生活两大类，包括翻译、PPT、文案撰写、营销专家等效率类工具，以及创意贴纸、创意绘画、AI头像等娱乐向工具。

根据系统推荐，我首先体验了“创意贴贴贴”功能，它能根据文字输入或图像输入创建不同风格的贴纸。

我上传了一张猫咪全身照，元宝很快生成了4张对应的贴纸图像。虽然看花色似乎有些差异，不过整体神态、动作、颜色都比较符合。

▲创意贴纸

在创意绘画智能体中，元宝可以根据简单的文字描述生成对应图像，实际体验下来生成时长大概在5秒。点开生成的图像可以看到，元宝自动扩展了提示词，增加了更多细节、景别描述等。

▲AI生图

旅行达人智能体可以帮助制定旅行计划，我提问道：去澳门玩两天，有什么建议？

元宝为我列出了一个时间表，并提供了交通方式、住宿选择、价格参考等。

▲旅行规划

我还体验了种草文案写手智能体，根据提示，只需输入商品名称就可以生成宣传文案。我输入了樟脑丸，看看这个东西要怎么去安利。

元宝首先给它定位为“超级实用的小物件”，随后从产品特点、使用感受、实际效果、使用方法来进行种草，最后给出了使用注意事项。

▲种草文案

整体来看，元宝在智能体能力上表现也不错，作为工作、生活帮手能提供有价值的信息。虽然目前官方提供的智能体选择还不是特别丰富，不过与腾讯元器打通后，应该会呈现出更多有趣的功能选择。

结语：大模型App赛道，又一强力选手入场

随着腾讯元宝的正式上线，大模型App赛道再次迎来一位强有力的选手。现阶段，元宝虽然在功能创新、实时信息搜索准确度上仍有提升空间，不过在生成速度、内容质量上也有一定优势。

作为业务广泛的互联网大厂，腾讯在产品工程能力、技术创新上都有很大的积累。我们期待元宝在未来的迭代中呈现出更丰富的功能和更高的水准，也期待它的加入能为大模型App赛道带来良性竞争。

实测腾讯首个大模型App：秒读60万字财报，精准读图识猫，信息搜索有待提升

一、万亿参数、上下文窗口256k，面向三大核心需求定向优化

二、AI搜索一键总结实时热点，AI总结精准提炼英文财报

三、智能体打造多模态创意应用，化身种草达人、旅行规划师

结语：大模型App赛道，又一强力选手入场

波士顿动力发布全电动Atlas机器人，外型更像人但灵活度远超

极越01正式发布，高阶智驾方案4.99万元一次性买断

苹果AI升级大泄露，Siri将在iOS18重生！库克用Apple重新定义AI

中国智驾技术应用触及临界点，新公司挤压老牌供应商生存空间

苹果M3系列芯片瞄上了AI从业者，新款MacBook Pro起售价便宜

AI热潮下东南亚数据中心规模将仅次于中美

Teledyne FLIR IIS扩展其Forge相机系列，达到IP67防护等级，适用于智能农业、食品和饮料行业

汽车行业开启淘汰赛，新旧势力都在寻找出路

苹果CEO接班人最新曝料！黑马出现，比库克年轻15岁，加入苹果23年

OpenAI大招要来了！AI语音助手狙击谷歌，官宣下周二上新，GPT-5年前见