实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

弦子 2024-05-30 19:00:13
资讯 2024-05-30 19:00:13

智东西5月30日报道,腾讯混元大模型首个App“腾讯元宝”今天正式上线。

腾讯元宝定位于全能AI助手,针对效率场景的信息获取、处理和生产三大核心需求进行了优化;面向日常生活场景,元宝提供了图像生成、生活帮手、UGC创作等特色AI应用,并新增了创建个人智能体等功能。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲腾讯元宝App上线应用商城

据介绍,此次产品能力升级,背后来源于腾讯混元底层模型的持续迭代。腾讯混元大模型于去年9月发布,到目前整体性能提升超50%,包括参数规模从千亿升级至万亿、预训练语料从万亿升级至7万亿tokens、架构升级为混合专家MoE等。

发布会后,智东西等少数媒体与腾讯云副总裁、腾讯混元大模型负责人刘煜宏进行了深入交谈。

目前市面上已经有不少同类大模型App,元宝的差异化优势是什么?

刘煜宏称,腾讯的优势主要在于三个方面:一是产品工程能力较强,在工程方面能够压缩成本;二是腾讯的产品体系是最全的,对各个应用领域的适配度更强;三是混元大模型本身的性能优势,腾讯从去年就开始在文生图方面采用DiT架构,也很早就开始采用MoE架构,技术演进很快。

谈到与其他AI产品是否存在同质化现象,刘煜宏称,腾讯做大模型最初是为了满足公司内部业务需求,在这个过程中发现很多用户、企业也有这方面的需求,所以开放给大家使用。在产品化上,腾讯最优先考虑的是用户需求,用户是否需要这个产品、需要哪些功能,而不是去对标竞品。

在商业模式方面,刘煜宏称元宝App目前暂时没有在C端收费的计划。

作为腾讯推出的首款混元大模型原生应用,腾讯元宝表现如何?智东西第一时间上手体验了元宝App,发现其虽然与市面上已有的大模型App有一些重合的功能,但在生成速度、内容优质程度上,表现出一定的优势。

一、万亿参数、上下文窗口256k,面向三大核心需求定向优化

刘煜宏首先谈道,现阶段AI应用虽然层出不穷,但整体AI产品渗透率仍然很低。头部AI产品日活跃用户规模约为百万,按互联网用户规模12.32亿来看,在整个互联网渗透率不到1%。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲AI产品渗透率低,行业处于起步阶段

在腾讯看来,渗透率低主要是因为大模型仍在发展期,产品解决方案不够成熟,应用场景有限;其次,用户层面的认知仍在建立,据腾讯调查,目前对AI的需求主要集中在搜索、效率场景,有约45%的人将其当作搜索引擎来用。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲大模型应用渗透率低的原因

腾讯于去年9月发布了混元大模型并推出小程序版,当时的模型为千亿参数规模,预训练语料万亿tokens,4k上下文窗口。

经过不到一年的迭代,目前混元大模型效果整体提升50%,达到万亿参数,预训练预料7万亿tokens,上下文窗口扩展到256k。

目前,腾讯内部已有600+业务接入混元大模型。刘煜宏透露,混元每天调用量超2亿,公司内部有23%左右的代码都由AI生成。

基于用户洞察,腾讯认为大模型原生AI产品需要满足两大需求。一是贴近用户场景,包括职场办公、学习充电、休闲娱乐等;二是满足高频需求,如搜索问答、效率提升、创意生成。

针对这些需求,腾讯推出全能AI助手腾讯元宝App,面向效率场景的三大核心需求——信息获取、处理和生产,进行定向优化。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲工作效率场景核心需求

据介绍,在AI搜索方面,腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎,并通过AI搜索增强,提升时新类和知识类问题效果;同时,内容覆盖微信公众号等腾讯生态内容及互联网权威信源,答案准确性更高;此外,元宝还会提供所引用的参考资料,并给出相关推荐,方便快速溯源及延伸阅读。

AI总结方面,元宝可上传最多10个PDF、word、txt等多种格式文档,并能够一次性解析多个微信公众号链接、网址,支持256k原生窗口上下文,相当于一本《三国演义》或是英文原版《哈利波特》全集。

AI写作方面,元宝支持多轮问答,能够将对话的内容整理成报告,按照要求进行结构化输出。

此外在日常生活场景,腾讯元宝也能有问必答,提供图像生成、内容创作、学习助手、生活帮手、UGC创作等多种AI应用。刘煜宏称,在腾讯看来,大模型AI产品的用户价值终点是“服务于每个普通人的生活”。

元宝网页端、小程序端也同步上线,同时将联合腾讯系业务、合作伙伴、腾讯元器创作者等,共创AI应用生态。

二、AI搜索一键总结实时热点,AI总结精准提炼英文财报

打开腾讯元宝App,主页面是一个对话框,顶部有两个小模块,分别显示日期、天气、实时资讯以及随机问题建议;下方提供了在AI搜索、文档总结、网页总结、AI作图等能力方面的随机提问建议。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲腾讯元宝首页

提问入口设计比较简洁,同时丰富的提问建议也降低了普通用户首次使用的门槛。

点击顶部的“元宝”按键,会出现开始新对话、删除聊天记录的选项,此外还可以切换语音音色,目前有20多种音色可供选择,还提供了创建自己声音的功能。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲音色选择界面

据刘煜宏介绍,元宝在工作场景目前主要的优化方向是AI搜索、AI总结、AI写作。

我首先试了一下在AI搜索场景下系统推荐的问题:“10元咖啡阿姨”是什么梗?

元宝很快给出了回答,从起源、背景信息、社会反响、社会意义等方面介绍了这个事情的发生经过和后续影响,并推荐了更多内容和可以进一步追问的选择。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲AI搜索实时讯息

当我追问:阿姨的咖啡店在哪里可以找到?元宝准确地答出店铺地址,并补充了营业时间和相关注意事项。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲AI搜索下的追问

除了了解当下的热点信息之外,我也想了解未来的趋势或可能发生的事。我问道:苹果下个月的WWDC可能会发什么?

元宝首先告诉了我WWDC的具体时间,随后按新产品、新功能、其他亮点等类别进行了归纳整理。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲AI搜索

不过这个回答中存在部分不够准确的信息,如将Vision Pro划分为“新产品”等。点开这句回答的参考资料链接,可以看到是一篇去年6月Vision Pro发布的新闻稿。

在平日的搜索中,对图片的识别和提问也是很常见的需求。我上传了一张小猫实拍图,问元宝这是什么品种的猫。

元宝首先答出这是英国短毛猫,但我想进一步了解是英短里的什么品种,追问后,元宝准确地将范围缩小到银渐层或蓝金渐层。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲图像识别

AI总结能力上,元宝支持256k上下文窗口。我首先上传了一篇Llama的论文,让元宝替我解读。

元宝从引言、方法、主要结果等方面提炼了论文的主要信息,最后总结了该论文的主要贡献。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲论文解读

英文财报的信息提取也是日常工作中的高频场景。我上传了一个187页的英伟达年度财报文件,元宝进行文件解析后,显示有64.2万字。

随后我要求元宝总结主要内容,它从财务表现、市场地位、业务战略等角度进行了总结。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲英文财报解读

在财务表现部分,元宝提到了英伟达在2024财年取得的营收、净利润数据。平时在使用AI提炼这类内容时,有时会遇到数据不准确的问题,我还是打开财报文件自己核实了一下。值得庆幸的是,元宝提供的数据十分准确。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲英伟达2024年度财报

随后我又上传了《三体》全集电子书,元宝解析后显示字数达到92.9万。我问道:云天明讲了什么样的童话?

元宝称,基于文档内容,云天明讲的童话故事是《国王的新画师》、《饕餮海》和《深水王子》。

故事的名字是准确的,不过我真正想问的是故事内容,于是追加道:总结这三个故事。

这次元宝的回答有些偏差,一方面没能完整地概括故事内容,另一方面出现了不停重复一句话的情况。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲长文本

看来,90多万字的长度还是有些超出元宝的能力范围了。

发布会上提到,元宝可以一次性解析多个微信公众号链接。于是我输入了两个智东西公众号的文章链接,让元宝总结主要内容。

元宝精准提炼了文章内容,并在最后总结了两篇文章的共同点。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲微信公众号文章提炼

最后再来试一下AI写作功能,我让元宝帮我写一份宣传智能汽车产业峰会的小红书文案。

元宝对小红书平台的风格拿捏得不错,用了丰富的表情符号,文章结构也比较合理,最后还补充了相关Tag。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲宣传文案撰写

六一儿童节马上就要到了,我让元宝帮我策划一场适合小学的亲子活动。

元宝给出的策划方案十分详细,包括每个环节的时间内容,在内容上策划了运动会、手工制作、表演等形式,并贴心地提供了活动准备、注意事项相关的建议。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲活动策划

体验下来,我的感受是元宝的生成速度比较快,搜索、总结内容方面虽然出现了一些小失误,但瑕不掩瑜,整体准确度还是比较高的。此外在标注出的参考资料上,能看到有不少出自微信公众号文章,这样的信息来源为元宝提供了内容上的差异化竞争力。

三、智能体打造多模态创意应用,化身种草达人、旅行规划师

除了对话式AI,元宝还提供了多种智能体功能,主要分为工作、生活两大类,包括翻译、PPT、文案撰写、营销专家等效率类工具,以及创意贴纸、创意绘画、AI头像等娱乐向工具。

根据系统推荐,我首先体验了“创意贴贴贴”功能,它能根据文字输入或图像输入创建不同风格的贴纸。

我上传了一张猫咪全身照,元宝很快生成了4张对应的贴纸图像。虽然看花色似乎有些差异,不过整体神态、动作、颜色都比较符合。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲创意贴纸

在创意绘画智能体中,元宝可以根据简单的文字描述生成对应图像,实际体验下来生成时长大概在5秒。点开生成的图像可以看到,元宝自动扩展了提示词,增加了更多细节、景别描述等。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲AI生图

旅行达人智能体可以帮助制定旅行计划,我提问道:去澳门玩两天,有什么建议?

元宝为我列出了一个时间表,并提供了交通方式、住宿选择、价格参考等。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲旅行规划

我还体验了种草文案写手智能体,根据提示,只需输入商品名称就可以生成宣传文案。我输入了樟脑丸,看看这个东西要怎么去安利。

元宝首先给它定位为“超级实用的小物件”,随后从产品特点、使用感受、实际效果、使用方法来进行种草,最后给出了使用注意事项。

实测腾讯首个大模型App:秒读60万字财报,精准读图识猫,信息搜索有待提升

▲种草文案

整体来看,元宝在智能体能力上表现也不错,作为工作、生活帮手能提供有价值的信息。虽然目前官方提供的智能体选择还不是特别丰富,不过与腾讯元器打通后,应该会呈现出更多有趣的功能选择。

结语:大模型App赛道,又一强力选手入场

随着腾讯元宝的正式上线,大模型App赛道再次迎来一位强有力的选手。现阶段,元宝虽然在功能创新、实时信息搜索准确度上仍有提升空间,不过在生成速度、内容质量上也有一定优势。

作为业务广泛的互联网大厂,腾讯在产品工程能力、技术创新上都有很大的积累。我们期待元宝在未来的迭代中呈现出更丰富的功能和更高的水准,也期待它的加入能为大模型App赛道带来良性竞争。