快看宣布研发 AI 产品,基于开源大模型微调训练二次元垂直大模型

aixo 2024-09-02 12:16:18
大模型 2024-09-02 12:16:18

此前在2022年年末,横空出世的成功普及了一个新名词“AI大模型”,一时间大量互联网厂商开始一拥而上,扎堆做大模型也成为了2023年互联网行业一道独特的风景线。除了阿里、百度、腾讯、字节跳动等巨头做通用大模型之外,中小厂商则往往会选择因地制宜,做针对特定行业或领域的垂直大模型。

飞机厂的模型大狮_模型大小和参数量_大模型

比如说在去年春季,漫画平台快看宣布成立AIGC事业部。时隔一年,快看方面也向外界公布了其正在研发的AI产品。7月11日,在由全球领先数据库公司举办的User Tech直播活动中,快看方面透露,目前在尝试基于开源大模型进行微调,训练快看在二次元领域的垂直大模型。

根据快看方面的说法,目前快看在AI智能问答和IP角色互动两个场景已取得实质性进展,相关AI产品也正在内测,用户未来将很快能够体验到新产品的功能。据悉,快看方面是借助大语言模型(LLM)和检索增强生成技术(RAG)来提高作品搜索转化率,并为搜索带来新的活力,他们采用“微调大模型+RAG增强”策略构建了内部PGC专题知识库、UGC帖子知识库和问答知识库。

模型大小和参数量_飞机厂的模型大狮_大模型

简单来说,快看此次搭建的二次元领域垂直大模型主要应用在两个场景,其一是类似.AI力推的AI角色扮演,其二则是基于自家内容库搭建的一个应用于二次元领域的AI搜索。其中,AI智能问答能够帮助用户从海量的漫画作品中找到自己想要看到的,而IP角色互动这个场景则满足了用户希望自己喜爱的漫画角色能够打破第四面墙、与自己面对面交流。

乍一看,快看选择的方向算得上是因地制宜,毕竟成立于2014年的这家公司,做的就是定位国内年轻读者的国漫IP平台和分享社区,在经过十年的发展后已经成为了国漫行业的龙头,拥有超过1.3万部漫画作品和80%的头部优质IP。想要用AI赋能产品,从而在腾讯、B站等更加强势的竞争对手挤压下留住用户,这就是快看做AI产品的初心。

飞机厂的模型大狮_大模型_模型大小和参数量

然而,AI赋能并非一蹴而就。先来说说“AI智能问答”的问题,基于庞大的内容库做AI搜索显然不是问题,比如知乎就做了“知乎直答”、微信读书做了“AI问书”,这些都是相关厂商对现有资产的充分利用,但快看的问题则是相较之下内容库有些单薄,毕竟1.3万部漫画作品其实并不算多。而AI大模型之所以能够实现智能涌现,大规模参数是关键,而1.3万部漫画即便是作为小尺寸模型的语料可能也很勉强。

如今国内市场的文生视频大模型为什么会是快手的可灵一马当先,而不是优酷背后的阿里、腾讯视频背后的腾讯,以及爱奇艺背后的百度,就是因为快手日均新增短视频的数量在千万级,总计已有超过百亿条短视频内容,而爱优腾等长视频网的内容库则是以万为单位。“漫画大模型”之所以到如今都没有问世,正是因为漫画作为一个新兴的媒介,它的历史底蕴不如书籍、创作门槛却堪比长视频。

模型大小和参数量_飞机厂的模型大狮_大模型

尽管1.3万部漫画作品看起来很多,但是细分到不同类型,可能每个品类就只有几百部作品,实在是不太能发挥AI智能问答的作用。至于IP角色互动,确实是当下AI应用领域的热门场景AI伴侣,上至作为独角兽的.AI、下至 GPTs商店里泛滥的AI女友,AI伴侣的魅力就在于可为用户提供情绪价值。

由于现代人的生活节奏加快、工作压力增大,导致许多人缺乏时间和精力去建立深入的人际关系,在同真实的人类交友困难重重的情况下,百依百顺的AI伴侣就不存在什么问题了。就像AI伴侣满足了男男女女交友的需求,快看的IP角色互动则满足了漫画迷看到自己喜欢的角色鲜活起来的需求。其实从某种意义上来说,由AI加持的IP角色互动就与有异曲同工之妙,都是通过满足人们的情感需求来创造商业价值。

模型大小和参数量_飞机厂的模型大狮_大模型

相比于AI伴侣,快看目前在做的IP角色互动还有一个巨大的优势,那就是角色与用户的情感连接并不是凭空捏造的。如今.AI为什么处境艰难,关键原因就是聊天机器人缺乏连贯的叙事,用户更难以从特定场景开始培养感情,而是直接切入对话。反观快看的IP角色互动则有漫画作品来做支撑,人物的塑造、世界观的描绘都不需要AI来介入。

如果快看能做到比肩.AI的对话能力,所谓IP角色互动实现沉浸式的聊天就不是一句空话。如若不行,快看建设二次元垂直大模型的想法或许就要竹篮打水一场空了。

本文来自微信公众号,作者:三易菌,36氪经授权发布。