本报记者李昆昆李正豪北京报道
近 日,快手科技(01024.HK) 发 布 了2024年第三季度业绩。财报显示,快手2024年前9个月营收为915.14亿元,较上年同期的809.09亿元增长13.1%;毛利润为501.69亿元,较上年同期的400.99亿元增长25.1%。
第三季度,快手在稳步推进基座大模型各项性能优化提升的同时,也在加速大模型在内容理解、内容推荐、内容生产及用户互动等各领域场景的应用,并力图实现算法、应用和商业模式的多方创新。在模型训练和投入上则倾向和快手已有业务打配合,形成正循环。
快手方面在接受《中国经营报》记者采访时表示:“目前,快手AIGC视频客户渗透率达到24%,商业内容生产方面,目前磁力开创日均生成的短视频素材已经达到10万条以上,显示出智能化技术在商业化领域的广泛应用和显著成效。”
可灵AI用户留存提升
据了解,可灵AI自2024年6月问世以来,已累计升级迭代十余次,基础模型质量持续快速演进,视频创作的画面可控性也不断提升,陆续上线了首尾帧控制、运动笔刷、对口型等功能,并内测视频人脸模型功能,为用户提供了更加丰富的创作手段。数据显示,截至目前,可灵AI的用户已超过500万,累计生成超5100万个视频和超1.5亿张图片。
在业绩电话会上,快手科技创始人兼首席执行官程一笑称,9月发布的可灵AI1.5模型,支持原生1080P视频,并在可控生成方面先后研发上线了镜头控制、首尾帧控制、运动笔刷、对口型等多种能力。可灵AI的用户留存也逐月提升,并在9月份月活超150万。
艾媒咨询CEO张毅告诉本报记者:“可灵在AI方面的能力,尤其是视频生成这方面的能力,还是有比较好的基础。AI大模型产品,一个很重要的基础一定是要有足够好的数据基础,比如语料。而快手那么多年在短视频各种类型的素材方面,涉及不同的方向,比如场景、人物以及剧情,这些庞大的数据积累基础,让大模型的生成效果以及它的呈现更加有技术性和高效。如果没有这些优势,去做这样的产品,基础就不牢,需要有更好的算法或是其他的储备。”
张毅称,从劣势的角度来讲,这种技术能力和结果的生成,以及在商业落地方面还会有很长的路要走,这个过程对快手来说也会耗费比较多的资金、时间成本,以及很多不确定性,对一家上市公司来讲,这也许会对其财报形成压力。
架构的选择方面,可灵整体框架采用了类Sora的DiT结构,用Transformer代替了传统扩散模型中基于卷积网络的U- Net。Transformer的处理能力和生成能力更强大,扩展能力更强,收敛效率更好,解决了U-Net在处理复杂任务时冗余过大、感受野和定位精度不可兼得的局限。在此基础之上,快手大模型团队还对模型中的隐空间编/解码、时序建模等模块进行了升维。
另外在时序信息建模上,快手大模型团队设计了一款计算高效的全注意力机制(3D Attention)作为时空建模模块。该方法可以更准确地建模复杂时空运动,同时还能兼顾具运算成本,有效提升了模型的建模能力。
除了模型自身的能力,用户输入的文本提示词(prompt)也对最终生成的效果有着重要影响。为此,团队专门设计了专用的语言模型,可以对用户输入的提示词进行高质量扩充及优化。
在视频生成上,快手也曾与多个高校或科研机构联手,陆续发布可控运动的视频生成算法Direct-a-Video、多模态生成算法Video-LaVIT、图生视频算法I2V-Adapt-er、多模态美学评价模型UNIAA等关键技术,为可灵大模型积累了深厚的技术沉淀。
如今,快手已搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵,覆盖内容生产、理解、推荐等多个层面,并深度服务快手的商业生态场景。
推动模型应用正循环
谈及快手AI在其他方面的探索,快手方面告诉本报记者:“基于丰富业务场景,用AI重塑生态,让模型和应用形成正循环飞轮。目前,快手的大模型布局核心还是围绕内容理解应用、推荐大模型和视频生成大模型三个方向进行重点突破,并力图实现算法、应用和商业模式的多方创新。在模型训练和投入上则倾向和快手已有业务打配合,形成正循环。”
以快意语言大模型的应用为例,在商业场景里,基于快手大模型构建的数字人脚本创意生成、数字人渲染生成、数字人实时互动等全流程AIGC服务,可助力商业化广告主低成本生成高品质的视频和直播内容。
在内容的理解和推荐方面,快手通过大语言模型、多模态大模型等技术,已经可以准确高效地理解视频内容和用户兴趣,将这些标签应用在推荐、搜索、广告、垂类运营、生态分析、内容安全等各种场景中,也可以全面地提升全站运营效率。
另外,快手也一直在尝试运用AI大模型这些智能化技术,从素材的生产、理解、分发到承接,提供全链路的解决方案,智能化生产、数字人直播、营销大语言模型等技术的应用,不仅提升了内容生产的效率,也增加了转化率。
关于大模型在业务中的具体应用场景以及数据表现,程一笑说,在内容理解方面,快手持续推进大模型技术在短视频、直播、评论、商业化及电商等多场景落地,并取得了在用户留存、商业化消耗和电商GMV等多个方面的进展;在内容推荐方面,升级后的推荐大模型技术,带来了显著的时长增长;在内容生产及互动方面,本季度AIGC营销素材消耗继续提升,日均消耗超2000万,而互动助手AI小快也融入了包括奥运竞猜、用户私信和评论区互动等更多场景,MAU(月活跃用户数)峰值突破1800万。
程一笑表示,在第三季度,快手还在持续优化基座大模型的性能,深化大模型在内容理解、内容推荐、内容生产及用户互动的应用。在基座大模型方面,快手正在研发的快意大模型MoE模型,在总参数量仅数百亿规模的情况下,模型预训练阶段的多个指标超过了快意1750亿模型,大幅降低了模型训练推理成本,也能更好适配快手现有的业务场景。