☰

快手加入大模型应用战

作者 | 刘宝丹

编辑 | 周智宇

一个多月前，字节发布了豆包大模型家族，直接将大模型价格带入“厘时代”。如今，快手也搬出了压箱底的大模型矩阵，盯上了工具应用。

7月6日，在“新AI·新应用·新生态”论坛上，快手大模型首次集体亮相，视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。

快手高级副总裁、主站业务与社区科学线负责人盖坤表示，快手搭建了以快意语言大模型、推荐大模型、视觉生成大模型为核心的大模型矩阵，覆盖内容理解、分发、生成等多个层面，并深度服务快手的商业生态场景。

快手面向AI时代打出了自研+应用的大模型矩阵，重点在于快手本身的业务提效和业绩增长。快手终于开始向大模型市场亮剑了。

亮相

千呼万唤始出来，快手大模型终于亮相了。

在会上，快手宣布，基于自研的视觉生成大模型产品可灵AI网页端正式上线，这是可灵AI在一个月内迎来的第三次重大升级，意味着，普通用户可以登录网站进行功能试用。

可灵AI基础模型也进行了升级，推出更加清晰的高画质版，以及首尾帧控制、镜头控制等全新编辑能力。同时，创作者单次生成的文生视频时长增加至10s，是业内对用户开放使用可实现的最长时长。

据介绍，可灵以真实世界物理规则为基准，生成的视频展现出了电影级别的画质与动态效果，甚至能够模拟大幅度的物理运动，打破了传统视频生成技术的局限，收获了国内外的好评。

快手视觉生成与互动中心负责人万鹏飞表示，可灵AI大模型最新发布的版本中，可灵在运动生成、生成时长、物理规律、视频画质、指令响应、图生视频、视频可控性等七个方向的能力亮点实现进一步升级，可单次生成更高清更可控的10s及更长的视频。

自从6月6日正式发布文生视频功能以来，可灵迎来了快速发展。在CVPR（IEEE国际计算机视觉与模式识别会议）期间，可灵推出了图生视频、视频续写等多项新功能。

本次论坛上，快手还正式宣布，可图将正式开源。

盖坤介绍，可图大模型集成了快手在大语言模型领域的深厚积累，通过数十亿中文语料的训练，成为最懂中文的文生图模型，其综合性能超越了SDXL/SD3等开源模型以及Midjourney等闭源模型，树立了中文场景下图像生成的新标杆。

对于开源动作，盖坤表示，这一举措旨在激发行业活力，共建一个更为繁荣的文生图大模型社区生态。

前景

从一开始，快手就很明确，大模型的核心目标是为快手体系内的场景和商业化而服务。

这主要体现在两个方面，一是内容生产，快手意在打造“新一代AIGC创作、素材工具”和低门槛、智能化的内容生产体验；二是内容消费，快手打算升级内容理解和分发体系，提升用户的消费体验。

前者主要服务于快手的商业化效率。据了解，基于快意大模型构建的视频脚本生成工具，叠加数字人技术，助力快手商业化广告主低成本生成视频和直播内容，并提升线索转化效率。

快手数据显示，AIGC营销素材在今年6月达到了单日消耗峰值突破2000万的里程碑，展示了大模型在商业场景中的巨大潜力。

快手商业化外循环和AI商业产品负责人刘逍透露，半年来，有近2万商家在快手平台借助大模型能力实现智能化经营。相比今年1月，今年6月的AIGC月活跃客户数增长了8倍，月GMV规模提升了64倍，平台AIGC广告收入规模提升了12倍。

内容生产方面，更大的市场前景来自C端用户和包含短剧在内的相关行业。

据盖坤透露，截至目前，已有超过50万用户申请可灵的内测资格，视频生成数量达700万，尤其用户通过“可灵”创造的“老照片复活”等作品，因为触动人心的力量火爆全网。

在3月的年度业绩电话会上，快手创始人兼首席执行官程一笑表示，2023年公司启动AI战略后，一步步推进自研大模型的研发训练。对于文生视频，快手已于去年底推进专项研发。

“这对短视频生态是巨大的机会，未来快手会把生成模型和生产者工具结合起来，不断帮助创作者降低创作门槛，提升短视频制作质量和效率。”程一笑如是强调。

行业方面，快手大模型已经率先用在了短剧生产上，由可灵提供深度技术支持的国内首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》已经发布预告片，不日即将上线。

对此，快手副总裁、大模型团队负责人张迪表示，“可能半年以前，大家都没法想象真正用AIGC来制作电影，（现在它）来了！”在他看来，利用AI技术可大幅度提高短剧生产、制作和运营的效率。

内容消费方面，发挥更大作用的是推荐大模型SIM。据盖坤介绍，该模型凭借十万亿参数的规模，成为全球领先的推荐系统之一。其下一代架构ACT预计每日将为快手App增加4亿分钟的用户观看时长，显著提升用户粘性和活跃度。

对于未来，快手非常笃定，盖坤表示，快手未来将继续加大在AI领域的投入，大力推动技术创新。

相关资讯