视频大模型 快手美图殊途同归

视频大模型快手美图殊途同归第1张

　　来源：北京商报

　　有图像视频业务傍身的互联网企业，加速奔向大模型。近日，快手正式上线视频大模型“可灵”并开始邀测，用户输入一段文字即可生成视频。美图宣布将在7月底上线新品MOKI，该产品基于美图奇想大模型的视频生成能力，可帮助用户生成AI短片。不论是做视频还是做短片，都是通过大模型辅助用户创作，契合自己的主营业务。目前，获得内测资格的用户可以免费使用可灵，其他AI功能以限时免费、限次免费等方式向用户开放。美图相关人士并未透露KOMI的变现计划，但付费会员、单次付费等变现模式已是美图成熟的商业模式。

视频大模型快手美图殊途同归第2张

　　不约而同

　　“今天你‘可灵’了吗？”6月12日晚间，快手通过官方公众号向用户“安利”自家的视频生成大模型“可灵”。为了证明实力，快手不光拿出一条由快手可灵生成的一分钟预告片，还放出一系列首批获得测试资格的创作者生成的视频，如一朵花绽放的过程、复活成语故事《对牛弹琴》等。

　　打开快手的视频剪辑App快影，进入主页的“AI玩法”，再点击“AI生成视频”模块填写问卷，即可以申请免费的内测资格。根据内测网友提供的信息，用户可以输入一段200字以内的文字描述，自行选择超现实主义、极简等风格，再等待约3分钟，就能看到由可灵生成的一段5秒视频。

　　来自快手的最新数据显示，截至目前，在快影App上申请文生视频内测资格的人数已超6万，图生视频功能将于近期上线。

　　同样瞄准视频大模型出手的还有美图。“目前市场上的AI视频产品倾向于提供文生视频等能力，我们认为只有深度理解创作者的需求，提炼有共性的视频场景，才能打造辅助内容创作的工具。”美图创始人吴欣鸿谈到MOKI时说，“MOKI聚焦于AI短片创作，专注于动画短片、网文短剧、故事绘本和MV等视频场景。”

　　具体的工作流程是：在脚本、视觉风格、角色等前期设定完成后，AI自动生成分镜图并转为视频素材，通过智能剪辑、AI配乐、AI音效、自动字幕等功能串联素材并实现成片。MOKI的上述能力即基于美图奇想大模型。

　　热度升温

　　除了快手、美图，近日视频生成的网红应用Pika、联合清华大学发布视频大模型Vidu的生数科技，也为视频大模型赛道添了一把柴。

　　Pika不久前通过官网宣布，Pika已完成总额8000万美元的B轮融资，由Spark Capital领投，Greycroft、Lightspeed Venture Partners以及Jared Leto参投。Pika团队表示，这一轮融资将加快公司构建最佳视频模型的进程，同时帮助公司聘用优秀的人才。

　　成立于2023年4月，爆火于2023年11月，早在Sora出世前，Pika就依靠AI生成和编辑3D动画、动漫等多种风格的视频，成为网红应用。

　　生数科技仅比Pika早成立一个月，主要业务集中在图像、3D、视频等原生多模态大模型的研发。2024年4月，生数科技联合清华大学发布的视频大模型Vidu，支持一键生成16秒、分辨率1080P的高清视频内容。

　　6月初，生数科技宣布，已完成数亿元Pre-A轮融资，由百度、北京市人工智能产业投资基金领投，此前这家创业公司还获得了来自蚂蚁集团、智谱AI等的投资。生数科技称，将在本轮融资完成后坚持其原生通用多模态技术路线，持续迭代优化自研大模型，并加速产品开发与市场拓展。

　　“近期视频大模型活跃，说明大模型最早形成的一些技术壁垒在被打破。”文渊智库创始人王超告诉北京商报记者，“我认为能超过GPT-4的中国大模型可能在年中就会出现。中国的算力、能源和人才，支持着中国大模型持续追赶。”

　　谈及视频大模型的门槛，中经传媒智库专家张书乐向北京商报记者表示，“视频生成不是将一堆AI绘画连在一起变成动画片，除了考虑形象一致、符合描述、光影分割、分镜表现等，还要具有对剧情的理解能力、再创造能力，这些都需要对视频结构、内容解析等多个垂直领域进行深度学习，难度高于聊天、绘画或棋类等靠主要数据堆积和用户纠错完成的功能”。

　　跟着业务走

　　2022年底OpenAI的ChatGPT让国内科技巨头在生成式大模型赛道扎堆，且大多瞄准对话式互动形式，2024年OpenAI又推出文生视频模型Sora。和一拥而上的大语言模型竞争相比，在视频大模型领域比拼的主角更多是图像视频类互联网公司。

　　站在技术的角度，王超认为，“这两种大模型虽然都是AGI（通用人工智能），但技术路线不同，OpenAI两个都做，但不是每个企业都有这样的能力”。

　　在视频大模型赛道，“快手和美图的最大优势在于用户积累、算法和数据处理等方面的经验”，深度科技研究院院长张孝荣表示。

　　张书乐的看法是，“快手、美图拥有可以让人工智能深度学习的‘学习资料’，且可以规避一定的版权问题。这两家企业在视频领域的内容积累、垂直细分的标签标注，能让大模型更好地‘检索’知识”。

　　不过第三方观察者也提醒，做视频大模型的难度比大语言模型更高，前景还不明确，“这是没多少国内大模型创业公司进入视频大模型赛道的原因，连巨头都没那么积极”，王超说。“视频大模型的变现比大语言模型困难。”张孝荣补充。

　　快手和美图正通过各种手段吸引更多用户使用AI，并寻找AI变现的路径。以快影的AI创作功能为例，快影向用户提供AI舞王、AI小说转漫画、AI变装、AI头像壁纸等十几种服务，其中AI舞王提供免费5次的使用机会、AI变装限时免费、AI小说转漫画是VIP会员的权益。

　　美图相关人士并未向北京商报记者透露MOKI可能的变现模式，但吴欣鸿在介绍美图新品时多次提到产品的商业化数据，在他看来，“如果AI帮用户创收，用户是很愿意为能创造价值的AI产品付费的”。

　　北京商报记者魏蔚

视频大模型快手美图殊途同归

紫牛新闻:澳门王中王100%的资料2023-农村漫山遍野的这种野菜,不仅好吃还降糖降压,美容护肤,好处太多

剧透未来科技国产“智”造惊艳上交会

视频大模型 快手美图殊途同归

紫牛新闻:澳门王中王100%的资料2023-农村漫山遍野的这种野菜,不仅好吃还降糖降压,美容护肤,好处太多

剧透未来科技 国产“智”造惊艳上交会

相关文章

视频大模型快手美图殊途同归

剧透未来科技国产“智”造惊艳上交会