昨夜,一个神秘模型——HappyHorse-1.0“踩着”字节跳动旗下Seedance、昆仑万维旗下SkyReels及快手旗下可灵,登顶三方AI模型测评平台Artificial Analysis文生视频模型榜单Video Arena。
HappyHorse被戏称为“欢乐马”,其爆火,一方面因为“实力”出众,另一方面则因为其身上的“神秘感”——目前,并没有相关团队和品牌出面“认领”HappyHorse-1.0模型。
“天下英雄如过江之鲫”。
Sora的突然退场,全球AI视频生成的王座之争,瞬间失去了头号种子选手。但这条赛道的硝烟,反而烧得更加热烈。
3月24日,OpenAI毫无征兆地全面关停了Sora:APP下架、API接口掐断、ChatGPT内置入口抹除。就连与迪士尼正在洽谈的合作也戛然而止。一款存在了两年的产品彻底消失在全球AI视频生成领域的版图上。
作为通用大模型兴起后最受关注的细分赛道,以Sora为代表的AI视频生成,一直站在行业聚光灯下。
Sora凭借首创的时空潜在块技术,性能全面碾压前代产品,再加上OpenAI的光环加持,一度被全球用户奉为标杆。
可即便如此,它从始至终都被各路玩家环伺。如今Sora离场,整个AI视频赛道的走向,彻底成了未知数。
01、AI视频风起,Sora不是先行者
AI视频生成脱胎于通用大模型,Sora并不是这个赛道的先行者。
国内市场上,字节即梦AI、快手可灵AI、MiniMax海螺AI等产品早已落地,都能靠自然语言直接生成视频。
按照北大《AI视频生成技术原理与行业应用》报告的定义,AI视频是用机器学习、计算机视觉完成视频的生成、编辑、分析与增强,核心分为文生视频、图生视频、视频转视频三类。
从发展进程来看,AI视频生成模型的发展进化可以追溯到1990年代。
随着图像序列拼接技术出现,影视*和动画制作有了更多实现方式。经过此后20余年的发展,视频技术臻于成熟。直到2014年,美国计算机科学家、工程师伊恩·古德费洛(Ian Goodfellow)提出了生成对抗网络(GAN),这一理论成为生成式AI的理论基础,伊恩也因此被称为“GAN之父”。
尽管GAN具有诸多优势,但因为其训练过程不稳定、容易导致崩溃,同时其生成内容具有一定随机性难以精准控制等缺点,并没能成为生成式AI的见识基础,直到Transformer架构产生。
Transformer能够并行处理整个序列,并通过注意力机制处理序列中的长距离依赖关系,实现对自然语言更精准的理解。成为此后视频生成的基础。
目前,Diffusion扩散模型因其能够生成连贯、逼真的视频内容,也成为图像生成和视频生成的重要技术支撑。
2022年Meta率先推出Make-A-Video成为关键节点。该模型支持文生、图生、风格转换,成为当时的革命性突破,可短板也很明显——只能生成几秒短片,时长一拉长就画面闪烁、运动断裂。
扎克伯格当时评价:“AI生成视频比图像难太多,既要算准每一个像素,还要预测像素的时序变化,Make-A-Video能理解真实世界的运动,已经是巨大进步。”
Meta开了头之后,行业节奏加快,谷歌、Runway纷纷推出商业化AI视频模型。
2024年,AI视频赛道彻底爆发。OpenAI2月上线Sora,让这个赛道破圈;6月快手可灵AI登场,成为全球*用户可直接使用的真实影像级视频生成模型;7月字节跳动推出Seedance,轻量化文生工具快速普及。至此,AI视频生成形成“大厂盘踞、创企追赶”的格局,全面竞逐正式开启。
02、巨头扎堆,玩家竞逐
AI视频生成的集中爆发,不止是技术成熟,产业需求和资本推力同样关键。
技术跃迁直接改写了内容生产的成本公式。Sora、字节Seedance 2.0等产品落地,标志着AI视频从实验室走向规模化应用,单条5秒高清视频的成本,从传统3000元直接骤降。
同时,产业需求的结构性缺口成为AI视频领域“生长”的沃土。一方面,随着社交媒体和影视行业的发展,用户对视频内容的需求提升。而传统制作模式效率低、成本高,难以匹配市场对个性化、高频内容的需求。广告、影视、电商等行业渗透率不足20%,AI视频技术以“分钟级创作、百元级成本”的优势,精准填补了这一空白。
此外,资本的托举成为行业繁荣的又一个推动力。据了解,2025年以来,AI视频领域融资额涨幅达370%,字节、阿里、腾讯等巨头也加速布局。在Artificial Analysis文生视频TOP10的榜单上,国产模型已占据七个席位。
结合IT桔子数据粗略来看,国内从事AIGC方向的创业企业有490余家,其中包含MiniMax、智谱、商汤科技等8家上市企业。
为了解AI视频生成模型赛道主要玩家,亿欧网结合公开数据盘点如下。国外视角来看,Sora下线之后,牌桌上来自Runway、xAI、Google、Pika等厂商的模型产品依旧位居前列。
模型 名称 | 公司 | 一句话描述 |
Gen | Runway | 以订阅制服务好莱坞等影视机构,Gen-4.5 版本在画质、动态捕捉和叙事连贯性上达到行业标杆水平 |
Veo | 已落地超120个国家,支持生成超60秒1080P高清视频,Veo 3.1版本实现原生音画同步生成 | |
Stable Video Diffusion | Stability AI | 提供企业级 API 服务,支持图生/文生视频,可封装为企业级服务满足商业场景需求 |
Phenaki | Google DeepMind | 支持最长5分钟连续视频生成,可根据时序变化的文本提示生成连贯叙事内容 |
Dream Machine | Luma AI | 向电商、游戏、建筑等行业提供3D视频解决方案;估值达12亿美元 |
Higgsfield Studio | Higgsfield AI | 2025年营收超8000万美元,全球用户规模突破200万 |
Pika | Pika Labs | 2025年完成B轮融资,估值达5亿美元,以高画质、动态流畅性受全球创作者青睐 |
Synthesia Studio | Synthesia | 可快速生成多语言数字人讲解视频,广泛应用于企业培训、品牌营销等场景 |
Firefly Video | Adobe | 主打 IP 友好、商业安全,支持文生/图生视频,为创意工作者提供可控的商用视频生成能力 |
Seedance Global | ByteDance(海外) | 深度集成于全球版剪映 CapCut |
grok-imagine-video | xAI | 基于 Aurora 多模态引擎,支持文生/图生视频并自动生成同步音频 |
Ray | LumaLabs | 主打高保真3D场景生成,支持文生视频,为创作者提供沉浸式视觉内容创作能力 |
LTX | Lightricks | 基于 DiT 架构,支持原生4K、最长20秒音画同步生成,可本地部署且商用友好 |
P-Video | Pruna AI | 以极速生成、低成本为核心优势,支持文生/图生视频,适合快速创意迭代 |
Marey | Moonvalley | 以高画质、动态自然的生成效果面向C端创作者 |
Krea Realtime | Krea | 支持实时交互生成视频,创作者可即时调整提示词并同步看到生成效果 |
Midjourney | Midjourney | 主打图像转视频,支持将静态图生成长达20秒的动态视频,提供高低两种运动模式 |
(国外主要AI 视频生成模型)
与此同时不容忽视的,像英伟达、微软、亚马逊、奈飞等在全球范围内备受关注的企业,尽管AI视频并非其核心业务,但它们在AI视频生成方面也有相关模型工具。
比如英伟达提供RTX Video Super Resolution(VSR)工具,支持ComfyUI等AI视频生成工具。亚马逊有NovaReel视频生成模型,微软也有包含Bing Video Creator在内的多款视频生成工具。而这样的行业情况在中国亦如是。
国内来看,AI视频生成模型赛道上主要涵盖大厂和创业企业两类玩家。这其中,除了BAT等科技企业之外,美团、网易,小红书等也都上线相关AI视频生成工具。
模型 名称 | 企业名称 | 一句话描述 |
即梦AI(SeeDance) | 字节跳动 | 2026年3月数据:日均生成视频超 500 万条,付费转化率达 15%;主打AI驱动的智能视频生成与编辑,高效支撑内容生产 |
可灵AI | 快手 | 2026年2月披露数据其ARR 超 3 亿美元 |
通义万相 | 阿里巴巴 | 集成至阿里云百炼平台,提供 API 服务;阿里旗下一站式多模态生成工具,涵盖文生图、电影级视频生成与智能编辑 |
智影 | 腾讯 | 集素材搜集、剪辑、数字人播报与文章转视频于一体,降低视频制作门槛 |
LongCat-Video | 美团 | 基于美团 LongCat 大模型体系,支持 5 分钟级长视频生成与视频续写,兼顾高画质与低成本,适配电商与本地生活场景 |
FancyVideo | 360 | 360AI团队与中山大学联合研发的开源视频生成模型,基于UNet架构,可在RTX3090上生成任意分辨率、风格和运动性的高质量视频 |
VIDU | 生数科技 | 依托清华技术研发的高端视频生成平台,支持 16 秒 1080P 生成与高精度物理仿真 |
PixVerse | 爱诗科技 | 2026 年 1 月完成 3 亿美元融资,刷新亚洲 AI 视频融资纪录;主打多模态引擎与 4K 极速生成,拥有全球海量用户与*模板库 |
Hailuo | MiniMax | MiniMax 旗下视频生成模型,专注肢体动作与面部表情的高保真还原,支持与小红书、B 站等平台合作进行内容创作 |
智谱清影AI | 智谱 | 依托 GLM 大模型基座,提供高精度文本 / 图像 / 视频生成与本地部署能力,技术性能处于全球前沿 |
Step-Video-T2V | StepFun | 拥有 300 亿参数,支持* 204 帧高清视频生成,兼顾中英双语支持与商业友好授权 |
天工SkyReels | 昆仑万维 | 登顶 Artificial Analysis 榜单 “文本生成视频(含音频)” 赛道全球*;昆仑万维旗下 AI 短剧创作平台,支持长时视频生成与专业分镜 |
万兴天幕Tomoviee | 万兴科技 | 全球用户超 2 亿,覆盖 200 多个国家和地区;万兴科技一站式 AIGC 创作平台,支持视频 / 图片 / 音频生成与智能配乐,覆盖全创作场景 |
讯飞绘镜 | 科大讯飞 | 可自动完成脚本生成、分镜编排、音画合成全流程 |
Sensevideo/Seko | 商汤科技 | 业内*多剧集生成智能体,支持百集以内剧本连续创作 |
MOKI | 美图 | 基于自研奇想大模型的一站式 AI 短片创作工具 |
HiDream.ai | 智象未来 | 主打高精度视频生成,可精准复刻多种艺术风格,以 4K 高清画质与高时空一致性打造影视级短视频内容 |
白日梦 AI | 光魔科技 | 支持生成 6-30 分钟高清长视频 |
VegaAI | 右脑科技 | 一站式 AI 创作平台,原生支持文生 / 图生视频及 4K 画质提升,集成丰富创作工具与智能编辑功能 |
LiblibAI | LiblibAI奇点星宇 | 聚合式 AI 创作平台,集成通义万相、可灵等多款*视频模型,支持一站式图文到视频全流程创作 |
SeaArt | 海艺互娱 | 支持文生 / 图生视频与长内容分镜生成 |
Clipfly | 成都恒图 | 集成多模型生成与智能剪辑工具,支持电影级运镜控制 |
Medeo | ONE2X | ONE2X 旗下对话式 AI 视频生成平台,专注人机交互场景的视频创作,支持实时对话驱动的内容生成与呈现 |
Magi | Sand Ai | 全球*高质量开源自回归视频生成模型,支持本地化部署;备高效生成与低资源占用特性,广泛适配个人与企业开发环境 |
Phoenix AI™ | 星迹互动 | 自研AIGC 星迹Phoenix AI™全栈式影视生成工具 |
AniShort.ai | AniShort | AniShort.ai一站式AI短剧智能协创平台,覆盖脚本到分镜到成片全创作流程,大幅降低创作门槛,高效赋能全篇层短剧创作 |
(国内主要AI 视频生成模型)
最意外的是4月8日,Artificial Analysis的榜单上,一只“快乐马”的模型力压字节的Seedance、昆仑万维的Skywork AI以及快手旗下可灵AI,一举登顶文生视频模型榜首。
值得关注的是,截至当晚,几乎没有人知道这只“快乐小马”出自哪家厂商。因此也可以发现,AI视频生成模型细分赛道上新的玩家不时入场,竞争角逐正在愈发激烈。
03、商业化跑通
尽管市场的竞争角逐正如火如荼,但AI视频生成模型的应用场景及其商业模型无疑是更值得关注的核心问题。
首先从应用端来看,目前AI视频生成技术正以惊人速度渗透至千行百业,重构内容生产与消费的全链路,亿欧总结其四大核心应用场景。
一方面是商业营销与广告。AI视频生成模型的上线,使得短视频广告制作平均周期从7天缩短至4小时,相对于传统生产模式而言成本急剧降低,转化率大幅提升。Seedance 2.0等工具可一键生成适配抖音等多平台的广告素材,自动适配不同尺寸与内容规范,解决营销行业“创意荒”与“效率低”的双重痛点。
另一方面是在影视与泛娱乐领域。据了解,AI视频生成模型工具作用下,AI漫剧制作周期缩短50%以上,成本降至传统模式的10%-30%,2025年4-7月供给量以83%的复合增长率扩容。
产品方面,亿欧网过程中发现多家企业AI模型可实现从剧本到脚本,从拍摄到剪辑的全流程自动化。据了解,影视工业中,AI已承担30%的前期制作工作量,包括分镜设计、*预览和场景搭建,推动行业“创意密集型”转变。
除此之外,在教育、医疗等垂直领域,AI视频生成模型也有了用武之地。AI视频助手可生成动态教案、实验模拟和3D可视化内容,将抽象知识具象化,提升学习效率30%以上。医疗行业,手术模拟、病理切片动态演示和医学科普视频的快速生成,降低了医学教育门槛。电商领域,虚拟试衣、产品360°展示和个性化购物场景生成,大幅提升用户转化率。
最后,AI视频生成模型也助力了个人创作的普及,多模态输入能力使普通人通过提示词即可驱动专业级内容生产,“全民创作”时代加速到来。手机端模型压缩技术让千元机可生成4K视频,显存占用减少50%,进一步降低创作门槛。
亿欧网了解到,在社交媒体平台,有关AI视频的讨论*热烈。电商、广告创意、AIGC内容博主都对AI视频展现出极大的需求。有用户对亿欧网表示,其所在单位每月都会给AI视频模型充值,资费以万元起步。
高盛预计,AI视频生成行业全球市场规模将从2025年约30亿美元增至2030年约290亿美元,五年增长近10倍。
国内市场上,可灵AI 率先披露了其营收情况。3月25日,快手科技创始人兼首席执行官程一笑表示,今年一月份可灵AI的ARR已超过3亿美元。
同时程一笑也表示漫剧和AI应用是今年的增量机会,快手将通过流量、算力和AI漫剧Agent等扶持计划,丰富供给并带动营收增长。
字节旗下的即梦AI一度被冠以AI视频生成模型的“DeepSeek时刻”。但是作为尚未上市的一家企业,相关营收数据官方并未披露。相关公开数据显示,截至今年3月份,即梦AI的月活用户为893万,1月份,Seedance2.0版本的上线,一度拉动月活用户达到1200万,与同时段可灵AI的月活用户数基本持平。
04、繁荣背后是荆棘
尽管AI视频生成技术进展迅猛,但行业仍面临多重挑战,制约其从"玩具"向"工具"的全面转型。
首当其冲是技术瓶颈。当前AI视频生成在物理合理性与时序一致性上存在硬伤——液体飞溅、布料碰撞等复杂物理交互易出错,人物肢体畸形、动作失真等问题频发,高度拟真内容中"恐怖谷效应"依然存在。
OpenAI关停Sora的原因之一,正是技术未突破"世界模型"瓶颈,导致可用率仅5%-10%。
其次,伦理与法律风险日益凸显。深度伪造技术的滥用可能制造虚假信息、诈骗和恶意抹黑,对社会信任体系构成威胁。
版权归属问题悬而未决。AI训练数据是否侵犯原创者权益、生成内容的版权归属于用户还是平台,缺乏明确法律界定。行业尚未形成统一的版权确权与授权机制,制约商业化进程。
其中*的掣肘因素当属算力限制。OpenAI CEO奥特曼坦言,算力资源极度紧缺是Sora关停的重要原因之一。
国内平台曾出现排队8万人、等待超12小时的算力紧张局面,倒逼行业探索错峰生产、硬件调度创新和模型轻量化等解决方案。
算力已成为AI视频生成领域的核心竞争力。快手CFO金秉表示,2026年快手集团整体资本支出将达到260亿元,较上年增加约110亿元。而这些投入主要在算力层面,包含可灵大模型和其他基础大模型的算力投入,也包括离线数据存储处理等常规的服务器采购支出以及数据/算力中心建设工程投入。
着眼未来,可控性*提升、合规体系和生态的完善仍是待解的难题。AI视频生成技术正处于从量变到质变的关键节点。
尽管挑战重重,但技术突破与产业需求的双重驱动,将推动这一领域在未来3-5年内全面重塑内容创作生态,从根本上改变视频生产与消费的方式。











