周雯：AI驱动下的2025影视工业体系革新与未来图景

2026-04-10

阅读：来源：《中国文艺评论》作者：周雯收藏

【编者按】2025年，中国文艺蓬勃发展，呈现两个鲜明特征：一方面，人工智能等数字技术全面渗透到文艺创作的各个环节，重新定义着艺术创作的边界和可能性；另一方面，文艺与经济的深度融合催生了新的产业形态，“人文经济学”理念在全国各地开花结果，为文化自信奠定坚实的经济基础。本专题约请专家学者围绕2025年文艺领域这两大热点，回顾2025年人工智能介入影视、设计、音乐、文学等领域的最新成果，展望其发展趋势，探讨文艺与经济的双向赋能，以期深入展现当下文艺与人工智能、经济发展的崭新图景，在新的时代场景中推动文艺高质量发展。

AI驱动下的2025影视工业体系革新与未来图景

【内容摘要】 2025年，人工智能与影视产业的融合迈入新阶段，AI工具矩阵嵌入影视策划、拍摄、发行全流程，重塑影视工业新生态。新一代视频生成模型转向“世界模拟器”，表现出超越语言模型的空间理解与推理能力，实现从平面生成到空间智能的逻辑转型。AI智能体在创作端化身“赛博工友”，在体验端推动IP角色人格化，催生内容生产与用户互动新样态。未来，人工智能与影视创作将朝向多智能体协同、契合大银幕美学与虚实融合语境的高精度画面，以及情感表达与伦理边界在法律层面的明晰化等方向演进，推动影视产业迈向更高效、更沉浸、更可持续的新纪元。

【关键词】 影视制作 AIGC 生成式AI 智能体空间智能年度盘点

2025年，人工智能(Artificial Intelligence，以下简称AI)与影视产业的融合迈入新阶段，技术突破与产业实践呈双向加速之势。在模型端，以OpenAI的Sora 2、Google的Veo 3等为代表的新一代视频生成模型相继落地，不仅画面精细度、运动一致性与生成时长得到有效提升，更引入了“空间智能”(Spatial Intelligence)，推动视频生成模型从逐帧生成向世界模拟演进。在应用端，以爱奇艺、腾讯视频、虎鲸文娱为代表的长视频平台，已超越单点工具的试点阶段，构建起覆盖创意开发、内容生成、智能分发与用户互动的全链路AI工具矩阵。AI正从影视产业的幕后走向台前，从专业制作延伸至大众参与，深度融入影视内容从生产到消费的全过程。

一、AI工具矩阵渗透影视制作全流程

(一)创意激发，让创作者回归叙事本体

多模态大模型强大的上下文处理与跨模态能力，推动AI深度嵌入剧本创作的核心环节。2025年8月，由西部电影集团推出的中文电影内容AI辅助创作平台“影谱”正式上线。该平台以大语言模型为核心，围绕剧本创作的三大关键阶段，构建以“剧本生成—剧本评估—剧本修改”为核心的三大子系统，全面提供从灵感启发到内容输出，再到深度润色的全链路智能支持。AI还可扮演专业知识“翻译官”的角色。在电视剧《三体》(2023)筹备中，为解决艺术创作者与科学家之间的跨领域沟通难题，主创团队引入大语言模型提升沟通效率与准确性，通过对话方式生成数十份遵循科学规律的技术设定报告，例如“水滴攻击恒星级战舰的力学模型”“无工质推进的视觉实现逻辑”等，经专家校准后直接转化为可拍摄方案，有效提升了艺术创作的科学性与可行性。

此外，AI催生了“图文互哺”的新型工作流，打破了剧本优先的传统线性开发模式。创作者可先快速生成与设想高度一致的视觉概念，反向推动剧本优化。动画长片《恶兽》(2025)团队筹备初期同步使用Midjourney生成“川渝赛博朋克”“山海经神兽”等美术概念图，将设计周期从数月压缩至一个月。截至2025年，以Nano Banana为代表的新一代轻量化多模态图像生成模型，在角色形象快速生成方面展现出独特优势，尤其擅长生成角色三视图(正面、侧面、背面)，可确保发型、服装、面部、形体比例等关键要素在多角度下保持一致，使主创团队在实拍前即可获得用于分镜、预演、虚拟定妆的标准化角色资产，大幅降低了试错成本。

(二)增效提质，促生产链条加速创意实现

进入制作阶段，AI的应用价值从创意启发转向工程落地。以AI驱动的数字资产生成不仅显著提升了生产效率，更与虚拟拍摄体系深度联动，实现资产的跨阶段复用。2025年，爱奇艺团队在剧集《魅影神捕》中首次完整实践了“AI图生模型—虚拟拍摄—3D打印实体道具—实景复用”的闭环流程。该流程依托自研的“影像工坊”平台，综合运用文生图、图生视频及AI driven-3D模型生成等技术，将以往需要花费数周甚至数月才能完成的数字资产制作周期压缩至数日之内。特别是通过引入3D高斯泼溅(3D Gaussian Splatting, 3DGS)技术，该团队实现了对实景场地的高保真快速记录与虚拟重建，制作速度较传统方法提升上百倍，同时完整保留了拍摄现场的空间信息与视觉细节，为后续虚实交互内容的衍生开发提供了可长期复用的数字资产，实现了“一次生成、多端复用”。这标志着AI不再是孤立的增效工具，而正在成为影视工业化体系中不可或缺的基础设施。

爱奇艺自研的“影像工坊”平台可通过替换提示词迅速调整角色设计风格(来源：“光明网”微信公号)

在产业层面，AI正通过智能化流程实现“小团队撬动大制作”的工业化可能，有力推动影视产业向全媒体融合的大视听格局加速转型。2025年上线的AI漫剧《我的治愈系游戏》和《传武》，仅用四天播放量便突破千万。其中，20集的《我的治愈系游戏》由与光同尘工作室以七人团队仅在一个月内便完成了内容制作，生产效率较传统制作模式提升了约九成。其背后是基于即梦AI构建的全流程制作体系：通过单图生LoRA功能，由一张设定图便能训练出专属模型，动态分镜生成模块则能根据“横摇”“推镜头”等提示词匹配镜头运动，高效生成动作连贯的运动镜头。技术门槛的进一步降低使中小型团队得以在高质量内容生产中获得前所未有的竞争力。

(三)智能分发，助优质内容精准触达用户

AI的应用已超越制作环节，深度融入营销、分发与用户互动等环节，有效提升了“内容—用户”的连接精准性，使影视内容的分发从“大众”思维走向“分众”思维。“派生万物”平台基于AI大模型，能够将剧集、综艺、访谈等长视频内容智能拆解为适合独立传播的短视频矩阵，使优质内容在以短小时长、碎片化观看为特点的手机端网络视听生态中实现高效传播。国际流媒体平台也正在加速布局基于AI的用户应用。Netflix与OpenAI合作推出了一项由生成式AI驱动的自然语言搜索功能，用户输入“寻找一部有时间旅行和悲伤结局的韩剧”这类日常表达后，系统即可精准推荐与之匹配的优质内容，并同时生成多语言剧情简介与宣传材料，大幅降低了影视内容的跨文化传播门槛。Netflix首席产品官Eunice Kim表示，生成式AI的引入让推荐更加个性化，以更直观、更迅速的方式响应用户需求，能够有效应对日益庞大的全球视听内容库、提升整体用户体验。

二、世界模型：视频生成迈向空间智能时代

生成式AI在视频生成任务上长期局限于二维平面。无论是基于扩散模型的Stable Video Diffusion，还是依托transformer架构的Runway Gen-2、Pika等模型，其底层逻辑都是将视频视为一连串弱关联的图像帧序列，并逐帧进行生成。这种设计忽略了视频序列在时序上的关联性，导致生成的视频经常出现手指数量突变、物体穿模、光影失真、透视畸变等明显问题。从本质上来看，这种“失真”源于生成式AI研究对三维空间结构、时间因果关系与物体持续性的认知缺失。

2025年秋，OpenAI正式推出Sora 2，将视频生成模型定位转向构建“世界模拟器”，其生成效果展现出对物理世界更深层次的理解。例如，该模型能精准模拟篮球撞击篮板后的反弹轨迹，而非直接将篮球“瞬移”入网。此外，它在跨镜头剪辑与复杂场景中也表现出较强的角色与环境视觉一致性，大幅减少穿帮镜头，并能同步生成与画面精准对齐的对白、环境音效，为创作者提供一体化的高效解决方案。

这一性能提升源于其底层模型结构的创新，即从二维帧序列处理升级为三维时空联合建模。尽管它继承了Sora 1的核心扩散模型框架，但在时序模块上实现了系统性重构，使模型在潜空间中天然具备理解三维内容的能力。第一，Sora 2的视觉编码器(Visual Encoder)摒弃了逐帧压缩方式，将整个视频片段直接压缩为一系列的时空块(Spacetime Patches)，每个时空块同时包含空间(x-y)与时序(t)信息，从输入阶段就已将物体运动、遮挡关系、运动轨迹等动态信息进行建模，并通过固有的模型架构内化为基本处理单元，大幅缓解了传统方法中“运动帧间割裂”的问题。第二，采用扩散变换器(Diffusion Transformer, DiT)取代了常见的U-Net结构，以并行方式处理整个视频帧序列，并通过强大的时序与空间自注意力机制，建模任意两个时空位置间的动态关联。模型不再仅推测运动，而是直接预测运动轨迹，从而生成符合物理规律的连贯视频。第三，Sora 2引入声画同步生成(Audio-Visual Synchronous Generation)机制，通过对视频中的声音与画面信息进行建模，强化模型对时空信息的理解预生成能力，最终输出声画同步的内容。深度赋智团队(DeepWisdom)的研究进一步发现，Sora 2在空间任务的推理能力上甚至超越了GPT-5和Gemini 2.5 Pro。在首个空间推理基准测试VR-Bench框架下，面对复杂的迷宫导航任务，GPT-5与Gemini 2.5 Pro等大语言模型的性能随迷宫难度提升呈断崖式下降，而Sora 2等视频生成模型则展现出更强的泛化能力与鲁棒性。这说明以视频生成模型为代表的生成式AI，初步具备了对物理世界客观规律的感知与理解能力，并推动人工智能技术迈向空间智能新时代。

三、AI智能体驱动内容生产与体验范式革新

随着AI技术的进一步发展与普及，人们不再满足于一个仅能响应指令的被动系统，而是期待一种能够像人类一样理解目标、规划行动、自主决策并持续进化的智能实体，这催生了AI智能体(AI Agent)的崛起。这种具备自主性、感知能力和决策能力的系统,可根据目标任务和环境状态选择适当的响应策略，并持续学习优化自身表现。在影视领域，智能体正从幕后走向台前，引领行业迈向人机协同的新阶段。

(一)创作侧：制片智能体成为影视生产的“赛博工友”

影视作品生产周期长、部门繁多、参与人员庞杂，长期面临创意统一性与执行协同性的双重挑战。如今，AI智能体正以低延迟响应与拟人化交互的助手身份，扮演连接创意与执行的“赛博工友”，显著提升了制作效率与流程稳定性。

《流浪地球3》剧组引入了基于DeepSeek-R1大模型、NVIDIA算力与火山引擎构建的专属智能体WEi。该智能体内嵌了《流浪地球》系列的全部剧本、世界观设定、视觉设定与编年史等资料，并赋予其类似“Moss”的人格化特征，服务于“创意—执行—校验”的创作全流程。剧组人员可随时查询设定细节，WEi还能初步判断新输入内容是否符合原有设定，有效弥合了创意层与执行层的信息差。这种“副驾驶”(Copilot)式的人机协同模式，显著提升了高复杂度项目的制作可控性。展望未来，影视智能体将向专业化与协同化两个方向并行发展。一方面，单个智能体将在剧作、分镜、美术等细分环节发展出更强的自主决策与行动能力；另一方面，多个专业智能体可组成高效联动的多智能体系统：导演Agent统筹叙事节奏，摄影Agent调节光影情绪，美术Agent实时预演视觉概念，形成一个可协同、可对话、可进化的“数字制片组”。在这一机制之下，人类创作者得以从重复性劳动中解放出来，专注于高阶创意表达，推动影视生产逻辑加速向智能制作范式转型。

(二)体验侧：角色智能体催生IP人格化新生态

在消费端，智能体技术正在将影视IP从单向传播的被动凝视对象，转变为可互动、可对话的数字生命体，深刻改变了受众与内容之间的关系。以腾讯元宝为代表的对话平台，依托大语言模型、多模态生成技术与智能体框架，实现了对IP角色的人格化数字重建。腾讯元宝为《长相思2》(2024)打造的“AI相柳”智能体，互动热度突破亿次。观众通过与之对话，得以更深入理解角色内心世界，从而增强对剧情的情感投入与共鸣。媒介研究学者亨利•詹金斯将此类积极介入文本意义建构的受众称为“文本盗猎者”，而对话型智能体为这种“盗猎”行为提供了新的技术接口。用户不再仅在想象中参与故事，而是通过与角色AI的真实互动建立情感联结，成为叙事的实际参与者。这不仅显著延长了影视IP的生命周期，而且，其产生的海量交互数据还能转化为反哺剧本开发与角色塑造的数据资产，推动影视创作从经验驱动迈向数智协同的新模式。

腾讯元宝《长相思第二季》AI角色对话板块(来源：“腾讯混元”微信公号)

当然，智能体驱动的体验转型在创造新机遇的同时，也带来了新挑战。一方面，角色对话数据与用户二创内容的版权归属仍处于法律模糊地带；另一方面，高度拟人化的角色AI可能诱发用户的过度情感依赖，带来不可忽视的伦理风险。因此，亟须通过政策引导与制度建设，加强对生成内容、用户数据及信息安全的有效监管，在技术创新与人文伦理之间寻求可持续发展的平衡。

四、面向数智时代的影视产业未来图景

(一)未来创作中人机如何协同？

在生成式AI深度介入影视工业的当下，“人机协同”已从理论设想转化为既定的生产事实。技术的不断演进将呈现三种阶梯式的人机协作关系：在“嵌入”(Embedding)模式中，AI仅作为特定环节的辅助工具，人类仍主导从决策到执行的整个流程；在“副驾驶”(Copilot)模式中，人机共同参与全流程，AI以知识伙伴的身份深度介入创作的各阶段，与人类形成持续对话、动态反馈的协同关系；而“智能体”(Agent)模式中，AI已具备自主执行能力。人类仅需用自然语言描述模糊目标并提供必要资源，AI便可自主规划、决策、调用工具并完成任务，人类干预降至最低，仅在关键节点作出必要选择或价值判断。这三种模式并非彼此取代，而是根据项目复杂度、创意需求与技术成熟度，在实践中动态组合、协同演进。

审视当前的影视创作生态，行业整体处于“嵌入”模式与“副驾驶”模式的混合过渡阶段。AI或深度介入视效、剪辑等具体环节，以优化流程与提升生成质量，或以智能助手身份协助构建专属知识库，辅助创意决策，人类创作者依然占据主导位置。而未来的技术演进指针正不可逆转地指向“智能体”模式。正如《流浪地球3》片场的“赛博工友”WEi所预示的那样，新一代智能体不再是被动响应指令的工具，而是正在成为具备“感知—决策—行动”闭环的独立行动者。在智能体模式主导的未来影视生产中，人类创作者将回归创意主体身份，从具体技艺的操持者，转型为统领全局的导演或策展人，其能力将聚焦于情感节奏的把控与艺术语言的塑造。关键在于，创作者要能够精准运用自然语言指令界定生成边界，并在算法涌现的海量可能性中，作出审美裁决与价值引导，这将成为未来影视创作者的核心素养。

(二)当前视频生成效果能否满足大银幕要求？

在移动互联网主导的网络视听生态中，短视频与流媒体内容对影像精细度具有较高宽容度，为AI生成内容(AIGC)的快速渗透与规模化应用提供了土壤。除前文所述的AI漫剧迅速升温，AI广告正在成为重要的应用方向。Meta推出的AI视频生成工具Vibes已被约200万广告主采用，自推出以来平台媒体生成量增长超10倍。显然，低成本、高效率、强引流的轻量级AIGC内容，已成为短视频体量增长的关键引擎。然而，一旦将AIGC置于传统电影美学所依托的大银幕语境之中，其在视觉质感与技术规格层面仍面临着显著挑战。在黑暗观影环境中，大银幕对光影层次、角色微表情、镜头运动等细节的极致呈现要求，构成了当前“AI生成电影”仍难以突破的美学与技术壁垒。

在影像本体层面，AIGC与实拍或三维渲染结果仍存在明显差距。人物的皮肤纹理与微表情常常被过度平滑处理，呈现一种超真实的完美状态，却失去了粗粝、多样且富有生命力的肌理感。在技术质素层面，尽管静态图像生成可达2K分辨率，但动态视频生成仍局限于原生1080p水平。虽然可以通过超分辨率技术进行后期增强，但此类方法在小屏幕上尚可接受，一旦投射至大银幕，边缘伪影、时序闪烁与细节失真等问题便极易暴露，严重影响观影沉浸感。更为关键的是，当前主流生成式AI模型多基于sRGB色彩空间进行训练与推理，普遍缺乏色域、对数曲线等色彩科学底层逻辑的支持，难以无缝融入现有的电影制作体系。

在空间计算时代的“空间在场”与“虚实交互”的新语境下，尽管以3D/4D高斯泼溅为代表的新型显式渲染技术具备高保真与实时渲染的潜力，但当用户通过头显进入虚拟场景并近距离观察对象时，人眼对几何细节、材质真实感与运动连贯性的敏感度急剧提升。但场景复杂度与精细度的增加又会引发数据规模的指数级膨胀，导致训练与渲染效率下降、存储开销剧增，并难以维持低延迟交互，从而诱发感知断裂甚至晕动症。而引入了时间维度的4D高斯泼溅技术虽然在再现动态表演上有所推进，却进一步限制了拍摄条件与表演自由度。要实现高保真、低延迟、强交互的虚实融合体验，仍需在动态建模效率、近场渲染精度及创作方法适配等关键点取得系统性突破。

(三)AI生成内容有情感基础吗？

依托于情感计算、情感临摹、情感交互与情感适应等技术机制，智能体可以复现角色的人格特质、语言风格与情感偏好，并主动调用用户的过往对话记录或剧情关键点，构建看似连贯且高度个性化的情感互动。部分用户还在具有具体形态的智能体提示词中嵌入动作、情绪状态等细节描述，进一步调校AI的行为表现，以使其贴近自身的情感期待与叙事想象，从而加强情感沉浸。

然而，这种看似细腻的情感回应，本质上却是一种无主体的符号展演。按照让•鲍德里亚的拟像理论，AI表现出的情感进入第三序列的“拟真”阶段，其通过算法对人类情感的外显特征进行高保真复制与重组，创造出一种“比真实还真实”的情感幻觉。但这种“拟真情感”剥离了真实情感产生的历史性、具身性与主体间性。艺术之所以动人，恰恰源于创作者独特的生命体验、生理痛楚以及对存在境遇的深刻反思。AI或许能模仿梵高的笔触、复现肖邦的旋律，但它从未真正痛过、爱过。那些在深夜辗转反侧中淬炼出的语句，或是在创伤与疗愈之间挣扎而凝结的影像，皆承载着不可替代的肉身印记与时间厚度。这种碳基生命独有的在场性，或许是硅基智能无法习得的“灵魂”所在。但若受众长期将这种超真实情感误认为真实存在，人类自身感知复杂、幽微乃至晦涩情感的能力可能面临钝化的风险。未来的影视艺术应警惕这种技术性的情感代餐，坚守艺术作为人类精神交流媒介的底线。在这个意义上，AI虽能无限逼近情感表达的图灵测试，却始终无法替代那份源自血肉之躯的真诚与悸动。

结语

AI技术正以前所未有的深度与广度重构影视产业的创作范式、生产流程与用户体验。然而，在技术加速演进的同时，亦需警惕其可能引发的美学稀释、伦理模糊与情感困境等深层挑战。面向人机高度协同共进的大视听时代，亟须确立一种“人本智能”(Human-Centric AI)的发展理念，即以创作者为意义中枢，以AI为能力延伸，以伦理为边界约束，以艺术为终极旨归，在技术狂潮中守护艺术的人文内核，在人机共生中开启影视创作的新纪元。

*本文系2025年度国家社科基金艺术学重大项目“网络视听壮大主流价值与文化强国建设”（项目批准号：25ZD07）的阶段性成果。

*为方便电子阅读，已略去原文注释，如需完整版本，请查阅纸刊。

作者：周雯单位：北京师范大学艺术与传媒学院

《中国文艺评论》2026年第3期（总第126期）

责任编辑：艾超南

☆本刊所发文章的稿酬和数字化著作权使用费已由中国文联文艺评论中心给付。新媒体转载《中国文艺评论》杂志文章电子版及“中国文艺评论”微信公众号所选载文章，需经允许。获得合法授权的，应在授权范围内使用，为作者署名并清晰注明来源《中国文艺评论》及期数。（点击取得书面授权）

《中国文艺评论》论文投稿邮箱：zgwlplzx@126.com。

延伸阅读：

周雯 | AI驱动下的2025影视工业体系革新与未来图景（“中国文艺评论”微信公号）

欢迎订阅2026年《中国文艺评论》杂志

《中国文艺评论》来稿须知

《中国文艺评论》杂志2026年度重点选题参考