AI分镜生成是把故事拆分成一系列静态画面(像漫画分格),然后用AI工具生成图像,再组装成视频的过程。这在短视频制作中特别流行,尤其适合抖音、B站、小红书上的“AI漫画”“动态漫”“故事动画”内容。整个流程高度AI化,2026年主流工具已经能实现角色一致性、自动动画补帧,适合新手操作。适用场景:故事有清晰情节、需要视觉化(如穿越、悬疑、言情)。如果故事太长,建议先浓缩成1-3分钟视频脚本(约500-1500字)。所需准备:
- 一个故事脚本(文本格式)。
- 电脑/手机(推荐电脑操作更精确)。
- 工具账号:Midjourney(Discord)、通义万相(阿里云)、可灵AI(字节系)、Claude/GPT(免费或订阅)、剪映专业版(免费)。
- 预算:免费起步,高级功能订阅几十元/月。
- 时间:新手4-12小时/视频,熟练后2-4小时。
下面是详细步骤教程,按顺序操作。我会标注每个步骤的工具选项、提示词模板和常见坑点。假设你做1分钟短视频(15-30个分镜)。步骤1:用AI拆分故事成分镜脚本(30分钟-1小时)目标:把故事分解成“分镜描述 + 台词 + 镜头类型”,像电影 storyboard 一样。每个分镜控制在5-10秒视频时长。推荐工具:
- Claude 3.5 Sonnet / GPT-4o / 通义千问 / DeepSeek(免费/订阅)。这些大模型擅长结构化输出。
- 为什么AI?手动拆分太累,AI能自动生成逻辑流畅的分镜。
操作流程:
- 打开工具(如Claude.ai或ChatGPT)。
- 输入提示词(Prompt),替换[故事]为你的内容。 提示词模板(复制粘贴用)此内容查看价格为9.9XD立即购买
示例输出(假设故事是“女孩穿越古代”)
|
分镜
|
画面描述
|
台词/旁白
|
镜头时长
|
风格
|
|---|---|---|---|---|
|
1
|
现代城市街头,女孩匆忙走路,背景高楼林立,广角镜头
|
“今天又加班到晚…
|
5秒
|
写实
|
|
2
|
女孩突然跌入漩涡,光芒闪烁,特写惊讶表情
|
“啊!这是哪里?
|
3秒
|
写实
|
检查输出:确保分镜总数合适(太少画面单调,太多视频冗长)。如果角色不一致,添加提示如“所有角色保持相同外貌:女主黑长直头发,蓝眼睛”。
常见坑点:
- 故事太抽象?加提示“添加更多视觉细节,如颜色、表情、光影”。
- AI输出乱?指定“严格用表格格式,无多余文字”。
步骤2:用AI生成每个分镜的图像(1-4小时)目标:基于分镜描述,生成高一致性图片。2026年AI已支持“角色一致性”(same character across frames)。推荐工具(从易到难排序):
- 通义万相 / 可灵图像 / 海螺AI(免费/订阅,中文友好,支持角色锁定)。
- Midjourney v6.1 / Flux.1(Discord操作,高端,需VPN)。
- Stable Diffusion WebUI(本地安装,免费但需电脑配置)。
操作流程:
- 选择工具:
- 新手首选:通义万相(阿里云app/web),直接上传参考图锁定角色。
- 高端:Midjourney,在Discord输入 /imagine。
- 为每个分镜生成图像:
- 先生成“角色参考图”:用提示生成主角形象,保存为种子(seed)。 角色提示模板:
一个[年龄]岁的[性别],[外貌描述,如长黑发、蓝眼睛、穿着古装],正面特写,[风格,如迪士尼动画风],高分辨率,细节丰富。
- 示例: “一个20岁女孩,长黑发蓝眼睛,穿着现代T恤,写实风格,高清。”
- 然后逐个分镜生成: 分镜提示模板(关键是加一致性参数):
[画面描述],角色一致性:[描述主角,如长黑发女孩在中心],背景:[详细背景],镜头:[特写/广角],风格:[动画/写实],高分辨率,9:16竖屏比例,--ar 9:16 --v 6.1 --seed [参考图种子号]。
-
- 示例(Midjourney): “现代城市街头,女孩匆忙走路,高楼背景,广角镜头,角色:长黑发蓝眼睛女孩,写实风格,–ar 9:16 –v 6.1”。
- 批量生成:
- 通义万相:批量上传分镜描述,一键生成。
- Midjourney:用 /imagine 循环生成, upscale (U1-U4) 选最佳。
- 生成20-30张,确保分辨率至少1080×1920(竖屏)。
常见坑点:
- 角色变脸?用“–cref [参考图URL]”或工具的“形象锁定”功能。
- 图像模糊?加“高细节,8k分辨率,锐利”。
- 免费限额?分批生成,或升级订阅(Midjourney基本版每月10美元)。
步骤3:添加动画效果和配音(1-2小时)目标:让静态分镜“动起来”,加声音。推荐工具:
- 可灵AI / Runway Gen-3 / Pika Labs(文生视频或图生视频)。
- 剪映专业版 / CapCut / VN(手机/电脑免费)。
操作流程:
- 简单动画:
- 用可灵/Runway:上传静态图,选择“图生视频”,设置“轻微动作,如表情变化、背景流动”,生成3-5秒小视频片段。 提示模板: “基于此图,添加轻柔动画:女孩眨眼,风吹头发,镜头缓慢推进。”
- 配音:
- 剪映 → “文本朗读”或“AI配音”:粘贴台词,选择声线(女声/男声/情感化)。
- 高级:HeyGen / ElevenLabs 克隆真人声音(订阅)。
- 避免全静态:至少50%分镜加动画,增强节奏。
常见坑点:
- 动画鬼畜?用低强度设置,或手动在剪映加Ken Burns效果(图片缩放)。
步骤4:剪辑组装成视频(1-2小时)目标:把图像/小视频拼接成完整短视频。推荐工具:剪映专业版(一站式,最简单)。操作流程:
- 新建项目(9:16竖屏)。
- 导入所有分镜图像/视频,按顺序排列。
- 加效果:
- 转场:淡入淡出、滑动(每5-10秒一个)。
- 字幕:自动生成或手动加(大字体,底部显示台词)。
- BGM:搜索“悬疑背景音乐”或用AI生成(剪映内置)。
- 特效:加粒子、光效增强氛围。
- 调整时长:总1-3分钟,节奏快(高潮部分加速)。
- 导出:1080p,添加水印/标签(如#AI故事#分镜动画)。
常见坑点:
- 视频卡顿?压缩图像大小,或用云渲染。
- 版权?用免费BGM库,避免商用音乐。
进阶技巧
- 角色一致性提升:用Luma AI的“Dream Machine”生成整段视频,直接从分镜脚本一键出片(但成本高,订阅100元/月)。
- 自动化全流程:白日梦AI / Kling AI 支持“故事文本 → 分镜 → 视频”一键,但质量需手动精修。
- 测试优化:先做5个分镜小样,上传抖音看反馈(点赞/完播率),再全做。
- 变现:这类视频在小红书“AI生成”话题下容易爆,结合推文赚钱。
阅读全文
