分享一下我平时的剪辑工作流

昨天这个时候在剪新视频时，忽然意识到好像无意间形成了一套高效的工作流，于是今天梳理记录下来。

（应该算工作流吧？虽然因为内容创作的独特性，不像其他领域的工作流可以高度自动化或完全复用，不过我觉得已经做到我能实现的最优路径了，至少这套路径是完全可复用的）

之前很多作品都在慢慢摸索，最近两个视频感觉这套方法比较成熟了。视频贴在下面了：

第一个是昨天剪的，自己账号的视频。从零开始规划，素材按需准备，几乎不会浪费，也不需要花时间粗剪。

第二个是参加的社区同人创作，素材由主办方从其他老师那里转交给我，需要按要求剪辑。这类项目常会遇到素材冗余或缺失镜头需要补拍的情况。

两者差别挺大，这里先说第一个。

第一个#

我的账号主要做《我的世界》网易基岩版的干货类视频。这套工作流对我而言已经相当成熟，当然其中融入了不少个人习惯，可能不一定适合你，仅供参考。

我的习惯大致是这样的：

先确认选题，然后规划一个模糊的内容时间线。接着按照这个时间线去录制和准备素材。在准备过程中，因为画面逐渐具体，时间线也会随之细化。等素材准备完毕，脑海里基本已经形成视频的模糊框架。

接下来让框架中的几个关键节点变得更清晰，比如开头、两部分之间的过渡等等。这几个节点定下来后通常不会再大幅修改。之后找音乐，我习惯根据音乐来规划视频的整体节奏和情绪基调。如果先剪再找音乐，往往会感觉节奏对不上。

然后在剪映中开始剪辑，先把开头和关键节点搭建起来。这个过程有点像盖楼房，先扎好钢筋框架，再把水泥板放上去。之后往这些节点之间填充其他素材，同时加入字幕、口播等内容，相当于往缝隙里灌水泥。

最后整体回看，处理细节，比如调整节奏、补充音效来强化情绪等。

结合这些习惯，我的工作流大致如下：

确认选题
粗略规划时间线框架
时间线是主线任务，后续每个环节都会对它进行微调。如果思路卡住，可以把已规划的内容和预期目标交给 AI 辅助梳理。
按框架准备素材
主要是视频画面素材，核心就一条：多备少补，比如录素材，能想到的、想不到怎么用但是感觉有用的，都录上，做好分类和标注即可，避免后期再去补录降低效率。其他资源通常在剪辑过程中发现需求再补充。
找音乐，规划节奏与情绪基调
我平时会留意听到的音乐，如果感觉未来可能用上就存到本地，文件名包含演奏者、歌名和来源平台，方便后续使用时追溯版权。
在剪映中搭建关键节点
包括开头和几个核心段落，形成视频骨架。

具体节点怎么找其实全凭感觉，一般都是某个转折点。不同主题不同素材不同剧本不同人不同剪辑习惯，不可能说整理出一套通用的规律。
填充中间内容，同步规划口播
从头往后推进，在节点之间填入素材，同时构思口播文稿，并使用 GPT-SoVITS 生成音频。
我用 GPT-SoVITS 比较早，24年中就开始用了，当时人声克隆领域选择很少，大厂方案限制多，基本只能克隆自己的声音，小厂限制少点但是收费太贵。GPT-SoVITS 作为当时少有的自由方案，可以说是不得不选了它，这个习惯就延续了下来。如今大厂入局后，效果有巨幅提升，对于小项目足可以称得上是降维打击。我还没尝试过大厂的新模型，有空会去体验一下，说不定更适合现在的创作需求。
关于自动化，我曾想过把口播生成环节接入自动化，但考虑到口播经常需要反复调整抽卡，自动化反而可能增加操作负担，加上我自己技术力有限，最终还是用 WebUI 手动操作更顺手。倒是用 ai 写了个小脚本，能自动把下载目录里的 audio.wav 移动到当前视频项目的素材文件夹，省去手动整理的麻烦，如果你也有需要，点击此处下载。
复杂特效和转场用 AE 处理
如果遇到剪映难以实现的效果，就进 AE 制作，完成后导出再回到剪映继续剪辑。剪映加 AE 的协作已经能满足我的全部需求，暂时没打算学其他软件——有这时间，可能已经多剪出十几个视频了。
封面制作（PS）
为适配不同平台，我会制作三种比例的封面：16:9、9:16、4:3。实际内容一致，只需做一份，复制图层后调整构图位置即可生成三版。另外，如果你不知道怎么制定视频情绪和节奏，可以试试先做封面。
发布
浏览器里专门建了个收藏夹存放各平台发布页，鼠标中键点击可批量打开。依次上传视频但暂不发布，填好标题和简介后逐个复制粘贴，最后统一发布。建议设置定时发布，因为平台推流算法通常会参考发布前两小时的数据表现。将发布时间设在目标观众活跃高峰前一小时，理论上能获得更好的初始推荐（平台算法不公开，这只是基于经验的推测，仅供参考）。

之前用过蚁小二，登录 cookie 和 IP 都是在本地，一直认为只是个 UI 包装了的自动化脚本，我起初并没有担心什么。但是后来被爆出各种滥用行为还有封号之类的，我没验证也没敢去赌，想着反正就3个平台自己手填也累不着，于是就现在这样了。

以最近剪的“灵魂出窍”视频为例，对照上面的流程应该更容易理解：

看到幽灵水相关视频后，想起老版灵魂出窍机制其实并未被修复，只是之前的幽灵水方法失效了。验证后发现新方法依然可行，于是决定做这期教程。

视频开头用一个噱头吸引观众停留，接着用转场过渡到教程主体，通过模仿其他高质视频的转场利用技术力留住重视观感的用户，后面教程部分重点在教程，不再使用复杂转场(高情商：不仅能提升观感和教程清晰度，还能降低剪辑成本；低情商：我懒awa)，整体时长控制在一分半左右。

素材其实在验证这个特性时就顺手录好了，省去了专门录制的步骤。

音乐方面，我习惯用 MIDI 转成音符盒演奏。之前闲暇时已经积累了一批曲子，这次直接选了情绪匹配的《The Toys R’ Rag - Cameron Lee Simpson》（MIDI 资源网搜索引擎上搜就有，转音符盒的教程 B 站很多，我用的是这个：https://noteblock.studio/ ）。

转场参考了经典的活塞遮挡蒙版边缘效果，上下画面各占一半。原本想用绿蓝双色幕布实现色度抠像以便复用，都做完了才发现同一段视频无法同时抠两种颜色，最后改用纯绿幕。其实要做纯绿幕剪映就能处理，无非就是俩 Y 轴的关键帧，也就是说整个视频完全可以在剪映内独立完成。想着既然这个合成已经做了，就别浪费qwq（如果你对剪映的能力不太了解，可以看看成片效果，至少换做一年多前的我会不可置信。其实核心就是之前不知道剪映也有关键帧曲线，而且很多效果在特效分类里就有，类似 AE 的效果和预设，不过非常“轻量化”而已，像暗角、模糊、不同方向的模糊等都能在这里面找到）
像这种转场镜头，专门用绿幕做，就是考虑到未来复用，可以算是一种剪辑中的模块化。

点击播放，右键下载

口播采用边剪边想的方式，想好一段就去 GPT-SoVITS 生成，下载后脚本自动归位到素材目录。这类简单教程对口播要求不高，边剪边想问题不大，反而效率更高。但如果是需要情绪铺垫或有完整剧本的视频，这种方法就不适用了。

最后回看调整了好几轮，主要处理排版细节、音效补充，以及修正因边剪边想导致的口播不连贯问题。抛开前期测试验证，纯剪辑耗时不到三小时。如果能克制一点强迫症和完美主义，效率还能进一步提升。

封面制作主要看个人审美，注意安全区即可。值得一提的是 MC 风格的 3D 字体，可以在这个网站直接生成（小舟工具箱的创作工具分类也收录了它）。还有一点值得注意，很多人生成的字糊成一团，其实是字体问题，推荐使用“锐字太空历险像素简-闪”。

第二个#

这是一个社区同人创作项目，主办方转交的素材只有两份作品的制作过程延时摄影，加上各自的成品图各一张，总时长三分钟多。唯一明确的要求是成品控制在两分钟内。

刚收到素材时有点懵——除了时长限制，几乎没有其他具体预期。素材量少且类型单一，让我一时不知从何下手。不过以往积累的经验帮了忙，我决定还是用老办法：先找音乐再剪。

考虑到素材比较简单，需要靠特效和转场来丰富画面表现。而且两分钟的时长不算长，我的两根 16GB 金条应该能撑住，索性直接全程在 AE 里制作。

跟着音乐节奏粗剪了一遍，刻意让明显的画面切换点落在音乐的重节拍上。接下来遇到难点：成品图是深红色调，如果直接大面积铺在画面上容易产生中式恐怖的观感，该怎么自然地融入视频？

我觉得单靠现有素材很难完美解决，于是及时和主办方沟通，询问能否补充两个镜头：让成品从画面外推入中心，用运镜过渡来弱化突兀感。回复补了几张带阳光的图片，色彩丰富多了，运镜处理的空间也大了不少，我就没再要求前面那个镜头（其实现在想想其实还是有最好😫）

但新问题又来了：初版粗剪已经固定了两段延时摄影之间的时长，留给图片展示的时间非常有限。而第二段延时摄影的位置我并不想调整——它正好卡在音乐的大节奏变化点上，挪动意味着要重新对节拍粗剪，工作量不小。

卡壳的时候，我习惯性去刷李华的视频找灵感。翻到几个月前的一个作品时突然开窍：何必做轮播切换？把多张图片铺在同一平面上，用聚焦运镜依次突出不同区域，时间利用率更高，视觉效果也更连贯。

成片发给主办后，我原本以为会收到几条修改意见，甚至提前想好了调整方案。没想到直接回复”发审核群里了，如果没什么问题就定稿了”。和最初收到素材时一样，我又懵了一下。

总结下来，这类外部项目的剪辑流程可以归纳为：

初步筛选素材，同步构思框架
这个项目素材有限，筛选环节基本跳过。但遇到素材缺失时一定要尽早沟通，越早提出补拍需求，调整空间越大；即使无法补拍，也能及时规划替代方案。
找音乐确立节奏基调
依然是先找音乐的老套路，用音乐的节奏辅助搭建视频骨架，后续剪辑会更顺畅。
粗剪并完善详细框架
跟着音乐节拍粗剪，同时注意”模块化”处理——把可能需要调整的部分做成独立模块(预合成)，减少后续修改的工作量。
细化处理
和第一个视频的细化环节类似，这里就不再赘述。

结尾#

回头看这两套流程，虽然面对的素材类型和创作目标完全不同，但底层逻辑其实是一致的：先建立框架，再填充内容，过程中保持灵活调整。第一个视频因为完全自主可控，可以做到素材零浪费；第二个视频面对有限素材，反而逼出了更多创意解法。

工作流的价值不在于追求绝对的标准化和自动化，而在于让重复性操作变得可预期，把认知资源留给真正需要创造力的部分。对我而言，这套方法已经能支撑稳定产出，同时保留足够的弹性应对不同项目的需求。往往最顺手的那套，才是真正合适且高效的工作流。

一叶舟・记

第一个#

第二个#

结尾#