昨天这个时候在剪新视频时,忽然意识到好像无意间形成了一套高效的工作流,于是今天梳理记录下来。
(应该算工作流吧?虽然因为内容创作的独特性,不像其他领域的工作流可以高度自动化或完全复用,不过我觉得已经做到我能实现的最优路径了,至少这套路径是完全可复用的)
之前很多作品都在慢慢摸索,最近两个视频感觉这套方法比较成熟了。视频贴在下面了:
第一个是昨天剪的,自己账号的视频。从零开始规划,素材按需准备,几乎不会浪费,也不需要花时间粗剪。
第二个是参加的社区同人创作,素材由主办方从其他老师那里转交给我,需要按要求剪辑。这类项目常会遇到素材冗余或缺失镜头需要补拍的情况。
两者差别挺大,这里先说第一个。
第一个
我的账号主要做《我的世界》网易基岩版的干货类视频。这套工作流对我而言已经相当成熟,当然其中融入了不少个人习惯,可能不一定适合你,仅供参考。
我的习惯大致是这样的:
先确认选题,然后规划一个模糊的内容时间线。接着按照这个时间线去录制和准备素材。在准备过程中,因为画面逐渐具体,时间线也会随之细化。等素材准备完毕,脑海里基本已经形成视频的模糊框架。
接下来让框架中的几个关键节点变得更清晰,比如开头、两部分之间的过渡等等。这几个节点定下来后通常不会再大幅修改。之后找音乐,我习惯根据音乐来规划视频的整体节奏和情绪基调。如果先剪再找音乐,往往会感觉节奏对不上。
然后在剪映中开始剪辑,先把开头和关键节点搭建起来。这个过程有点像盖楼房,先扎好钢筋框架,再把水泥板放上去。之后往这些节点之间填充其他素材,同时加入字幕、口播等内容,相当于往缝隙里灌水泥。
最后整体回看,处理细节,比如调整节奏、补充音效来强化情绪等。
结合这些习惯,我的工作流大致如下:
-
确认选题
-
粗略规划时间线框架
时间线是主线任务,后续每个环节都会对它进行微调。如果思路卡住,可以把已规划的内容和预期目标交给 AI 辅助梳理。 -
按框架准备素材
主要是视频画面素材,核心就一条:多备少补,比如录素材,能想到的、想不到怎么用但是感觉有用的,都录上,做好分类和标注即可,避免后期再去补录降低效率。其他资源通常在剪辑过程中发现需求再补充。 -
找音乐,规划节奏与情绪基调
我平时会留意听到的音乐,如果感觉未来可能用上就存到本地,文件名包含演奏者、歌名和来源平台,方便后续使用时追溯版权。 -
在剪映中搭建关键节点
包括开头和几个核心段落,形成视频骨架。具体节点怎么找其实全凭感觉,一般都是某个转折点。不同主题不同素材不同剧本不同人不同剪辑习惯,不可能说整理出一套通用的规律。
-
填充中间内容,同步规划口播
从头往后推进,在节点之间填入素材,同时构思口播文稿,并使用 GPT-SoVITS 生成音频。
我用 GPT-SoVITS 比较早,24年中就开始用了,当时人声克隆领域选择很少,大厂方案限制多,基本只能克隆自己的声音,小厂限制少点但是收费太贵。GPT-SoVITS 作为当时少有的自由方案,可以说是不得不选了它,这个习惯就延续了下来。如今大厂入局后,效果有巨幅提升,对于小项目足可以称得上是降维打击。我还没尝试过大厂的新模型,有空会去体验一下,说不定更适合现在的创作需求。
关于自动化,我曾想过把口播生成环节接入自动化,但考虑到口播经常需要反复调整重试,自动化反而可能增加操作负担,加上我自己技术力有限,最终还是用 WebUI 手动操作更顺手。倒是写了个小脚本,能自动把下载目录里的audio.wav移动到当前视频项目的素材文件夹,省去手动整理的麻烦,如果你也有需要,点击此处下载。 -
复杂特效和转场用 AE 处理
如果遇到剪映难以实现的效果,就进 AE 制作,完成后导出再回到剪映继续剪辑。剪映加 AE 的协作已经能满足我的全部需求,暂时没打算学其他软件——有这时间,可能已经多剪出十几个视频了。 -
封面制作(PS)
为适配不同平台,我会制作三种比例的封面:16:9、9:16、4:3。实际内容一致,只需做一份,复制图层后调整构图位置即可生成三版。另外,如果你不知道怎么制定视频情绪和节奏,可以试试先做封面。 -
发布
浏览器里专门建了个收藏夹存放各平台发布页,鼠标中键点击可批量打开。依次上传视频但暂不发布,填好标题和简介后逐个复制粘贴,最后统一发布。建议设置定时发布,因为平台推流算法通常会参考发布前两小时的数据表现。将发布时间设在目标观众活跃高峰前一小时,理论上能获得更好的初始推荐(平台算法不公开,这只是基于经验的推测,仅供参考)。之前用过蚁小二,登录 cookie 和 IP 都是在本地,一直认为只是个 UI 包装了的自动化脚本,我起初并没有担心什么。但是后来被爆出各种滥用行为还有封号之类的,我没验证也没敢去赌,想着反正就3个平台自己手填也累不着,于是就现在这样了。
以最近剪的“灵魂出窍”视频为例,对照上面的流程应该更容易理解:
看到幽灵水相关视频后,想起老版灵魂出窍机制其实并未被修复,只是之前的幽灵水方法失效了。验证后发现新方法依然可行,于是决定做这期教程。
视频开头用一个噱头吸引观众停留,接着用转场过渡到教程主体,通过模仿其他高质视频的转场利用技术力留住重视观感的用户,后面教程部分重点在教程,不再使用复杂转场
素材其实在验证这个特性时就顺手录好了,省去了专门录制的步骤。
音乐方面,我习惯用 MIDI 转成音符盒演奏。之前闲暇时已经积累了一批曲子,这次直接选了情绪匹配的《The Toys R’ Rag - Cameron Lee Simpson》(MIDI 资源网搜索引擎上搜就有,转音符盒的教程 B 站很多,我用的是这个:https://noteblock.studio/ )。
转场参考了经典的活塞遮挡蒙版边缘效果,上下画面各占一半。原本想用绿蓝双色幕布实现色度抠像以便复用,都做完了才发现同一段视频无法同时抠两种颜色,最后改用纯绿幕。其实要做纯绿幕剪映就能处理,无非就是俩 Y 轴的关键帧,也就是说整个视频完全可以在剪映内独立完成。想着既然这个合成已经做了,就别浪费qwq(如果你对剪映的能力不太了解,可以看看成片效果,至少换做一年多前的我会不可置信。其实核心就是之前不知道剪映也有关键帧曲线,而且很多效果在特效分类里就有,类似 AE 的效果和预设,不过非常“轻量化”而已,像暗角、模糊、不同方向的模糊等都能在这里面找到)
像这种转场镜头,专门用绿幕做,就是考虑到未来复用,可以算是一种剪辑中的模块化。
口播采用边剪边想的方式,想好一段就去 GPT-SoVITS 生成,下载后脚本自动归位到素材目录。这类简单教程对口播要求不高,边剪边想问题不大,反而效率更高。但如果是需要情绪铺垫或有完整剧本的视频,这种方法就不适用了。
最后回看调整了好几轮,主要处理排版细节、音效补充,以及修正因边剪边想导致的口播不连贯问题。抛开前期测试验证,纯剪辑耗时不到三小时。如果能克制一点强迫症和完美主义,效率还能进一步提升。
封面制作主要看个人审美,注意安全区即可。值得一提的是 MC 风格的 3D 字体,可以在 这个网站 直接生成(小舟工具箱的创作工具分类也收录了它)。还有一点值得注意,很多人生成的字糊成一团,其实是字体问题,推荐使用“锐字太空历险像素简-闪”。
第二个
这是一个社区同人创作项目,主办方转交的素材只有两份作品的制作过程延时摄影,加上各自的成品图各一张,总时长三分钟多。唯一明确的要求是成品控制在两分钟内。
刚收到素材时有点懵——除了时长限制,几乎没有其他具体预期。素材量少且类型单一,让我一时不知从何下手。不过以往积累的经验帮了忙,我决定还是用老办法:先找音乐再剪。
考虑到素材比较简单,需要靠特效和转场来丰富画面表现。而且两分钟的时长不算长,我的两根 16GB 金条应该能撑住,索性直接全程在 AE 里制作。
跟着音乐节奏粗剪了一遍,刻意让明显的画面切换点落在音乐的重节拍上。接下来遇到难点:成品图是深红色调,如果直接大面积铺在画面上容易产生中式恐怖的观感,该怎么自然地融入视频?
我觉得单靠现有素材很难完美解决,于是及时和主办方沟通,询问能否补充两个镜头:让成品从画面外推入中心,用运镜过渡来弱化突兀感。回复补了几张带阳光的图片,色彩丰富多了,运镜处理的空间也大了不少,我就没再要求前面那个镜头(其实现在想想其实还是有最好😫)
但新问题又来了:初版粗剪已经固定了两段延时摄影之间的时长,留给图片展示的时间非常有限。而第二段延时摄影的位置我并不想调整——它正好卡在音乐的大节奏变化点上,挪动意味着要重新对节拍粗剪,工作量不小。
卡壳的时候,我习惯性去刷李华的视频找灵感。翻到几个月前的一个作品时突然开窍:何必做轮播切换?把多张图片铺在同一平面上,用聚焦运镜依次突出不同区域,时间利用率更高,视觉效果也更连贯。
成片发给主办后,我原本以为会收到几条修改意见,甚至提前想好了调整方案。没想到直接回复”发审核群里了,如果没什么问题就定稿了”。和最初收到素材时一样,我又懵了一下。


总结下来,这类外部项目的剪辑流程可以归纳为:
-
初步筛选素材,同步构思框架
这个项目素材有限,筛选环节基本跳过。但遇到素材缺失时一定要尽早沟通,越早提出补拍需求,调整空间越大;即使无法补拍,也能及时规划替代方案。 -
找音乐确立节奏基调
依然是先找音乐的老套路,用音乐的节奏辅助搭建视频骨架,后续剪辑会更顺畅。 -
粗剪并完善详细框架
跟着音乐节拍粗剪,同时注意”模块化”处理——把可能需要调整的部分做成独立模块(预合成),减少后续修改的工作量。 -
细化处理
和第一个视频的细化环节类似,这里就不再赘述。
结尾
回头看这两套流程,虽然面对的素材类型和创作目标完全不同,但底层逻辑其实是一致的:先建立框架,再填充内容,过程中保持灵活调整。第一个视频因为完全自主可控,可以做到素材零浪费;第二个视频面对有限素材,反而逼出了更多创意解法。
工作流的价值不在于追求绝对的标准化和自动化,而在于让重复性操作变得可预期,把认知资源留给真正需要创造力的部分。对我而言,这套方法已经能支撑稳定产出,同时保留足够的弹性应对不同项目的需求。往往最顺手的那套,才是真正合适且高效的工作流。
部分信息可能已经过时









