这是一个基于开源项目的二次创作实践。 项目来源:jianying-editor-skill(GitHub 开源项目) 在决定重塑视频剪辑工作流后,我发现了这个开源项目。 它通过 AI 代理全自动生成、编辑和导出剪映视频草稿,核心思路是: 剪映的草稿文件本质上是 JSON 结构,可以通过编码的方式进行视频编辑。 经过试用,我发现这个项目很不错,但真正要让我用起来,还需要做一些定制化改进。 于是我做了两个关键改动,让它完全适应我的使用场景和工作流。
一、项目背景:从内容中台到视频制作自动化
在过往的内容中台与系统产品实践中,我反复遇到一个问题:
- 内容结构复杂,但视频制作流程依然依赖大量手工操作
- 从录屏到剪辑,中间存在大量重复性工作
- 不同角色对视频内容的使用方式差异很大,但工具缺乏灵活性
当我开始系统性学习并使用 AI 后,我意识到:
AI 在视频生成上的价值, 远不如它在"流程编排与自动化"上的价值。
在寻找解决方案的过程中,我发现了开源项目 jianying-editor-skill。
这个项目的核心思路是:剪映的草稿文件本质上是 JSON 结构,可以通过编码的方式进行视频编辑,
这意味着视频编辑可以程序化、可以模板化、可以自动化。
经过试用,我发现这个项目很不错,但真正要让我用起来,还需要做一些定制化改进。
于是我做了两个关键改动,让它完全适应我的使用场景。
二、核心判断:视频制作的核心不是"剪辑",而是"流程编排"
基于内容中台的经验,我在这个项目中很快做出了一个判断:
视频制作的核心难点,不在于"如何剪辑", 而在于"如何将素材与内容进行结构化关联"。
开源项目已经解决了"编码编辑"的问题,但真正要让我用起来,还需要解决两个问题:
- 录屏工具需要适应实际使用场景:原功能只能全屏录制,我需要支持窗口和区域录制
- 需要建立模板系统来保证稳定输出:精细的素材和字幕关系靠自然语言还是有点难,需要建立可复用的模板
因此,这个项目的核心设计理念是:
- 不关心时长:素材显示时长完全由字幕决定,简化用户操作
- 灵活的关联模式:支持一对一、多对一、一对多等多种关联方式
- 模板化输出:建立可复用的视频处理模板,实现稳定输出和快速迭代
- 自动化剪辑:关联完成后一键生成剪映草稿
这一步,让视频制作具备了结构层面的灵活性。
三、产品设计:智能素材编排工具
在这个项目中,我基于开源项目做了以下核心改进:
1. 录屏工具定制化改进(第一个改动)
开源项目有一个很棒的功能,叫智能录屏,也就是录完屏幕后可以把关键帧也打上去,省得自己打关键帧了。
但是原功能只能全屏录制。对于我来说,桌面一堆杂七杂八,所以改成了支持窗口和区域录制,
这样的好处是,我想录制哪里就可以去哪里。
在这个改动中,我还做了以下优化:
- 支持导入已有剪映草稿(原功能不支持)
- 支持没有麦的电脑录制功能
- 为了省 token,将这个工具打包成独立应用,这样收集素材的时候,我就可以单独唤醒了
这一步,让录屏工具具备了适应实际使用场景的灵活性。
2. 素材关联编排
在此基础上,我进一步设计了素材关联编排工具:
- 基于剪映字幕文件(SRT)进行素材关联
- 支持多种关联模式:一对一、多对一、一对多
- 可视化界面,拖拽操作即可完成关联
- 支持多种布局模式:全屏、画中画、分屏等
这一步,让素材编排具备了系统层面的灵活性。
3. 模板系统建立(第二个改动)
在作者的演示中,都是直接和 AI 沟通来进行视频的制作。但是,如果比较精细的素材和字幕关系靠自然语言,我觉得还是有点难,
还有就是基本的视频剪辑其实我是希望产出的稳定的,也就是我希望建立一个模板来进行的。
在初步完成后,我再通过自己调整或 AI 对话来进行精修。
我的解决方案是:
- 手动进行字幕和素材的对应:这种对应只要简单的对应上就行,我不管时间轴是否时间能对得上。我只是将字幕和素材建立上关系。
- 建立模板系统:将 AI 推荐或者我调试后的视频素材处理方式形成模板,这样在剪辑的时候,我做完字幕和素材的对应关系后,选择模板直接通过 Python 就直接生成了草稿。
这一步,让视频制作具备了稳定输出和快速迭代的能力。
四、技术实现:基于剪映生态的自动化
这是一个基于开源项目的二次创作实践,具备以下明确边界:
- 完全本地化运行,不依赖订阅制服务
- 基于剪映现有能力(录音转字幕、草稿格式等)
- 面向非技术背景用户
- 聚焦视频制作从 0 → 1 的完整路径
在这个项目中:
- 基础框架基于开源项目 jianying-editor-skill
- 录屏工具改进使用 Python + GUI 实现
- 素材编排工具使用 Electron + React 实现
- 剪映草稿生成基于 pyJianYingDraft 库
- 模板系统通过 Python 脚本实现快速生成
技术栈的选择,始终围绕降低使用门槛和提高自动化程度两个目标。
五、实际应用:从想法到视频的完整路径
在这个项目中,我没有从功能列表开始,而是先拆解了一个问题:
一个普通人,要把录屏内容变成可发布的视频, 中间究竟卡在哪些步骤?
我将整个过程拆解为:
- 录屏准备(使用改进后的录屏工具,支持窗口/区域选择)
- 录制操作(自动采集操作轨迹)
- 导出字幕(使用剪映录音转字幕功能)
- 素材关联(手动进行字幕和素材的对应关系,简单对应,不关心时间轴)
- 选择模板(选择已调试好的视频处理模板)
- 生成草稿(通过 Python 直接生成剪映草稿,无需 AI 来回思考)
- 在剪映中查看和微调
然后再反推:
- 哪些节点适合引入自动化
- 哪些节点必须由人来判断
最终,这个项目跑通了如下流程:
录屏 → 自动采集操作轨迹 → 导出字幕 → 素材关联 → 选择模板 → 自动生成草稿 → 可发布视频
在整个过程中,AI 和自动化的角色始终是:
辅助推进与验证,而非替代人的创意判断。
六、项目产出与验证
在这个基于开源项目的二次创作中,我持续负责并交付的包括:
- 录屏工具定制化改进(支持窗口/区域录制、导入已有草稿、无麦录制、打包成独立应用)
- 模板系统建立(实现稳定输出和快速迭代)
- 完整的工作流优化(从录屏到自动生成草稿的完整闭环)
所有功能均可验证、可运行,基于开源项目,代码可追溯。
这不是一个概念 Demo,而是一个真实可用的工具集改进。
七、复盘:AI产品化的边界与可能性
通过这个基于开源项目的二次创作,我更加确信三件事:
- AI 能显著降低"做产品"的门槛,但无法替代产品负责人的判断
- 没有结构约束的 AI 输出,价值极低
- 产品方法论,依然是 AI 成效的上限
这个项目让我非常清晰地意识到:
AI 产品化的难点, 不在于"展示多少能力", 而在于是否具备"被不同用户持续使用"的能力。
同时,基于开源项目的二次创作也让我明白:
不是要重新发明轮子,而是要在开源项目的基础上,做针对性的定制化改进,让它完全适应实际使用场景。
这也是我后来在系统型产品设计和AI 产品化实践中,
持续坚持的一种产品工作方式。
八、与其他案例的关系
- 案例 1:我如何在复杂系统中控制结构与复杂度
- 案例 2:我如何在内容中台项目中,支撑业务长期演进
- 案例 3:我如何在个人实践中,让 AI 参与产品化流程
- 案例 4:我如何在视频制作场景中,验证 AI 产品化的实际应用(基于开源项目的二次创作)
本质上,这四个案例解决的是同一个问题:
如何在不同资源条件下、不同应用场景中, 让产品依然保持可控、可演进、可验证。
这四者共同构成了我作为系统型产品负责人的完整能力画像。