可借助AI工具自动分割长视频并生成匹配文案,具体包括:一、剪映专业版AI智能成片;二、通义听悟+通义万相组合方案;三、Whisper+LLM本地工作流。
☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

如果您拥有一段长视频,希望将其自动分割为多个短视频片段,并为每个片段生成匹配的文案,则可以借助AI工具实现高效处理。以下是具体操作步骤:
一、使用剪映专业版的AI智能成片功能
剪映专业版内置AI模型可对导入的长视频进行语义分析,识别关键场景与语音内容,自动划分片段并生成对应标题与字幕文案。
1、打开剪映专业版桌面端,点击“新建项目”,导入原始长视频文件。
2、在右侧工具栏选择“AI智能成片”,点击“开始分析”。系统将自动进行语音转文字、语义分段与画面节奏识别。
3、分析完成后,界面显示多个已切分的短视频片段,每个片段下方附带AI生成的短文案,支持一键复制或手动编辑。
4、选中某一片段,点击“导出”按钮,设置分辨率与格式后完成单条短视频输出。
二、调用通义万相+通义听悟组合方案
通过通义听悟提取视频音频文本并定位高信息密度段落,再利用通义万相生成图文适配文案,实现音画分离式切片与文案协同生成。
1、访问通义听悟官网,上传长视频,开启“语音转文字”与“智能摘要”功能。
2、在生成的文字稿中,查看系统标记的“重点片段”时间轴,记录起止时间点(如00:02:15–00:03:48)。
3、将各重点时间段输入通义万相的“短视频文案生成”模块,输入提示词:“请为这段30秒左右的知识类视频生成15字以内爆款标题+两行口语化文案,风格轻松有记忆点”。
4、根据返回文案,在本地剪辑软件中按时间码精准裁剪对应视频片段,并将文案作为字幕嵌入。
三、部署Whisper+LLM本地切片工作流
使用开源语音识别模型Whisper提取完整时间对齐字幕,再通过本地运行的轻量级大语言模型(如Qwen2-0.5B)对字幕段落聚类,识别话题切换点以确定切片边界。
1、安装whisper命令行工具,执行whisper input.mp4 --model base --output_format srt生成带时间戳的SRT字幕文件。
2、用Python脚本读取SRT,将连续3秒内无语音间隔的文本块合并为候选段落,剔除停顿超8秒的冗余区间。
3、将每段文本送入本地LLM接口,发送请求体中包含指令:“判断该段文字是否构成独立信息单元:是/否。若为‘是’,输出一句12字内核心要点概括”。
4、筛选输出为“是”的段落,以其起始与结束时间戳为依据,在FFmpeg中执行批量裁剪:ffmpeg -i input.mp4 -ss 00:01:22 -to 00:02:05 -c copy part1.mp4。










