字节跳动携手南洋理工大学共同推出开源ai视频生成框架storymem,创新性地引入“memory-to-video(m2v)”机制,成功将传统单镜头扩散模型拓展为可生成多镜头、时长超1分钟且叙事流畅的长视频生成系统。

该框架采用动态记忆库存储关键帧语义与视觉特征,并融合轻量级LoRA微调策略,在人物形象、场景风格及情节发展等维度实现跨镜头高度统一,整体一致性指标相较当前主流方法提升29%。

项目开源地址:https://www.php.cn/link/52bd90a3be645143af3c4ad082803269
同步发布的ST-Bench评测数据集涵盖300组多镜头故事提示,全面支撑长视频生成效果的标准化评估。目前,社区已在ComfyUI平台中启动StoryMem技术集成工作。
源码地址:点击下载










