讲师中心微信公众号

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机游戏

最近更新

0

0

Meta公司创新SOTA模型，能够根据一句话生成惊人视频，引爆网络热潮！

WBOY

发布时间：2023-04-23 09:22:07

|

1911人浏览过

|

来源于51CTO.COM

转载

给你一段话，让你做个视频，你能行吗？

Meta表示，我可以啊。

你没听错：使用AI，你也可以变成电影人了！

近日，Meta推出了新的AI模型，名字起得也是非常直接：做个视频（Make-A-Video）。

这个模型强大到什么程度？

一句话，就能实现「三马奔腾」的场景。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

就连LeCun都说，该来的总是会来的。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

视觉效果超炫

话不多说，咱们直接看效果。

俩袋鼠在厨房忙着做饭（做出来能不能吃另说）

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

近景：画师在画布上作画

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

大雨中漫步的二人世界（步伐整齐划一）

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

马在喝水

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

芭蕾舞女孩在摩天大楼跳舞

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

美丽的夏日热带海滩上，一只金毛在吃冰激凌（爪子已进化）

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

猫主子拿着遥控器在看电视（爪子已进化）

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

一只泰迪熊给自己画自画像

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

意料之外但情理之中的是，狗拿冰淇淋、猫拿遥控器以及泰迪熊画画的「手」，果然都「进化」得和人一样啊！（战术后仰）

当然，Make-A-Video除了可以把文本变成视频之外，也可以把静态图变成Gif。

输入：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输出：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输入：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输出：（亮的似乎有点不是地方）

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

2张静图变GIF，输入陨石图

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输出：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

以及，把视频，变成视频？

输入：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输出：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输入：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

输出：

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

技术原理

今天，Meta放出了自己的最新研究MAKE-A-VIDEO: TEXT-TO-VIDEO GENERATION WITHOUT TEXT-VIDEO DATA。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

论文地址：https://makeavideo.studio/Make-A-Video.pdf

阿里妈妈·创意中心

阿里妈妈·创意中心

阿里妈妈营销创意中心

下载

在这个模型出现之前，我们已经有了Stable Diffusion。

聪明的科学家已经让AI用一句话生成图像了，下一步他们会做什么呢？

很显然，是生成视频。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

一只穿着红色斗篷的超级英雄狗在天空中飞翔

比起生成图像来，生成视频可难多了。我们不仅需要生成相同主题和场景的多个帧，还必须让它们及时、连贯。

这就增加了图像生成任务的复杂性——我们不可能就简单地使用DALLE生成60张图像，然后把它们拼成一个视频。它的效果会很差，很不真实。

因此，我们需要一个能够以更强大的方式理解世界的模型，并且让它按照这种理解水平来生成一系列连贯的图像。只有这样，这些图像才可以天衣无缝地融合在一起。

也就是说，我们的诉求是模拟一个世界，然后再模拟它的记录。该怎么做到呢？

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

按照以前的思路，研究人员会用大量的文本-视频对来训练模型，但在现在的这种情况下，这种处理方法并不现实。因为这些数据很难获得，并且训练成本非常昂贵。

因此，研究人员开了脑洞，采用了一种全新的方式。

他们选择开发一个文本到图像的模型，然后把它应用于视频。

巧了，前段时间，Meta就曾开发过这么一个从文本到图像的模型Make-A-Scene。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

Make-A-Scene的方法概述

这个模型产生的契机是，Meta希望推动创意表达，将这种文本到图像的趋势与以前的草图到图像模型相结合，从而产生文本和以草图为条件的图像生成之间的奇妙融合。

这意味着我们可以快速勾勒出一只猫，写出自己想要什么样的图像。遵循草图和文本的指导，这个模型会在几秒钟内，生成我们想要的完美插图。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

你可以把这种多模态生成AI方法看作是一个对生成有更多控制的Dall-E模型，因为它还可以将快速草图作为输入。

之所以称它为多模态，是因为它可以将多种模态作为输入，比如文本和图像。相比之下，Dall-E只能从文本生成图像。

为了生成视频，就需要加入时间的维度，因此研究人员在Make-A-Scene模型中添加了时空管道。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

加入时间维度后，这个模型就不是只生成一张图片，而是生成16张低分辨率的图片，以创建一个连贯的短视频。

这个方法其实与文本到图像模型类似，但不同之处在于：在常规的二维卷积的基础上，它增加一维卷积。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

只是简单地增加了一维卷积，研究人员就能保持预先训练的二维卷积不变的同时，增加一个时间维度。然后，研究人员就可以从头开始训练，重新使用Make-A-Scene图像模型的大部分代码和参数。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

同时，研究人员还想用文本输入来指导这个模型，这将与使用CLIP嵌入的图像模型非常相似。

在这种情况下，研究人员是在将文本特征与图像特征混合时，增加空间维度，方法同上：保留Make-A-Scene模型中的注意力模块，并为时间增加一个一维注意力模块——复制粘贴图像生成器模型，为多一个维度重复生成模块，来获得16个初始帧。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

但是只靠这16个初始帧，还不能生成视频。

研究人员需要从这16个主帧中，制作一个高清晰度的视频。他们采用的方法是：访问之前和未来的帧，并同时在时间和空间维度上对它们进行迭代插值。

就这样，他们在这16个初始帧之间，根据前后的帧生成了新的、更大的帧，这样就使运动变得连贯，整体视频变得流畅了。

这是通过一个帧插值网络完成的，它可以采取已有的图像来填补空白，生成中间的信息。在空间维度上，它会做同样的事情：放大图像，填补像素的空白，使图像更加高清。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

总而言之，为了生成视频，研究人员微调了一个文本到图像的模型。他们采用了一个已经训练好的强大模型，对它进行调整和训练，让它适应视频。

因为添加了空间和时间模块，只要简单地让模型适应这些新数据就可以了，而不必重新训练它，这就节省了大量的成本。

这种重新训练使用的是未标记的视频，只需要教模型理解视频和视频帧的一致性就可以了，这就可以更简单地建立数据集。

最后，研究人员再次使用了图像优化模型，提高了空间分辨率，并使用了帧插值组件增加了更多的帧，使视频变得流畅。

当然，目前Make-A-Video的结果还存在缺点，就如同文本到图像的模型一样。但我们都知道，AI领域的进展是多么神速。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

如果你想进一步了解，可以参考链接中Meta AI的论文。社区也正在开发一个PyTorch的实现，如果你想自己实现它，请继续关注。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

作者介绍

这篇论文中有多位华人研究人员参与：殷希、安捷、张宋扬、Qiyuan Hu。

殷希，FAIR研究科学家。此前曾供职微软，任Microsoft Cloud and AI 的高级应用科学家。在密歇根州立大学计算机科学与工程系获博士学位，2013年毕业于武汉大学电气工程专业，获学士学位。主要研究领域为多模态理解、大规模目标检测、人脸推理等。

安捷，罗切斯特大学计算机科学系博士生。师从罗杰波教授。此前于 2016 年和 2019 年在北京大学获得学士和硕士学位。研究兴趣包括计算机视觉、深度生成模型和AI+艺术。作为实习生参与了Make-A-Video研究。

张宋扬，罗切斯特大学计算机科学系博士生，师从罗杰波教授。在东南大学获得学士学位，在浙江大学获得硕士学位。研究兴趣包括自然语言矩定位、无监督语法归纳、基于骨架的动作识别等。作为实习生参与了Make-A-Video研究。

Qiyuan Hu，时任FAIR的AI Resident，从事提高人类创造力的多模态生成模型的研究。她在芝加哥大学获得医学物理学博士学位，曾从事AI辅助的医学图像分析工作。现已供职Tempus Labs，任机器学习科学家。

网友大受震撼

前段时间，谷歌等大厂纷纷放出自家的文本到图像模型，如Parti，等等。

有人甚至认为文本到视频生成模型还有一段时间才能到来。

没想到，Meta这次投了一颗重磅炸弹。

其实，同在今天，还有一个文本到视频生成模型Phenaki，目前已提交到ICLR 2023，由于还处于盲审阶段，作者机构还是未知。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

网友称，从DALLE到Stable Diffuson再到Make-A-Video，一切来得太快。

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

一句话生成视频AI爆火！Meta最新SOTA模型让网友大受震撼

相关文章

AI配音终极指南：免费工具，完美脚本，轻松变现！

Moji AI 智能皮肤检测仪 A6 操作指南与深度解析

免费打造类Copilot Excel AI函数：提升效率的终极指南

Lalal.ai：音乐人必备的AI音频处理工具

面试作弊神器：Interview Coder AI面试助手全攻略

相关标签:

ai pytorch stable diffusion https microsoft

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：使用迁移学习技术进行深度学习模型的定制训练下一篇：Stable Diffusion-XL开启公测，让你摆脱繁琐的长prompt！

作者最新文章

夸克浏览器如何调用AI搜索_夸克AI搜索的快捷指令大全

2025-10-19 11:02

夸克浏览器一键启用AI搜索_带你体验夸克AI搜索的强大之处

2025-10-19 18:42

玩转夸克浏览器的AI搜索模式_夸克AI搜索新手入门操作指南

2025-10-20 09:50

夸克浏览器AI搜索最新版教学_探索夸克AI搜索的隐藏功能

2025-10-24 20:48

夸克浏览器怎么用AI搜索_夸克AI搜索正确提问方式教学

2025-10-25 23:12

微信朋友圈怎么设置定时发布微信朋友圈定时发送图文教程

2026-01-02 09:14

微信朋友圈怎么定时发送微信朋友圈定时发布设置方法【教程】

2026-01-06 09:59

苹果手机怎么定时发朋友圈 iPhone微信朋友圈自动发布方法【步骤】

2026-01-08 11:11

微信朋友圈能定时发送吗微信朋友圈定时发送功能开启方法

2026-01-09 08:15

微信朋友圈草稿箱怎么用微信朋友圈定时发送隐藏技巧

2026-01-10 08:41

热门AI工具

更多

DeepSeek

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

更多

pytorch是干嘛的

pytorch是干嘛的

pytorch是一个基于python的深度学习框架，提供以下主要功能：动态图计算，提供灵活性。强大的张量操作，实现高效处理。自动微分，简化梯度计算。预构建的神经网络模块，简化模型构建。各种优化器，用于性能优化。想了解更多pytorch的相关内容，可以阅读本专题下面的文章。

429

2024.05.29

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

19

2025.12.22

http与https有哪些区别

http与https有哪些区别

http与https的区别：1、协议安全性；2、连接方式；3、证书管理；4、连接状态；5、端口号；6、资源消耗；7、兼容性。本专题为大家提供相关的文章、下载、课程内容，供大家免费下载体验。

1933

2024.08.16

vsd文件打开方法

vsd文件打开方法

vsd文件打开方法有使用Microsoft Visio软件、使用Microsoft Visio查看器、转换为其他格式等。想了解更多vsd文件相关内容，可以阅读本专题下面的文章。

479

2023.10.30

Java 项目构建与依赖管理（Maven / Gradle）

Java 项目构建与依赖管理（Maven / Gradle）

本专题系统讲解 Java 项目构建与依赖管理的完整体系，重点覆盖 Maven 与 Gradle 的核心概念、项目生命周期、依赖冲突解决、多模块项目管理、构建加速与版本发布规范。通过真实项目结构示例，帮助学习者掌握从零搭建、维护到发布 Java 工程的标准化流程，提升在实际团队开发中的工程能力与协作效率。

7

2026.01.12

c++主流开发框架汇总

c++主流开发框架汇总

本专题整合了c++开发框架推荐，阅读专题下面的文章了解更多详细内容。

101

2026.01.09

c++框架学习教程汇总

c++框架学习教程汇总

本专题整合了c++框架学习教程汇总，阅读专题下面的文章了解更多详细内容。

55

2026.01.09

学python好用的网站推荐

学python好用的网站推荐

本专题整合了python学习教程汇总，阅读专题下面的文章了解更多详细内容。

139

2026.01.09

学python网站汇总

学python网站汇总

本专题整合了学python网站汇总，阅读专题下面的文章了解更多详细内容。

12

2026.01.09

热门下载

更多

网站特效

/

网站源码

/

网站素材

/

前端模板

相关下载

更多

php商城系统

淘源码商城PHP淘宝查信誉

PHP房产程序[BBWPS]

PHP简约自动发卡平台个人版

ERMEB域名PHP离线网络授权系统

Difeye-敏捷的轻量级PHP框架

大泉州汽车网PHP整站程序

精品课程

更多

相关推荐

/

热门推荐

/

最新课程

10分钟--Midjourney创作自己的漫画

10分钟--Midjourney创作自己的漫画

共1课时 | 0.1万人学习

Midjourney 关键词系列整合

Midjourney 关键词系列整合

共13课时 | 0.9万人学习

AI绘画教程

AI绘画教程

共2课时 | 0.2万人学习

最新文章

更多

2026款小鹏P7+全系标配AI底盘智能预瞄最远达30米

YouTube视频内容合规指南：免费素材及版权规避策略

深入剖析：善意谏言播客的全球影响与未来策略

ChatGPT 赋能编剧：10 个技巧释放你的创作潜力

AI简历优化：5招提升简历通过率，告别机器人筛选

ResumeUp.ai：AI驱动的简历优化，提升求职成功率

Minecraft Merl：新AI助手测评及深度解析

Bad Lip Reading: Carl Poppa音乐解析与创作灵感

小鹏汽车夺得北欧中国品牌销冠全球销量猛增156%

AI配音终极指南：免费工具，完美脚本，轻松变现！

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部