宣传片制作软件 手机制作宣传片的软件

我还在和ChatGPT聊天的时候,AIGC圈已经刷出了新东西——

人工智能生成的乔布斯似乎从画中醒来,在镜头前谈论侃侃,他的声音与原声颇为相似。

据《历史的历史》作者介绍,视频中的文案选自他与ChatGPT的对话。乔布斯的形象由AI绘图工具Midjourney生成,AI拟声词工具ElevenLabs提供语音再现。最后,图像被AI视频工具D-ID转换成视频。

在类似AI工具的帮助下,网民用“魔法”生成的纸人可以移动,甚至可以轻松创建自己的数字头像。

AIGC降低了创作门槛,越来越多的人试图让AI参与内容创作,从文案、录音到配音、剪辑,几乎可以让AI无所不包。根据国外商业咨询机构Acumen Research and Consulting的预测,如果考虑到下一代互联网的内容需求,2030年AIGC市场将达到1100亿美元。

近年来,AI对话、AI绘画、AI语音技术其实都有了一定程度的发展,但相对而言,AI模型在视频领域的发展和应用才刚刚起步不久。像D-ID这样的技术,只用一张静态图片就能制作出虚拟人的视频,真是太神奇了。

国内外有哪些AI视频创作工具?AI会给视频内容制作和交互体验带来哪些改变?本文对此进行了盘点和分析。

宣传片制作软件 手机制作宣传片的软件插图

AI拼接素材,套上模板秒出视频

一般的视频创作包括这几个环节:写剧本/文案、拍摄视频或者找第三方素材、剪辑素材、配音、配乐、添加转场、特效、字幕、片头、封面图片等等。

其中,AI现在可以辅助很多任务,比如视频素材的智能匹配、AI自动剪辑、AI抠图、AI换脸、画质优化修复等。

“图文成块”的功能在各平台推出的编辑应用中很常见。Tik Tok的剪贴、Aauto Quicker的快片、百度的百家号、哔哩哔哩的剪贴都支持图片、视频素材按文案一键拼接,同时生成字幕和配音。

输入文案可以参考AI助手的回答。比如“养猫对一个人有什么影响?”ChatGPT回答说,养猫可以减轻压力,缓解焦虑,增强社交能力,改善心理健康,增加锻炼。我们可以在此基础上进行修改,然后引入裁剪。

视频不到一分钟自动生成,画面与文案内容基本一致。如果对素材不满意,比如想把静态图片换成视频,可以去网上素材库搜索更合适的替换。

值得注意的是,这些材料往往来自网络或第三方服务,如无版权的画廊Unsplash和Pexels。AI编辑应用做的是通过AI和机器学习分析文案的语义,在不同的镜头中进行处理,并智能匹配相应的图像。

所以对创作者最大的帮助就是节省收集素材的时间,减少人工剪辑的劳动,通过自动化和模板化提高视频制作的效率。

类似的视频自动编辑工具是“Lumen5”,专注于将长图转换成视频,提供大量视频模板,操作门槛较低。可以像制作PPT一样拖动文字变成图片。自2017年Lumen5上市以来,官网介绍其已被超过100万企业客户用于社交媒体营销和传播。

图像源Lumen5

“vidyo”来自印度的AI初创团队,支持长视频到短视频的转换。通过AI语音识别技术,可以从素材中自动剪辑出精彩片段,适用于视频直播切片和播客剪辑,但目前视频语言仅支持英文。

图来源vidyo

虽然目前视频创作软件的AI功能主要是文字匹配视频素材,但后期可能会加入更多的AIGC工具。

比如海外AI视频工具“Fliki”,擅长将短图像转换成视频。它可以通过输入Twitter等博客链接快速生成短视频,它还提供文本以在图片材料上生成AI图像,并有Dall E的技术支持。

图来源Fliki

“Copydone”来自国内一家AIGC创业公司,支持在小红书、淘宝等平台生成AI营销字帖,还可以根据字帖自动生成图片或拼接视频。

图像源复制完成

海外AI视频网站“QuickVid”整合了GPT-3、DALL E 2等AI生成图文的能力。用户只需要给出一个视频主题,其余的可以自动生成。但它在二次编辑上的自由度和丰富度是有限的。

图像源QuickVid

此外,视频创作中的具体要求也可以尝试用AI来实现。比如已经有很多AI修复旧视频的热门案例。史料和早期电影片段可以通过“视频增强AI”等视频增强软件提高图像质量和分辨率。

屠园哔哩哔哩

让照片说话,跨模态AI做到了

现在的AI只能算是辅助视频创作的小助手。从零开始快速创建具有更高原创性的视频仍然很困难,但更强大的跨模态视频生成模型(如文本生成视频和图像生成视频)已经在路上了。

文字生成视频,除了从现有素材库拼接,其实还有更接近人类工作的方式,就像AI绘画模型学习文字和图像的抽象概念。

2022年5月,清华大学联合致远研究院发布“CogVideo”,这是国内首个开源的文本生成视频模型。在其演示网站上,选择“年轻女子在餐厅喝奶茶”,就可以看到AI生成的4秒视频,分辨率为480×480。

图像源CogVideo

在设计模型中,CogVideo包含94亿个参数。CogView2有效应用于文本-视频模型,采用多帧率分层训练策略。

由CogVideo生成的32帧的4秒剪辑。

从技术上讲,视频是一帧一帧的连续图像,AI文本生成视频也可以看作是文本生成图像的延伸。一般原理是通过文本生成若干单帧图像,然后通过插值算法在若干帧之间绘制图像,生成连贯的视频。

在Disco Diffusion普及之前,玩家使用它的动画模式来生成2D或3D视频,这也扩展了一些使用门槛更低、创作更容易的AI生成的视频应用。

例如,在AI视频网站“Kaiber”上,用户可以通过输入图像或文本描述或从预置中选择几个词来快速生成四种视频结果。

图源凯博

最近,美国流行摇滚乐队林肯公园发布的新MV《迷失》是由Kaiber制作的动画。

来源“丢失”

但目前跨模态视频生成的AI模型还处于探索阶段。Google、Meta等大公司去年发表了相关研究论文,而且只是演示案例,具体产品还没有推出。

据Meta官网介绍,“Make-A-Video”加速了文本转视频模型的训练(不需要从头学习视觉和多模态表示),不需要配对的文本转视频数据,但可以实现丰富的文本转视频生成、图像转图像生成(移动单幅图像或两幅图像)以及改变原始视频的风格。

图像源制作视频

谷歌的“Imagen Video”和“Phenaki”也可以达到类似的效果,Phenaki可以根据一系列提示生成2分钟以上的长视频。

Too 空行走的烟火

使用提示:

宇航员在火星上走过水坑的侧面图。

宇航员在火星上跳舞宇航员

在火星上遛狗。

宇航员和他的狗观看烟火。

图来源Phenaki

人工智能公司Runway参与了稳定扩散第一版的建设。最近,他们发布了一款新的视频生成器“Gen-1”,即将开放内测,声称可以将视频转换成任何风格。

根据Gen-1官网演示,用户可以提供一张参考图片,然后就可以按照指定的风格渲染原始视频,或者用文字说明修改视频中的一些素材,甚至可以输出3D模型渲染和定制视频。

第一代图像源

在AI生成3D短视频方面,国内深氧科技近日完成千万元天使轮融资,引入了GPT3.5、Transformer、Diffusion Model等AI技术红利。其发布的O3.xyz引擎V1.0版本支持一站式生成3D短视频内容,百万粉丝博主“特效卡卡西”等创作者已加入内测。

由此可见,多模态AI生成视频的发展正在加速,“用嘴制作视频”未来可能会应用于短视频、影视、设计、游戏、电商等诸多行业。

回到开头提到的“D-ID”,生成数字人/虚拟头像也是图像生成视频的一种类型,目前这类工具在企业培训和市场营销中有很多应用案例。

2020年推出的AI视频创作产品“Synthesia”显示已被数千家公司使用。用户可以从现有的演员库中选择或上传自己的视频,创建一个AI形象,然后输入脚本,让AI进行配音和拼接素材输出视频。

图像源合成

Synthesia通过训练神经网络达到逼真的合成效果。与传统视频制作相比,可以节省制作成本和周期,一键生成多语言视频,方便本地化服务。所以企业多用于大规模生成员工培训、产品介绍演示、营销等视频。

D-ID较早开始开发图像处理技术,因与MyHeritage合作推出“深度怀旧”计划而闻名。在AI工具的帮助下,用户可以将已故亲人的静态照片变成生动的动态视频。

最近随着ChatGPT的热潮,更多人看到了各种AI工具制作的视频,D-ID的体验门槛较低。即使是不知道如何创作视频的新手,也可以通过上传一张图片,在几分钟内生成带人解说的视频。

图来源D-ID

D-ID会自动给人物添加一系列的面部动作,会模拟一些轻微的头部动作,但有时候表情有点怪异,过于逼真的照片可能会让人产生“恐怖谷”的反应。

同时,用户不能上传涉及政治、性、犯罪、名人、歧视的图片,D-ID会提示违规风险。这意味着AI生成的视频技术将和其他生成的内容一样,面临版权、伦理等问题。

下一波AIGC浪潮,我们如何应对

去年,Stability AI的首席技术官汤姆·梅森(Tom Mason)判断,在文字生成图像之后,下一波浪潮肯定会是视频、音频和3D。

当AI可以写文章、画图、做视频、尝试做大部分创意任务的时候,人类下一步该怎么做?

这里我就说说我的想法吧。首先,技术人员可以继续开发和改进AI模型。在抖音的官网上,已经贴出了AIGC方向的机器学习工程师招聘需求。

图来源抖音职业生涯

抖音说,“AIGC最近的突破让我们相信,AIGC技术可以用于商业目的,尤其是用于创意制作。想想AI生成/辅助的广告创意脚本,甚至是AI生成的商业图像和视频,它们将永远改变创意制作行业。”

目前的AI视频模型无法快速产生像AI画图一样的高质量作品,比如视频模糊、动作不自然、细节缺失等。但随着国内AIGC技术的发展,相关场景的应用生态可能会很有想象力空。上面提到的一些AI技术公司已经开始为个人和企业提供付费服务,以提高内容生产效率。

对于内容创作者来说,与其担心会不会被AI取代,不如学会理解和使用AI工具,让AI取代重复性的琐碎工作,把更多的时间花在自己的核心优势上,生产出更高质量的内容。

的确,随着AI的加入,内容竞争会越来越激烈。有创作者表示,D-ID出现后,“所有阅读稿件和新闻播报的纯处理视频都会受到很大冲击”。

站在用户的角度,我觉得只要是优质内容,哪怕是AI批量生成的?我们担心的是低质量内容的泛滥。

平台和用户都需要避免AI的滥用,例如生成虚假、仇恨、歧视或有害的内容,甚至引发欺诈等犯罪行为。Google曾经提到,出于安全和伦理的考虑,在Imagen Video的内部实验中应用了输入文本提示过滤和输出视频内容过滤,但仍然存在重要的相关风险,暂时不会发布两个视频生成模型的代码或Demo。

总之,AI技术大大降低了从文本到视频的内容创作门槛,另一方面,AIGC也推动了内容产业的创新。目前至少可以做到一定程度的降本增效,但是发展初期新的规则和秩序还没有建立起来,行业如何改变最终还是要靠人的作用。

附:本文提到的一些AI视频工具的网址,关注“新榜”,在微信官方账号对话框回复“AI视频”即可获得。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

本文来自网络,若有侵权,请联系删除,作者:给力软件,如若转载,请注明出处:https://examemo.com/1729.html

发表回复

登录后才能评论