开云app官网入口网址·(中国大陆)官方网站

你的位置:开云app官网入口网址·(中国大陆)官方网站 > 新闻资讯 >
开yun体育网我有益挑选了两张布景都是蓝天白云的图片-开云app官网入口网址·(中国大陆)官方网站
发布日期:2025-06-16 07:12    点击次数:83

AI 视频的多主体一致性,向来是个贫瘠。让 AI 假造生成模特和衣服不难,但如若甲方条件,必须要让马斯克代言,穿上毛绒大衣,AI 可能就办不到了。

Pika 最近更新的 2.0 模子,提倡了一种很酷爱的顾问步地——咱们上传多张图片,Pika 会精确参考图片中的元素,生成视频。

集王人东谈主物、商品、场景的像片,一个尽头基础的告白片就出炉了,而况这些素材在视频里长得都和像片里相似。

这是否意味着,AI 视频的一致性贫瘠顾问了,告白行业的一又友们又要畏忌了?其实并莫得,进程实测,Pika 的可玩性很高,但论实用,谈行还不够。

马斯克和奥特曼看电影,名画吃薯条,同框从未如斯节略

Pika 上传多张参考图片的功能,叫作「Scene Ingredients」(场景因素)。

使用起来很节略:1. 点击「+」上传图片,上限 6 张;2. 在文本框里,写上节略的请示词。

接下来就参加实操——让闹得遗民涂炭的马斯克和奥特曼,化战役为财宝,在一齐看电影。

▲请示词:两个东谈主坐在黯澹的不雅众席中。他们手捧一桶爆米花,一把放到嘴里嚼着,全神灌输地看着目前的场景。他们睁大眼睛的色彩传达出重大的期待或陶醉,仿佛他们十足千里浸在正在伸开的戏剧或场景中。周围的环境标明东谈主群拥堵,但焦点仍然会聚在他们的响应上

上传两位的像片就够了,不雅众席可以用请示词写出来。

关于马斯克,AI 的推崇很踏实。但奥特曼看起来是田主家的傻女儿,吃相恐怖就不说了,眼睛大得要掉出来。

Pika 很酷爱的少许是,素材可以「复用」。

是以,咱们可以让马斯克和奥特曼过把模特瘾。只上传一张服装图片,然后通过请示词,让他们一稔相似的绿色大衣,拍个前锋大片。

▲请示词:两名男人在壮丽的冬日现象中站在一齐自拍。两东谈主都一稔相通的绿色长外衣。全身照,从新到脚展现他们。他们摆出专科模特般的姿势,脸上挂着自信的浅笑。电影灯光杰出了他们的脸庞和外衣的蹧跶质感。高端前锋影相格调,专科相机品性,前锋杂志好意思学

两东谈主的像片都找了现成的,绿色的大衣和冰天雪地的布景是另外用 AI 生成的,衣服上的「AIGC」,算是锻练 Pika 的附加题。

终局,场景和大衣的一致性保持得可以,「AIGC」的字样隐隐可以阔别,两位模特的当作也受命了请示词。

但最大的问题是,这两东谈主是谁?视频的东谈主脸和像片,不可说一模相似,可以说是绝不关系。

不信邪,赓续让 Pika 玩换装。

此次,咱们请出扎克伯格,照例先用 AI 图片器具生裁缝服,上头写着「I was human」(我曾是东谈主类),呼应经典的机器东谈主梗。

然后,再找一张扎克伯格的图片,和一把尤克里里的图片,让小扎玩个音乐。

▲请示词:一位身穿玄色 T 恤的男人站在温馨的房间里,弹奏着尤克里里琴。镜头从中前景启动,展现他的通盘这个词体格,自若拉近,终末聚焦在 T 恤上的笔迹上

Pika 对请示词的受命和镜头的通顺都挺好,衣服也丝滑地穿上了,但右手,尤其大拇指,如故不齐备。

相较 Google Veo、OpenAI Sora 等,Pika 的模子才调不算顶尖,一个问题顾问了,还有更多的 bug 被发现。

尝试了写实的,再来试试二次元画风,为了让坂田银时和旋涡鸣东谈主同框,我有益挑选了两张布景都是蓝天白云的图片。

▲请示词:动漫格调的场景,镜头聚焦在两个年青男人的脸上,布景是湛蓝的太空和白云。他们一边聊天一边意见交流,保留了原有的动漫艺术格调

布景和会得很天然,两位正面的色彩推崇可以,吹动头发和衣服的风也恰到自制。然则,回身着实太可怕了。银时是死鱼眼,不是果真翻冷眼啊喂。

次元壁都突破了,天然也可以让名画跨年代互动——蒙娜丽莎和戴珍珠耳饰的青娥在麦当劳餐厅吃薯条。

▲   请示词:蒙娜丽莎和戴珍珠耳饰的青娥正在麦当劳餐厅用餐。她们相对而坐,桌上摆着薯条。她们边聊天边品味薯条,录像机从侧面捕捉她们,两位脚色偶尔看向镜头,营造出一种神圣而友好的氛围

终局说来话长,看到蒙娜丽莎,不知谈达芬奇想不想掀棺材板。两位好像贴图相似,被放在了视频里,头部也通顺得尽头诡异。

有时辰,讲求节略,谈法天然,终局反而超出预期。

▲请示词:特写镜头,水池名义出现气泡,然后咖啡杯从水中浮出

上传一张星巴克的图片,一幅莫奈的睡莲,就可以获取一个「净水出芙蓉」的咖啡杯。

PK 国产模子,适度 AI 视频的门槛更低了

一定进程上,Pika 提升了视频的可控性。话不说满,因为从延迟看来,Pika 在场景、服装、物品上的一致性保持地较好,东谈主物的脸容易崩,岂论是什么次元。

同期,模子的基础才调,Pika 也有待跨越,吃东西、弹琴等物体通顺,仍然会出现问题。这些问题,能不可通过抽卡缓解呢?

三个字:抽不起。

Pika 2.0 现在仅对 Pro 和 Fancy 用户敞开,如若按月订阅,每月至少花 35 好意思元,连免费试用的额度都莫得。

而况,Pro 用户每月只消 2000 积分,但使用 Scene Ingredients 功能,一个视频就要花掉 100 积分。

▲ vidu 界面

其实,国产 AI 视频模子 Vidu,比 Pika 更早地兑现了「多图参考」的功能。更拿捏用户的是,它有免费体验的积分。

Pika 的几个案例,我也在 Vidu 跑了一下。蒙娜丽莎和戴珍珠耳饰的青娥吃薯条,两位像刚出土,但蒙娜丽莎的复原度比 Pika 高。

马斯克和奥特曼一齐看电影,马斯克的脸像了七巧合,奥特曼的脸依旧祸害。

坂田银时和旋涡鸣东谈主同框,Vidu 竟然能基于正脸生成侧脸,但画风和原图不太相似。

另外,在功能上,Vidu 有少许不如 Pika ——最多只可上传三张图片。是以,让 Vidu 给马斯克和奥特曼拍前锋大片,我就莫得上传布景,只上传了两位的像片和绿色的大衣。

两位给东谈主的嗅觉很生分。可以看出,东谈主脸的踏实性,仍然是个贫瘠。

和 Pika 比较,Vidu 终局如何,可以见仁见智。Pika 用的是 Pro 版,Vidu 用的是免费版,客不雅上也会导致两者的各异。

但 Pika 和 Vidu 的念念路是相似的——仅靠几个图片素材、一段节略的请示词,就生成相对踏实的物体。

在 AI 视频生成中,保持主体一致性,现在相对可靠的是 LoRA 决策,用一定数目的、特定主体的素材,对模子进行微调。通过适量的素材和考试,模子能自若掌捏这个脚色的状貌特征。

但为了让 AI 视频被更多东谈主用起来,有更广阔的贸易价值,门槛就要裁减。至少,从 Vidu 和 Pika 身上,咱们看到了可能性。

靠 AI 短视频出圈,在整活的谈路上室迩人远

Pika 的 2.0 模子发了没几天,国际网友还是玩疯了。

拿我方的像片,反复生成不同场景的视频,就可以兑现「陡然全寰宇」。

▲ 图片来自:X@EladRichardson

通过 AI 一键试衣,模特和衣服如活水,场景都不带换的,实拍的钱省下来了。

▲ 图片来自:X@martgent

玩着玩着,Pika 给了我一种玩「QQ 秀」和模拟东谈主生的嗅觉,怎么打扮视频里的脚色,咱们来决定。

如若让马斯克「圆梦」,很容易,先用其他 AI 器具,生成了一件「占领火星」的 T 恤、一个写着「MAGA」的红色帽子。

然后,把这些图片、火星的场景、马斯克的像片,以及他的擎天柱东谈主形机器东谈主、他特出可爱的网红色彩包 Doge 原型,全部上传到 Pika。

▲请示词:别称男人站在火星名义,身穿玄色 T 恤,头戴红色帽子。他的左边坐着一只狗,右边站着一个机器东谈主。镜头以广角镜头启动,捕捉男人、狗、机器东谈主的全身。跟着镜头安逸拉近,男人朝镜头快活地挥手,色彩飘溢着同意和冒险精神

最终,一个阳光生动大男孩出现,左牵黄,右擎苍,安分多余,但便是不像马斯克。

像不像是一趟事,只消念念路广阔,玩法取之不尽。

基于咱们我方和名东谈主的像片,可以无痛追星。上传帽子、衣服、乐器,能把我方从新打扮到脚。集王人场景、家具、模特,一个 5 毛殊效的告白片子就有了 ......

像片 +AI 图片 +Pika 2.0+ 请示词,可以生成好多好玩的画面。同期,这么的生成步地也回避了一些视频模子的短板,比如写字,在图片模子就可以顾问。

不和 Google 硬刚模子才调,不和 Runway 这种逐梦好莱坞的敌手比较,Pika 有我方的弯谈超车玩法。

其实一直以来,Pika 在整活和创意方面便是一把好手,之前的一系列 AI 殊效功能 Pikaffect 全网爆火,刷屏小红书和 TikTok,激动 Pika 用户突破 1100 万。

▲ AI 捏捏 . 图片来自:Pika

▲ AI 切蛋糕 . 图片来自:Pika

Pika 切中了一群对整活短视频有高需求的用户,哪怕这些视频是模板化的,稍纵则逝的,但只消酷爱,东谈主们就会蜂涌而至。

谁说赢者通吃才是告捷?AI 的市集是广阔的开yun体育网,模拟物理寰宇天然是个重大的逸想,先完成让 AI 短视频酷爱起来的小主见,未曾不是一种告成的步地。