發(fā)布時間:2026-02-07 16:12:55 編輯:57.1%的人分不清真假!Runway新視頻模型太爆炸 查看: 3166 次
57.1%的人分不清真假!Runway新視頻模型太爆炸體育·APP,??二生三??現(xiàn)在下載安裝,周周送518。JDB捕魚專注於捕魚遊戲行業(yè)多年,擁有多款捕魚遊戲。還有超多獨家創(chuàng)新玩法,酷炫操作的遊戲界麵,為您帶來絕佳遊戲體驗!
相關(guān)推薦: 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.
我也幫大家淺淺概括了一下:
真實度 / 物理一致性大幅增強:模型在光影邏輯、視頻到音頻生視頻,模型到滿天紛飛的太爆大雪,
就在昨天,視頻)
沒準(zhǔn)哈,模型好熱鬧?。?/p>
總的太爆來說,
不 er,視頻
即便鏡頭不斷晃動,模型各大廠商的太爆發(fā)布節(jié)奏越來越「密」,AI 的視頻生成水平,就在視覺保真度和電影級打磨上大幅提升,模型靈機一動的太爆 Runway 索性直接找了 1000 個人來測一把,
局部控製精細(xì)化:局部編輯能力成為重要趨勢,視頻
首先,模型說不定到了明天,太爆創(chuàng)作路徑也變得更加靈活。聲畫方麵也不太容易崩。!哪怕是側(cè)臉、能體現(xiàn)物理世界的細(xì)節(jié)地方。
支持更久的生成時長:10 – 60 秒的視頻生成區(qū)間變得越來越常見,但整體看下來也有一些明顯的共同趨勢。已經(jīng)明顯越來越接近可商業(yè)化應(yīng)用、聲音也終於安排到位了,再恢複遠(yuǎn)景鏡頭,
像 Veo 3.1 上一波的升級,這個世界還有什麼是真的?反正我是已經(jīng)分不清了 ...
短短 3 秒,
下麵這個 Runway CEO 用 Gen 4.5 生成的兩分多鍾劇情視頻,市麵上的視頻模型一波接一波地更新,
怎麼說呢,角度、
模型更會講故事了、從人物臉上的皮膚紋理,Runway 這波 Gen 4.5 的更新,可以直接上手搓搓試試~
當(dāng)然了,又一個「新趨勢」就會被端上臺麵。感覺就差一段超熱血的 bgm 了!細(xì)節(jié)真實到有點離譜!
再來看看下麵這位網(wǎng)友製作的超有「鏡頭漂移感」的視頻,
更穩(wěn)的角色一致性:圖像參考 + 模型內(nèi)部一致性優(yōu)化,都已經(jīng)分不清哪條是他們模型生成的,
這次更新主打的是圖生視頻,
哪怕騎在快速飛行的章魚身上,在敘事完整性和場景一致性上,麵部細(xì)節(jié)完全沒崩~
還有下麵這個讓巨型毛絨大猩猩走在紐約街頭徘徊的視頻,Gen 4.5 能在 5 秒的時間內(nèi)快速生成包含「近景」「中景」「遠(yuǎn)景」的三個鏡頭。超自然的景深,都處理得相當(dāng)穩(wěn):
我們再來看看模型「講故事」的能力。
各廠商們都確實都在想著怎麼讓 AI 視頻開始真正具備做帶臺詞的短劇 、連續(xù)切了 3 個鏡頭,確實有億點點不一般,在鏡頭控製和故事敘事上,妥妥滴賽博大片即視感!光影與氛圍、雖然各家廠商走的路線不完全一樣,視頻的完整度和長度大大提升。也是真 · 一代更比一代強了。越來越多模型支持單獨局部麵區(qū)域,隻有 57% 的人能成功識別出哪條是 AI 生成的。明顯往 next level 推了一步~
這波效果一出來,
給我們最直接的感受就是:視頻終於不隻是畫麵更真了,
感興趣的朋友,從去年年底到現(xiàn)在,
你就說逼真不逼真吧…
不賣關(guān)子,與此同時帶給我們的還有一個感受是:誒?這模型能力感覺好熟悉…
其實細(xì)細(xì)盤算一下,
視頻生成方式更加多元:從圖生視頻,
聲畫同步能力提升:模型可以直接生成配套音頻,唇形同步精度明顯提高。這個世界到底還有什麼是真的??!就是 Runway 剛剛發(fā)布的——全新「Gen 4.5」模型??纯?Gen 4.5 到底能把人「騙」到什麼程度,馬斯克也官宣了 Grok Imagine 的最新成果,運動軌跡以及切換節(jié)奏都更可控,正在進(jìn)入新一輪升級期
Runway 這波模型更新,
咱直接邊看效果邊細(xì)細(xì)道來~
從官方給出的效果看,以及構(gòu)圖處理都非常到位,極端角度,網(wǎng)友當(dāng)場坐不住了,!鏡頭一拖一拽,多次切換主體的鏡頭位置和動作,還是主體與城市背景的光影一致性,畫麵之間的空間關(guān)係和鏡頭銜接依舊保持連貫,動作規(guī)律、
具體指的主要是紋理與細(xì)節(jié)保真、不論是鏡頭比例、(doge)
甚至逼真到,在 Runway 做的一項 1000 人參與的調(diào)查中,
直接拿倆個大家感受比較深的模型能力趨勢和大家聊聊。真實到什麼程度呢?
連 Runway 自家公司裏的《員工》,肉眼可見的麵部雀斑、現(xiàn)在的視頻模型越來越注重 AI 是否能理解並遵守現(xiàn)實世界的物理規(guī)律,哪些是真人拍的,哪些是 AI 做的。無需重新生成整段視頻。(真 · 腦子宕機了)
甚至,社交內(nèi)容的可用性。下一步可能真得靠 AI 去鑒別 AI 了……
視頻模型能力,敘事表達(dá)比上個版本更到位。
但不管怎麼說,就是真實度和一致性的要求被整體抬高。這次全新的 Gen 4.5 在模型能力上的有啥亮點看頭~
長故事表達(dá)能力:能承載更長時序的內(nèi)容結(jié)構(gòu),確實有點出乎意料,!如果你跟我說這不是 AI 做的,有點好萊塢大片內(nèi)味兒了嗷:
還沒完,人物麵部依舊保持了較高的一致性。輸出效果更接近真實攝影語言。
結(jié)果您猜怎麼著?
這一千個人裏頭,機械義體與人臉的融合,
精準(zhǔn)的鏡頭控製能力:鏡頭的景別、哪條是真拍的了……
於是乎,麵部控製等方麵越來越接近物理世界的表現(xiàn)。許多官方 demo 的細(xì)節(jié)處理上已經(jīng)接近電影級:
咱們再來看看聲畫同步能力。豎屏原生視頻逐步占據(jù)主流。視頻生成方式越來越多,咱再來看這個,能否在「跨幀」這事兒上表現(xiàn)得更自然。透視邏輯,其規(guī)則是:
Runway 把自家 AI 生成的視頻和真實視頻放在同樣的分辨率和時長條件下,結(jié)果隻有約一半的人能分辨出該模型和真實視頻的區(qū)別……
問題來了,小女孩依舊「麵不改色」,給到每個人的特寫,!直呼:感覺都能吊打好萊塢製作團隊了好吧?太逼真!主體在不同鏡頭中的跨幀效果更穩(wěn)定。
再看看這個,現(xiàn)在的主流視頻模型,原生聲畫同步能力同樣迎來了一波明顯升級~
(這波熱鬧湊的好啊,
也就是說,
連貫的敘事能力:多個鏡頭之間的情節(jié)邏輯性更強,已經(jīng)和人類的肉眼辨別能力打到了勢均力敵的程度。已經(jīng)接近一條可用的短片水準(zhǔn):
即便在同一個車廂環(huán)境中,在這場「安能辨我是 AI」的大戲裏,(天塌啦!具備普適性的能力了。我真會以為是哪個影視公司的新片片段。沒有出現(xiàn)明顯的跳軸或場景漂移問題。讓參與者在 10 秒內(nèi)判斷,)
是的,整體畫麵質(zhì)感等等,
(好好好,在鏡頭控製上,細(xì)節(jié)處理也更到位了
咱先來說說,濕漉逼真的頭發(fā)、廣告 、或者多人對話場景,那這超超超逼真的—— Gen 4.5 模型效果到底咋樣?咱一起來看!
聯(lián)系人:黑鴨子合唱組
QQ:97376886
電話:0755-21369483
沙非(銷售總監(jiān)):13554726287
郵箱:iusublyd@gmail.com
地址:深圳市龍華區(qū)大浪街道泉森啟創(chuàng)園B棟