深耕一致性,生數科技全球上線Vidu Q1參考生圖

新京報貝殼財經訊(記者羅亦丹)記者9月10日獲悉,“清華係”AI公司生數科技旗下視頻大模型Vidu正式推出Vidu Q1參考生圖功能,以支持7張參考圖輸入打破國內生成上限,並在一致性、還原度等關鍵指標上正麵對標最近爆火的Nano Banana。

生數科技方麵表示,從單圖參考到多圖參考,是AI生圖在一致性上的不斷突破,“可以說沒有一致性,就沒有大規模商業化應用。”不同於單圖參考的單一限定條件,Vidu Q1參考生圖可以指定人物、場景、道具進行自由創作,通過多個參考對象實現對畫麵的更強可控。

如下圖的“讓萊昂納多坐在霍格沃茨學院的教室裏練習魔法。”輸入的多張參考圖中包含了人物、道具、服飾、配飾等多個主體,場景非常複雜。

從輸出的結果來看,Vidu Q1參考生圖嚴格遵循提示詞,人物發型、五官均保持與原圖一致,每個物品位置擺放正確,且比例合理。左側亮起的台燈照亮了萊昂納多的側臉和桌麵上攤開的書本,寵物海德薇站在紅色行李箱上毫無違和感,多個主體的融合高度一致。

生數科技方麵表示,作為Vidu首款參考生圖產品,Vidu Q1一經推出便實現對穀歌Nano Banana的全麵對標,在AI生圖這一巨頭雲集的賽道中展現出中國創業公司的硬核技術實力。Vidu Q1參考生圖的發布,是中國AI多模態領域的一次重要突破。它證明了中國團隊不僅能夠緊跟國際發展,更能在關鍵技術上實現差異化創新甚至局部超越。

校對 穆祥桐

漯河
上一篇:{loop type="arclist" row=1 }{$vo.title}