Skywork 推出 SkyReels-V2:提供無限長度產生的開源 AI 視訊模型
簡單來說 Skywork 的 SkyReels-V2 開源 AI 視訊模型可透過瀏覽器產生無限長度的視頻,支援故事創作、多主題影片合成等多種應用。
專注於人工智慧職場代理的平台, Skywork 宣布其 AI 影片創作工具, Skyreels 推出了 SkyReels-V2,這是一款開源 AI 影片模型,能夠直接透過網頁瀏覽器免費產生無限長的影片。該模型的權重和推理程式碼現已在 GitHub 上公開發布。 SkyReels-V2 採用擴散強制框架,該框架整合了多模態大型語言模型 (MLLM)、多階段預訓練、強化學習和擴散強制技術,以全面優化效能。該模型支援各種實際應用,包括故事生成、影像到影片的合成、攝影機方向控制以及透過 Skyreels-A2 系統進行多主題影片創作。
擴散強制框架能夠產生無限長的影片。 SkyReels-V2 支援文字轉影片 (T2V) 和影像轉影片 (I2V) 的生成任務,並且能夠以同步和非同步模式進行推理,並提供示範長影片產生的範例腳本。
SkyReels-V2 的一個顯著組件是 SkyCaptioner-V1,這是一個專為資料標註而設計的視訊字幕模型。該模型基於 Qwen2.5-VL-72B-Instruct 基礎模型和其他子專家字幕員的字幕結果進行訓練,並使用精心策劃的約 XNUMX 萬個均衡視訊資料集,以確保標註品質和概念平衡。
SkyCaptioner-V1 基於 Qwen2.5-VL-7B-Instruct 構建,並針對特定領域的視訊字幕性能進行了微調。使用 1,000 個樣本的測試集進行的評估表明,SkyCaptioner-V1 的平均準確率高於最先進的基線模型,尤其是在鏡頭相關領域表現優異。
基於先前大型語言模型的成功,開發人員專注於透過強化學習來提高生成影片的質量,解決已發現的限制,例如處理大型可變形運動的困難以及生成影片中偶爾出現的物理不一致。
為了提升效能,我們分別在 540p 和 720p 解析度下實作了兩個連續的監督微調 (SFT) 階段。初始 SFT 階段緊接著預訓練階段,之後進入強化學習階段。此 SFT 階段充當概念平衡訓練器,用於優化基礎模型的預訓練結果(該模型僅使用 24 幀/秒 (fps) 的視訊資料),並透過移除 FPS 嵌入組件來簡化架構。
SkyReels 是什麼?
SkyReels 是一個由人工智慧驅動的視訊創作平台,使用者可以透過結合文字提示、圖像和音訊輸入來製作短片、動畫和影片。該平台提供豐富的功能,包括 AI 生成角色、故事板工具、唇形同步功能、音樂創作和影片編輯,旨在簡化內容創作流程。此外,平台還包含 SkyReels-V1 和 SkyReels-V2 等先進的 AI 模型。
SkyReels-V1 是一個開源視訊基礎模型,專注於以人為本的短劇影片製作,支持 文字轉視頻 並將圖像轉換為視頻,同時準確呈現細微的面部表情並提供電影品質的視覺效果。
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
Ondo 將代幣化國債擴展至 XRP Ledger,透過瑞波的 RLUSD 穩定幣實現 OUSG 鑄造與贖回
重點速覽:去中心化金融平台 Ondo Finance 已將 XRP Ledger 納入其鏈上美國國債產品的支援網路。週二,Guggenheim Treasury Services 也在以 XRP 為基礎的區塊鏈上推出了其代幣化商業票據。

Sygnum 警告:Strategy 持倉不斷增加,恐使比特幣不再適合作為央行儲備
Sygnum 指出,採用策略型比特幣收購的公司,正透過槓桿操作累積過量的比特幣持倉,這削弱了比特幣作為央行儲備資產的適用性。該受監管的數位資產銀行表示,這類策略扭曲了流動性與市場情緒,對比特幣的穩定性及其被機構投資人廣泛採納帶來長期風險。

比特幣穩健持續,美國通膨降溫,川普宣傳中美貿易協議與聯準會降息
比特幣與美國股市在最新消費者物價指數數據再次優於預期後趨於穩定。有分析師認為,這一消息短期內不會影響加密貨幣市場,但也有觀點指出,通脹趨勢可能促使聯準會政策轉向,並在未來幾個月內「大幅推動」比特幣ETF資金流入。

加密貨幣價格
更多








