【2024年02月17日訊】(記者殷瑞娜綜合報導)週四(2月15日),OpenAI推出了一款可以根據文字指令,製作短視頻的工具,這是該公司在生成人工智能領域的一次新的飛躍。
這款「從文字到視頻」的AI模型名為Sora。美聯社報導說,Sora並不是同類產品中的第一個,Google、Meta和新創公司Runway ML等公司,也展示了類似的技術。
透過簡單的提示,Sora即可製作令人驚歎的視頻。OpenAI網站,展示了一些根據文字提示製作的高品質影片。
OpenAI稱,Sora能夠生成包含多個角色、特定運動類型,以及主體和背景準確細節的複雜場景,還能根據提示,生成能表達生動情感的引人注目的角色。
美聯社報導說,這些影片令觀察人士感到震驚,同時也引發了人們對其道德和社會影響的擔憂。
OpenAI也承認,當前的模型存在弱點。它可能難以準確模擬複雜場景的物理原理,並且可能無法理解具體實例的因果關係。例如,一個人咬了一口餅乾,但之後餅乾可能沒有咬痕。
該模型還可能混淆提示的空間細節,例如混淆左和右,並且可能難以精確描述,隨著時間推移發生的事件。
該工具尚未公開發布。OpenAI表示,在向公眾發布新工具之前,它將採取一些安全措施。例如,與世界各地的政策制定者、教育工作者和藝術家合作,來了解人們的擔憂。
與網絡安全專業人員「紅隊成員」合作,對該模型進行對抗性測試。OpenAI稱,他們還在建立工具,來幫助檢測誤導性內容。
OpenAI透露的有關該模型建構方式的資訊有限,也沒有透露使用哪些圖像和視頻來源,來訓練Sora。
去年12月,該公司因使用受版權保護的文字作品,來訓練ChatGPT,而被一些作者和《紐約時報》起訴。
OpenAI向美聯社支付了一筆未公開的費用,以獲取其文本新聞檔案的許可。◇