【大紀元記者殷瑞娜綜合報導】在週二(3月25日)的直播中,OpenAI首席執行官薩姆·奧特曼(Sam Altman),宣布了ChatGPT圖片生成功能,一年多來的首次重大升級。
這項新功能允許用戶,使用該公司的GPT-4o模型,直接在聊天機器人內生成和修改圖片。
GPT-4o長期以來,一直是人工智能聊天機器人平臺的基礎,但到目前為止,該模型只能生成和編輯文本,而不能生成和編輯圖片。
奧特曼表示,GPT-4o原生圖片生成功能,現已在ChatGPT和OpenAI的AI影片生成產品Sora中上線,供該公司每月200美元的Pro計畫訂閱者使用。該功能很快也會向ChatGPT的Plus和免費用戶,以及使用該公司API服務的開發人員推出。
與前代產品DALL-E 3不同的是,在生成圖片之前,GPT-4o會「思考」更長時間,從而可以生成更準確、更詳細的圖片。GPT-4o可以編輯現有圖片,包括其中有人的圖片,對它們進行轉換,或「修復」前景和背景元素等細節。
OpenAI表示,為了支援這項新的圖片功能,它使用公開資料,以及與Shutterstock等公司合作獲得的專有資料,對GPT-4o進行了訓練。
不過,該公司仍對透露過多有關其培訓過程的資訊,保持謹慎。許多生成式人工智慧供應商,將訓練資料視為競爭優勢。另外,訓練資料細節,可能引發與知識產權相關的訴訟。
OpenAI也採取了措施,來解決版權問題。它提供了一份退出表格,允許創作者要求將他們的作品,從其訓練數據集中刪除。
此外,該公司還表示,它尊重阻止其網頁抓取機器人,從網站收集包括圖像在內的訓練資料的請求。
Google最近在其旗艦型號之一Gemini 2.0 Flash中,引入了實驗性的原生圖片輸出,但該功能因缺乏防護而很快受到批評,該功能導致用戶能夠去除浮水印,並生成潛在的侵權內容。
相較之下,OpenAI聲稱,它有更嚴格的保護措施,來防止直接模仿在世藝術家的作品和版權材料。◇
這是一個什麽程度的創新呢?
[0] [0]