-
RPG
(開源文生圖框架)
鎖定
RPG是北大、斯坦福、以及Pika Labs聯合研發的新開源文生圖框架。
2024年2月17日報道,北大、斯坦福、以及Pika Labs發佈了新的開源文生圖框架,利用多模態LLM的能力成功解決文生圖兩大難題,表現超越SDXL和DALL·E 3。
[1]
RPG發展歷程
2024年2月17日報道,北大、斯坦福、以及Pika Labs發佈了新的開源文生圖框架,利用多模態LLM的能力成功解決文生圖兩大難題,表現超越SDXL和DALL·E 3。
[1]
RPG框架使用
給出多個屬性和關係的多個對象,模型會給出整個畫面的結構、人與物品的關係。
[1]
一個穿着橙子連衣裙的綠色雙馬尾女孩坐在沙發上,左邊的大窗户下
RPG區別對比
面對關係複雜的多個對象,模型給出的整個畫面的結構、人與物品的關係都非常合理,使觀者眼前一亮。
[1]
此外,還可以將區域擴散擴展為分層格式,將特定子區域劃分為更小的子區域。
如下圖所示,當增加區域分割的層次結構時,RPG可以在文本到圖像的生成方面實現顯著的改進。這為處理複雜的生成任務提供了一個新的視角,使我們有可能生成任意組成的圖像。
[1]
- 參考資料
-