在AI科技界, DALL-E 和 ChatGPT 等生成式AI在近半年來引發了熱烈的討論,而其背後的GPT模型也成為眾多科技研究者的焦點。而18日由德國馬克斯·普朗克電腦科學研究所研究團隊發布的一篇文章介紹了另一種AI模型—生成對抗網路(GAN),並以此為基礎開發出了一款名為DragGAN的AI修圖軟體。
與GPT模型不同的是,GAN透過兩個神經網路之間的相互對抗來學習。生成網絡不斷偽造資訊並試圖突破鑑別網路的審查,GAN能夠產生令人難以分辨真偽的結果,而DragGAN則在此基礎上添加了一個新的特性:在圖像生成後,它允許用戶以拖曳的方式微調圖像的細節,以提高生成圖像的準確度。
Photoshop等傳統的圖像編輯工具只能對現有的圖像內容進行扭曲或裁剪,而DragGAN則能生成新的圖像內容以最大程度地吻合用戶意圖。如果用戶想要讓照片中的人物微笑,DragGAN不僅能拉伸人物的嘴唇,還能生成牙齒,並相應地調整臉部表情。
透過拖曳圖像進行修圖的 DragGAN(圖/DragGAN)
DragGAN拖曳的操作方式直觀易懂,使用者能輕鬆快速地修正或生成圖像,同時GAN系統也消除了GPT圖像生成軟體的隨機性。而如果將DragGAN與GPT圖像生成軟體配合使用,用戶將能夠更快速、更準確地得到他們心中想要的輸出結果。
目前,由德國馬克斯·普朗克電腦科學研究所、薩爾大學電腦科學中心、麻省理工學院、賓夕法尼亞大學,以及Google共同研發的DragGAN仍處於初步樣本階段,並未提供線上使用或軟體下載。然而,隨著DragGAN這款圖像生成及編輯工具的問世,設計行業將再次面臨重大的挑戰,同時也將為科技行業帶來新的課題與機遇。