拖曳圖片就能修圖！ DragGAN使用另種AI生成系統

記者／陳誌頤

在AI科技界， DALL-E 和 ChatGPT 等生成式AI在近半年來引發了熱烈的討論，而其背後的GPT模型也成為眾多科技研究者的焦點。而18日由德國馬克斯·普朗克電腦科學研究所研究團隊發布的一篇文章介紹了另一種AI模型—生成對抗網路（GAN），並以此為基礎開發出了一款名為DragGAN的AI修圖軟體。

與GPT模型不同的是，GAN透過兩個神經網路之間的相互對抗來學習。生成網絡不斷偽造資訊並試圖突破鑑別網路的審查，GAN能夠產生令人難以分辨真偽的結果，而DragGAN則在此基礎上添加了一個新的特性：在圖像生成後，它允許用戶以拖曳的方式微調圖像的細節，以提高生成圖像的準確度。

Photoshop等傳統的圖像編輯工具只能對現有的圖像內容進行扭曲或裁剪，而DragGAN則能生成新的圖像內容以最大程度地吻合用戶意圖。如果用戶想要讓照片中的人物微笑，DragGAN不僅能拉伸人物的嘴唇，還能生成牙齒，並相應地調整臉部表情。

透過拖曳圖像進行修圖的 DragGAN（圖/DragGAN）

DragGAN拖曳的操作方式直觀易懂，使用者能輕鬆快速地修正或生成圖像，同時GAN系統也消除了GPT圖像生成軟體的隨機性。而如果將DragGAN與GPT圖像生成軟體配合使用，用戶將能夠更快速、更準確地得到他們心中想要的輸出結果。

目前，由德國馬克斯·普朗克電腦科學研究所、薩爾大學電腦科學中心、麻省理工學院、賓夕法尼亞大學，以及Google共同研發的DragGAN仍處於初步樣本階段，並未提供線上使用或軟體下載。然而，隨著DragGAN這款圖像生成及編輯工具的問世，設計行業將再次面臨重大的挑戰，同時也將為科技行業帶來新的課題與機遇。

分享此新聞：