IT之家 6 月 28 日新闻 ,图像克日来自马克斯・普朗克合计机迷信钻研所、编纂标即MIT CSAIL 以及google的技术钻研者们钻研了一种操作 GAN 的新措施 DragGAN ,惟独点击拖拽,源拖用户就能“修正汽车的动鼠尺寸概况将人物的笑颜酿成皱眉”。当初该名目已经在 GitHub 中开源 ,图像有兴趣的编纂标即IT之家小过错们可从前往清晰。
DragGAN 是技术一个直不雅的图像编纂工具,用户惟独要操作图像中的源拖像素点以及倾向,就能快捷调解照片主体的动鼠位置、姿态、图像神色、编纂标即巨细以及角度等 。技术这种工具的源拖后劲主要表如今,从文本天生图像的动鼠家养智能并不总是能输入你想要的服从 ,以是用户可能在天生图像之后再妨碍重新编纂,而不用重更天生一个新的图像 。
研品评辩说文中揭示了一些演示案例,搜罗削减山峰的高度,修正模特的姿态以及衣服的长度以及形态,张开或者闭合狮子的嘴巴,以及将一总体的神色从平淡酿成微笑 。
钻研职员展现 ,他们的措施在基于 GAN 的操作中优于 SOTA ,并为图像编纂开拓了新倾向