Nvidia發展新的資料增強技術 可以大幅減少訓練人工智能模型所需要的資料量 研究人員僅使用來自大都會藝術博物館的一個小型資料集 就讓人工智能模型能夠創造出 過去可能需要數萬 甚至可能超過10萬訓練圖像 才能產生的精美圖像結果 而這項研究成果可用于廣泛的領域上 包括醫療保健等應用。
Nvidia將一種稱為ADA(Adaptive Discriminator Augmentation)的技術 應用在生成對抗網絡StyleGAN2模型上 使得訓練圖像的資料量 可大幅減少10到20倍 而且獲得同樣良好的效果。生成對抗網絡(GAN)的特性之一 便是訓練資料越多 模型產生的結果越好 生成對抗網絡由生成器(Generator)與判別器(Discriminator)兩個組件組成 生成器負責合成圖像 而判別器則要識別出圖像真偽 并反饋有用的參數給生成器 使得生成器之后能夠產生更好的結果。
但是一旦訓練資料不足 判別器便無法提供生成器足夠的信息產生好結果 就像是新手教練沒有夠多的經驗指導球員 球員也就難以精進球技一樣。因此生成對抗網絡通常需要5萬到10萬的訓練圖像 才能訓練出高品質的模型 但問題是 在許多使用案例上 并沒有足夠多的樣本圖像可以取用 僅以數千張圖像訓練生成對抗網絡 通常無法產生逼真的結果 而且會出現過適(Overfitting)的現象。
過去的研究也曾經以資料增強的方法 減少訓練生成對抗網絡所需要的資料量 但是結果并不好 因為生成對抗網絡反而學習了圖像旋轉變形等失真情形 無法產生逼真的合成圖像。而現在Nvidia所提出的ADA方法 可以適應性地應用資料增強方法 避免過適現象 而使得StyleGAN2等模型 可以使用更少的訓練圖像 并獲得良好的結果。
研究人員將這項結果應用在過去因為訓練資料太少 而難以實現的使用案例上 像是藝術家便使用StyleGAN進行創作 產生出各種精美繪畫 或是以傳奇插畫家Osamu Tezuka的風格 搭建新的漫畫 Adobe也應用該項技術 提供新的人工智能工具Neural Filters。
研究人員也提到 該項技術還有望應用在醫療保健領域 因為罕見疾病的醫學圖像很少 而且每個案例差異度很大 要大量收集有用的病理切片資料集很困難 而使用ADA技術的生成對抗網絡 則可改善這樣的問題。責任編輯:YYX