SketchyGAN:Towards Diverse and Realistic Sketch to Image Synthesis
CVPR2018
arXiv , pdf
어떤 물건?
스케치에서 (50레벨) 사진을 생성하는 GAN, Sketchy GAN을 제시했다.
선행 연구와의 차이
기술과 수법의 관건
Sketchy Database Augmentation
Edges vs Sketches
Data Collection
Flickr에서 각 범주에서 10만 장의 이미지를 가져옵니다.
Edge Map Creation
테두리 검출, 이치화, 축소 등을 통해 제작된다.
5.1. “Both sketches and edge maps are converted into distance fields.”따라서 스케치 이미지와 테두리 이미지를distancefield로 변환하여 학습합니다.
Training Adaptation from Edges to Sketches
학습의 시작은 가장자리 지도와 쌍을 이루는 이미지를 통해 학습을 하고 천천히 스케치와 쌍을 이루는 이미지에 따라 학습하는 방식으로 스케줄링을 한다.
이렇게 되면 테두리 맵을 통해pre-train을 할 필요가 없다.
참고로 Inception score에서 6.73 vs 7.90(pre-train and fine-tuning vs unified).
SketchyGAN
Masked Residual Unit (MRU)
이전 레이어의 피쳐 맵($x_i$)과 비교하여 가져온 이미지($I$)에서 새 피쳐 양 ($y_i$) 을 추출합니다.
※ 논문에서 Figure6 가공
z_i = f(Conv([m_i \odot x_i, I])) (4)
m_i = \sigma(Conv([x_i, I])) (5)
n_i = \sigma(Conv([x_i, I])) (6)
$m_i$는 입력 피쳐 매핑의 마스크입니다. $nui$는 입력한 특징지도와 새로운 특징지도를 통합하기 위한 마스크입니다.최종 출력은
y_i = (1 - n_i) \odot x_i + n_i \odot z_i (7)
논문의 공식(7)은 $y_i = (1 - n_i)\odot z_i + n_i\odot x_하지만 Figure7은 그렇다고 생각한다.Network Structure
네트워크 총도.
generator 부분에서 척도가 다른 스케치 이미지를 MRU에 입력합니다.
인코더 섹션과 디코더 섹션을 연결하는 Skip connection이 있습니다.
Objective Function
일반적인 손실 함수 외에 출력 이미지를 다양성을 가지게 하는 손실 함수 2개를 추가했다.
유효성 확인 방법
Comparison to Baselines
아래의 상황을 알 수 있다.
Component Analysis
손실 함수를 줄이면 이미지 품질이 저하됩니다(-GAN, -P, -DIV). 음영 오류가 발생합니다(L-AC).
Comparison between MRU and other structures
RU와 기타 구조(ResNet, Cascaded Refinement Network, DCGAN)를 비교합니다.
제안 방법의 점수가 가장 높으며 매개변수 수에 가까운 ResNet과 비교할 수 있습니다.
제시된 방법은 MRU를 통해 사진에서 주요 물체의 질이 비교적 높다.
점수상 GAN loss의 제안 수법만 가장 좋다.
Human Evaluation of Realism and Faithfulness
마지막으로 방법을 제시한 best output.
논쟁이 있습니까?
스케치에서 사진을 생성하는 GAN, Sketchy GAN을 제시했다.
스케치에 사용할 데이터 확장 방법을 제시했는데 Inception Score에서 이전의 방법을 초과했다.
다음 논문
GAN 기법
Reference
이 문제에 관하여(SketchyGAN:Towards Diverse and Realistic Sketch to Image Synthesis), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/d-ogawa/items/6b6e490e49e73fc55af1텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)