[PyTorch] PyTorch 기초 사용법

https://greeksharifa.github.io/pytorch/2018/11/10/pytorch-usage-03-How-to-Use-PyTorch/

torch.utils.data.DataLoader

학습에 사용될 전체 데이터를 가지고있다가, Train 함수가 1개의 batch를 요청 시 batch size 만큼 데이터를 꺼내서 준다.

ex) MNIST 데이터 불러오기


transform = transforms.Compose( [transforms.Resize( (28, 28) ),
								 transforms.ToTensor()
                                ]
                              )
                              
data_loader = DataLoader(datasets.MNSIT('data/MNIST',
                         				train=True,
                                        download=True,
                                        transform=transform )
                                        
                         batch_size = 64
                         shuffle=True
                         )
                         
print(data_loader)

transform 변수에 저렇게 transforms.Compose를 통해서 이미지(?)를 어떻게 변형시킬 것인지를 순차적으로 한꺼번에 적어준다.

torch.utils.data.DataLoader를 통해서 DataLoader를 만들어준다.
torchvision.datasets를 통해서 먼저 데이터를 받아주는것도 잊지말자!

[+] len(data_loader.dataset) = 실제 데이터의 개수
[+] len(data_loader) = 실제 데이터의 개수 / batch_size
ex) 내가 가진 데이터셋의 데이터개수가 64,000장이고 batch_size를 64로 설정했을때
len(data_loader)의 반환값은? \rightarrow 10,000
"뭐 약간 batch size만큼의 batch data를 10,000번 정도 줄게" 이런느낌?




작성중...

좋은 웹페이지 즐겨찾기