Load Model

model.save()

학습 결과를 공유하고, 저장하기 위해 필요한 함수

학습의 결과를 저장하기 위한 함수
모델 형태(architecture)와 파라메터를 저장
모델 학습 중간 과정의 저장을 통해 최선의 결과 모델을 선택
만들어진 모델을 외부 연구자와 공유하여 학습 재연성 향상

# model's state_dict
print("Model's state_dict:")
for param_tensor in model.state_dict():
	print(param_tensor, "\t", model.state_dict([param_tensor].size())

torch.save(model.state_dict(), os.path.join(MODEL_PATH, "model.pt"))

# 같은 모델의 형태에서 파라메터만 load 
new_model = TheModelClass() new_model.load_state_dict(torch.load(os.path.join(MODEL_PATH, "model.pt")))

#모델의 architecture와 함께 저장
torch.save(model, os.path.join(MODEL_PATH, "model.pt"))
model = torch.load(os.path.join(MODEL_PATH, "model.pt"))

checkpoints

학습의 중간 결과를 저장하여 최선의 결과를 선택
earlystopping 기법 사용시 이전 학습의 결과물을 저장
loss와 metric 값을 지속적으로 확인 저장
일반적으로 epoch, loss, metric을 함께 저장하여 확인
colab에서 지속적인 학습을 위해 필요

import torch
torch.save({ 'epoch': e,
	'model_state_dict': model.state_dict(),
	'optimizer_state_dict': optimizer.state_dict(),
    	'loss': epoch_loss},
	f"saved/checkpoint_model_... .pt")
    
checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

Transfer Learning

다른 데이터셋으로 만든 모델을 현재 데이터에 적용
일반적으로 대용량 데이터셋으로 만들어진 모델의 성능 ↑
현재의 DL에서는 가장 일반적인 학습 기법
backbone architecture가 잘 학습된 모델에서 일부분만
변경하여 학습을 수행함

Freezing

pretrain model 활용 시 모델의 일부분을 freezing 시킨다.

vgg = models.vgg16(pretrained=True).to(device)
class MyNewNet(nn.Module):
    def __init__(self):
	super(MyNewNet, self).__init__()
    	self.vgg19 = models.vgg19(pretrained=True)
        self.linear_layers = nn.Linear(1000, 1)
	# Defining the forward pass
    def forward(self, x):
	x = self.vgg19(x)
	return self.linear_layers(x)

#Freezing
for param in my_model.parameters():
	param.requires_grad = False
for param in my_model.linear_layers.parameters():
	param.requires_grad = True

Montitoring Tools

학습 시간은 길고, 기록하는 도구들이 필요하다.

Print문 활용
Tensorboard
Weights and Biases

Tensorboard

TensorFlow의 프로젝트로 만들어진 시각화 도구
학습 그래프, metric, 학습 결과의 시각화 지원
PyTorch도 연결 가능→DL 시각화 핵심 도구

특징
- scalar : metric 등 상수 값의 연속(epoch)을 표시
- graph : 모델의 computational graph 표시
- histogram : weight 등 값의 분포를 표현
- Image : 예측 값과 실제 값을 비교 표시
- mesh : 3d 형태의 데이터를 표현하는 도구

Weights & Biases

머신러닝 실험을 원활히 지원하기 위한 상용도구
협업, code versioning, 실험 결과 기록 등 제공
MLOps의 대표적인 툴로 저변 확대 중

Multi-GPU

Hyperparameter Tuning

PyTorch Troubleshooting

Author And Source

이 문제에 관하여(부스트캠프 Week3 Pytorch(2)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@dayday/부스트캠프-Week3-Pytorch2

우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)

부스트캠프 Week3 Pytorch(2)