법연배
법연배
데이터 세트 정보
total articles: 2000
total paragraphs: 2000
total questions: 10000
long_answer: 8249 yesno: 1259 no_answer 492
pytorch_bert 사용
우선 구글의 ckpt를pytorch 형식으로 바꾸고 스크립트:github.com/huggingface…
convert 사용tf_checkpoint_to_pytorch.py 스크립트, PyTorch 저장 파일에서 BERT의 모든 TensorFlow 검사점 (특히 구글이 발표한 공식 훈련 모델) 을 변환할 수 있습니다.
이 스크립트는 TensorFlow checkpoint(bert model.ckpt로 시작하는 세 개의 파일)와 관련 프로필(bert config.json)을 입력하고 이 프로필에 PyTorch 모델을 만들고 PyTorch 모델의 TensorFlow checkpoint에서 권한을 불러오고 생성된 모델을 표준 PyTorch 저장 파일에 저장합니다. torch를 사용할 수 있습니다.load() 가져오기(extract features.py, run classifier.py 및 run squad.py의 예 참조).
이 변환 스크립트를 한 번만 실행하면 PyTorch 모델을 얻을 수 있습니다.그리고 TensorFlow checkpoint (bert model.ckpt로 시작하는 세 개의 파일) 를 무시할 수 있지만, 프로필 (bert config.json) 과 어휘표 파일 (vocab.txt) 을 반드시 보존해야 합니다. PyTorch 모델에도 이 파일들이 필요하기 때문입니다.
이 특정한 변환 스크립트를 실행하려면 TensorFlow와 PyTorch를 설치해야 합니다.이 라이브러리의 나머지 부분은 PyTorch만 있으면 됩니다.
변환 예:
(tf13) [root@gpu-4 chinese_L-12_H-768_A-12]
python ../convert_tf_checkpoint_to_pytorch.py --tf_checkpoint_path=bert_model.ckpt --bert_config_file=bert_config.json --pytorch_dump_path=pytorch_model.bin
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.