생물정보학 초심자를 위한 Bash 명령: 1부
2777 단어 linuxbashbioinformatics
1. Fasta 시퀀스 계산
이 명령은 fasta 파일에서 fasta 시퀀스를 계산하는 데 도움이 됩니다.
grep -c ">" <fasta-file-name>
예:
grep -c ">" sequences.fasta
2. 빈 줄 세기
파일의 빈 줄/빈 줄을 계산하려면 이 명령이 도움이 될 것입니다.
grep -c "^$" <file-name>
예:
grep -c "^$" sequences.fasta
3. 빈 줄 제거
파일에서 빈/빈 줄을 제거하려면 이 명령이 유용합니다.
sed -i "/^$/d" <file-name>
예:
sed -i "/^$/d" sequences.fasta
4. 여러 CSV 파일 병합
헤더가 같은 CSV 파일이 여러 개인 경우 이 명령을 사용하여 병합할 수 있습니다. 아래 명령은 두 부분으로 구성됩니다.
head -n 1 <a-csv-file> > combined.out
부분에서 <a-csv-file>
를 .csv 파일로 바꿉니다. 더 나은 이해를 위해 예제 섹션을 확인하십시오.head -n 1 <a-csv-file> > combined.out && tail -n+2 -q *.csv >> combined.out
이 명령을 실행한 후
combined.out
파일의 이름을 combined.csv
로 바꿉니다.예시:
4개의 csv 파일이 있다고 가정합니다.
file1.csv
file2.csv
file3.csv
file4.csv
따라서 다음을 실행해야 합니다.head -n 1 file1.csv > combined.out && tail -n+2 -q *.csv >> combined.out
그러면 새combined.out
파일이 표시됩니다. 이 파일의 이름을 combined.csv
로 바꾸는 것을 잊지 마십시오.5. 모든 zip 파일의 압축을 풉니다.
이 명령을 사용하면 폴더에 있는 모든 .zip 파일의 압축을 쉽게 풀 수 있습니다.
unzip "*.zip"
그러나 이 명령은 압축을 푼 후 .zip 파일을 삭제하지 않습니다. 동일한 파일 형식(.zip, .gz, .txt)의 모든 파일을 삭제하는 명령을 찾고 있다면 아래로 스크롤하십시오.
6. 동일한 파일 형식의 모든 파일 삭제
동일한 파일 형식을 가진 여러 파일을 삭제하려는 경우 이 두 명령이 유용할 것입니다.
먼저 제거할 파일을 확인합니다.
find . -name "*<file-type>" -type f
그런 다음 삭제 명령을 실행합니다.
find . -name "*<file-type>" -type f -delete
더 나은 이해를 위해 예제 부분을 확인하십시오.
예시:
모든
.gz
파일을 삭제하려는 경우 명령은 다음과 같아야 합니다.find . -name "*.gz" -type f
find . -name "*.gz" -type f -delete
모든 .zip 파일을 삭제하려면:
find . -name "*.zip" -type f
find . -name "*.zip" -type f -delete
지금은 여기까지입니다. 댓글 섹션에 자유롭게 bash 명령을 추가하면 기사에 추가하겠습니다.
Reference
이 문제에 관하여(생물정보학 초심자를 위한 Bash 명령: 1부), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/abdnahid/bash-commands-for-bioinformatics-beginners-2m8j텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)