생물정보학 초심자를 위한 Bash 명령: 1부

면책 조항: 이 기사는 내가 정기적으로 사용하는 유용한 bash 명령 모음입니다.

1. Fasta 시퀀스 계산



이 명령은 fasta 파일에서 fasta 시퀀스를 계산하는 데 도움이 됩니다.

grep -c ">" <fasta-file-name>


예: grep -c ">" sequences.fasta

2. 빈 줄 세기



파일의 빈 줄/빈 줄을 계산하려면 이 명령이 도움이 될 것입니다.

grep -c "^$" <file-name>


예: grep -c "^$" sequences.fasta

3. 빈 줄 제거



파일에서 빈/빈 줄을 제거하려면 이 명령이 유용합니다.

sed -i "/^$/d" <file-name>


예: sed -i "/^$/d" sequences.fasta

4. 여러 CSV 파일 병합



헤더가 같은 CSV 파일이 여러 개인 경우 이 명령을 사용하여 병합할 수 있습니다. 아래 명령은 두 부분으로 구성됩니다.head -n 1 <a-csv-file> > combined.out 부분에서 <a-csv-file>를 .csv 파일로 바꿉니다. 더 나은 이해를 위해 예제 섹션을 확인하십시오.

head -n 1 <a-csv-file> > combined.out && tail -n+2 -q *.csv >> combined.out  


이 명령을 실행한 후 combined.out 파일의 이름을 combined.csv로 바꿉니다.

예시:
4개의 csv 파일이 있다고 가정합니다.file1.csvfile2.csvfile3.csvfile4.csv따라서 다음을 실행해야 합니다.head -n 1 file1.csv > combined.out && tail -n+2 -q *.csv >> combined.out그러면 새combined.out 파일이 표시됩니다. 이 파일의 이름을 combined.csv로 바꾸는 것을 잊지 마십시오.

5. 모든 zip 파일의 압축을 풉니다.



이 명령을 사용하면 폴더에 있는 모든 .zip 파일의 압축을 쉽게 풀 수 있습니다.

unzip "*.zip"


그러나 이 명령은 압축을 푼 후 .zip 파일을 삭제하지 않습니다. 동일한 파일 형식(.zip, .gz, .txt)의 모든 파일을 삭제하는 명령을 찾고 있다면 아래로 스크롤하십시오.

6. 동일한 파일 형식의 모든 파일 삭제



동일한 파일 형식을 가진 여러 파일을 삭제하려는 경우 이 두 명령이 유용할 것입니다.
먼저 제거할 파일을 확인합니다.

find . -name "*<file-type>" -type f 


그런 다음 삭제 명령을 실행합니다.

find . -name "*<file-type>" -type f -delete 


더 나은 이해를 위해 예제 부분을 확인하십시오.

예시:
모든 .gz 파일을 삭제하려는 경우 명령은 다음과 같아야 합니다.

find . -name "*.gz" -type f
find . -name "*.gz" -type f -delete


모든 .zip 파일을 삭제하려면:

find . -name "*.zip" -type f
find . -name "*.zip" -type f -delete



지금은 여기까지입니다. 댓글 섹션에 자유롭게 bash 명령을 추가하면 기사에 추가하겠습니다.

좋은 웹페이지 즐겨찾기