Linux 에서 자주 사용 하 는 명령 및 정규 표현 식 - The learning notes of the biostar handbook (2)
디 렉 터 리 조작 명령
파일 조작 명령
cp [ ] [ ]
mv [ ] [ ]
touch filename
cat filename
more filename
압축 및 압축 풀기 명령
tar [ ] [ ]
tar -zxvf filename
압축 하여 생 성 할 수 있 습 니 다. tar. gz 의 파일 은 tar -cxvf filename.tar.gz filename
- c: 압축 파일 만 들 기 - x: 압축 해제 - t: 내용 보기 - r: 압축 파일 끝 에 파일 추가 - u: 원래 압축 파일 의 파일 을 업데이트 하 는 것 은 독립 된 명령 입 니 다.압축 해 압 은 모두 그 중 하 나 를 사용 해 야 하 며, 다른 명령 과 연결 할 수 있 지만, 그 중 하나만 사용 할 수 있다.아래 의 매개 변 수 는 필요 에 따라 파일 을 압축 하거나 압축 을 풀 때 선택 할 수 있 습 니 다. -z: gzip 속성 이 있 는 - j: bz2 속성 이 있 는 - Z: copress 속성 이 있 는 - v: 모든 과정 표시 - O: 파일 을 표준 출력 으로 풀 고 tar. bz2 끝 에 있 는 파일 이 라면 명령 으로 압축 풀기 tar -xjvf filename.tar.bz2
압축 명령 tar -cjf filename.tar.bz2
"|" 파이프 문자이전 명령 의 표준 출력 결 과 를 다음 명령 의 표준 으로 입력 합 니 다.
실례 시범
디 렉 터 리 만 들 기 ~ / biostarhandbook / lec 03
mldir -p ~/biostarhandbook/lec03
디 렉 터 리 에 들 어가 기 cd biostarhandbook/lec03
파일 다운로드: SGDfeatures. tab 및 SGDfeatures.README wget https://downloads.yeastgenome.org/curation/chromosomal_feature/SGD_features.tab
wget https://downloads.yeastgenome.org/curation/chromosomal_feature/SGD_features.README
디 렉 터 리 아래 파일 보기
ls -l
총 사용량 3192- rw - rw - r -- 1 * * * * 1557 11 월 19 2014 SGDfeatures. README - rw - rw - r -- 1 * * * * * 3264490 1 월 14 2017 SGDfeatures.tab
현재 있 는 디 렉 터 리 보이 기
pwd
두 파일 을 압축 하여 gz 형식 으로 압축 합 니 다.cd ..
tar -czvf lec03.tar.gz lec03
ls
# lec03 lec03.tar.gz
압축 풀기
tar -xzvf lec03.tar.gz
SGD 보기features. tab more SGD_features.tab
cat 명령 으로 파일 보기 cat SGD_features.tab
wc 명령 으로 SGD 보기features. tab 파일 의 줄 수, 글자 수, 문자 수 cat SGD_features.tab | wc
cat 명령 의 표준 출력 을 wc 의 표준 입력 으로 16454 425719 3264490줄 만 보면
cat SGD_features.tab | wc -l
16454 파일 의 머리 10 줄 보기
cat SGD_features.tab | head
grep 와 정규 표현 식grep 를 초보 적 으로 배 운 후에 grep 는 우리 가 자주 사용 하 는 텍스트 프로그램 에서 의 검색 과 교체 도구 와 유사 하고 강력 한 정규 표현 식 을 지원 하기 때문에 grep 의 기능 이 매우 강해 집 니 다.
grep
grep 는 일치 하 는 패턴 의 내용 을 표준 으로 입력 하 는 파일 을 필터 합 니 다. 강력 한 텍스트 검색 도구 입 니 다. 정규 표현 식 으로 텍스트 를 검색 하고 일치 하 는 줄 을 인쇄 할 수 있 습 니 다.구체 적 인 매개 변 수 는
man grep
볼 수 있 습 니 다.실례 시범
SGD 찾기features. tab 파일 이 "YAL 060 W" 줄 과 일치 합 니 다
cat SGD_features.tab | grep YAL060W
grep - i pattern files: 대소 문 자 를 구분 하지 않 고 검색 합 니 다.기본 상황 구분 대소 문자, grep - l pattern files: 일치 하 는 파일 이름 만 표시 합 니 다. grep - L pattern files: 일치 하지 않 는 파일 이름 을 표시 합 니 다. grep - w pattern files: 문자열 의 일부분 이 아 닌 전체 단어 만 일치 합 니 다 (예 를 들 어 'magical' 이 아 닌 'magic' 과 일치 합 니 다). grep - C number pattern files: 일치 하 는 컨 텍스트 는 각각 [number] 줄 을 표시 합 니 다.grep pattern 1 | pattern 2 files: pattern 1 또는 pattern 2 와 일치 하 는 줄 을 표시 합 니 다. grep pattern 1 files | grep pattern 2: pattern 1 과 일치 하 는 줄 을 표시 합 니 다.grep - n pattern files 는 줄 번호 정 보 를 표시 합 니 다 grep - c pattern files 는 총 줄 수 grep - v pattern files 에서 일치 하 는 항목 이 없 는 줄 을 찾 을 수 있 습 니 다.Dubious 가 포함 되 지 않 은 총 줄 수 보기
cat SGD_features.tab | grep -v Dubious | wc -l
15737 입 출력
Linux 의 표준 입 출력
설비.
장치 파일 이름
파일 설명자
유형
건반
/dev/stdin
0
표준 입력
모니터
/dev/stdout
1
표준 출력
모니터
/dev/stderr
2
표준 오류 출력
출력 방향 변경
유형
기호.
역할.
표준 출력 재 설정
명령 > 파일
덮어 쓰 는 방식 으로
명령 > > 파일
추가 적 인 방식 으로
표준 오류 출력 방향 변경
오류 명령 2 > 파일
덮어 쓰 는 방식 으로
오류 명령 2 > > 파일
덮어 쓰 는 방식 으로
실례 시범
일치 하 는 줄 을 파일 로 출력 하 는 방법 입 니 다.grep 명령 의 기본 표준 출력 디 스 플레이, 즉 / dev / stdout 입 니 다. 파일 로 저장 하려 면 출력 을 다시 설정 해 야 합 니 다 >
cat SGD_features.tab | grep YAL060W > match.tab
ls
match.tab SGD_features.README SGD_features.tab match. tab 보기
more match.tab
gene 와 일치 하 는 줄 수 보기 cat SGD_features.tab | grep gene | wc -l
2093 cut 명령 을 이용 하여 두 번 째 열 에 있 는 ORF 와 일치 하 는 줄 을 캡 처 하고 두 번 째 열의 머리 10 줄 을 먼저 봅 니 다
cat SGD_features.tab | cut -f 2 | head
- d: 필드 구분자 지정, 기본 값 은 탭 문자 - f: 표시 할 필드 - f1 지정: 첫 번 째 필드 표시 - f 1, 3 첫 번 째 와 세 번 째 - f 1 - 3 첫 번 째 부터 세 번 째 - b: 바이트 수 - c: 문자 캡 처cat SGD_features.tab | cut -f 2 | grep ORF | head
일치 하 는 총 줄 수 cat SGD_features.tab | cut -f 2 | grep ORF | wc -l
를 확인 하 는 동시에 여러 열 cat SGD_features.tab | cut -f 2,3,4 | grep ORF | head
을 캡 처 하여 Dubious 가 함 유 된 줄 cat SGD_features.tab | cut -f 2,3,4 | grep ORF | grep -v Dubious | wc -l
을 제거 합 니 다.cat SGD_features.tab | awk '{print $2}' | grep ORF | head
cat SGD_features.tab | awk '{print $2,$3,$4}' | grep ORF | head
두 번 째 열 을 type. txt 파일
cat SGD_features.tab | cut -f 2 > type.txt
로 캡 처 하여 type. txt 항목 을 연속 정렬 하고 첫 번 째 10 개 cat type.txt | sort | head
를 찾 아 같은 항목 을 1 개 cat type.txt | sort |uniq | head
로 표시 합 니 다. 중복 항목 의 개 수 를 표시 합 니 다 cat type.txt | sort | uniq -c | head
표시 항목 의 종류 cat type.txt | sort | uniq -c | wc -l
정규 표현 식bash 의 정규 표현 식 은 기본 정규 표현 식 과 확장 정규 표현 식 을 포함 하여 원 하 는 문자열 과 일치 합 니 다.기본 정규 표현 식:
기호.
묘사 하 다.
.
줄 바 꿈 자 를 제외 한 단일 문자 와 일치 합 니 다.
^
앞 문자열 의 시작 과 일치 합 니 다.
$
앞 글자 의 끝 과 일치 합 니 다.
*
이전 문자 와 일치 하 는 0 개 이상
[]
괄호 안에 있 는 임의의 문자 와 일치 합 니 다.
[a-z][0-9][A-Z]
범위 내의 임의의 문자 와 일치 합 니 다.
[^]
괄호 안에 있 는 문 자 를 제외 한 문자 와 일치 합 니 다.
{n}{n,}
괄호 앞 문자 와 일치 하 는 문자 최소 n 글자
{n,m}
괄호 앞 문자 와 일치 하 는 문자 최소 n 글자, 최대 m 글자
<
경계 문자, 일치 하 는 문자열 시작
>
경계 문자
정규 표현 식 확장:
기호.
묘사 하 다.
+
이전 문자 와 일치 하 는 1 개 이상
?
이전 문자 와 일치 하 는 0 개 이상
|
혹시
()
단원 또는 조합
sed 및 awk
아직 공부 하고 있 습 니 다. 이해 하기 어 려 울 것 같 습 니 다. 특히 awk 는 정말 프로 그래 밍 언어 입 니 다.나중에 완 선 될 때 까지 기 다 려 라.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.