Python 파충류 기초 설명 요청

1.요청 대상(URL)
URL 은 통일 자원 포 지 셔 닝 문자 라 고도 부 르 는데 인터넷 에서 웹 페이지 와 다른 자원 의 주 소 를 완전 하 게 묘사 하 는 방법 이다.windows 와 유사 한 파일 경로.

2.인터넷 주소 의 구성:
1.http://:이것 은 프로 토 콜,즉 HTTP 하이퍼텍스트 전송 프로 토 콜,즉 웹 페이지 가 인터넷 에서 전송 하 는 프로 토 콜 입 니 다.
2.mail:이것 은 서버 이름 입 니 다.메 일 서버 를 의미 하기 때문에 mail 입 니 다.
3.163.com:이것 은 도 메 인 이름 으로 사 이 트 를 찾 는 유일한 이름 입 니 다.
4.mail.163.com:이것 은 사이트 이름 으로 서버 이름+도 메 인 이름 으로 구성 되 어 있 습 니 다.
5./:이것 은 루트 디 렉 터 리 입 니 다.즉,사이트 이름 을 통 해 서버 를 찾 은 다음 에 서버 에 웹 페이지 의 루트 디 렉 터 리 를 저장 하 는 것 입 니 다.
6.index.html:이것 은 루트 디 렉 터 리 의 웹 페이지 입 니 다.
7.http://mail.163.com/index.html:이것 은 URL 이 라 고 하 는데 자원 포 지 셔 닝 문자,글로벌 주 소 를 통일 시 켜 인터넷 의 자원 을 포 지 셔 닝 하 는 데 사용 합 니 다.
3.요청 체(response)
전화 하 는 것 처럼 HTTP 가 서버 에 무슨 말 을 해 야 서버 가 정확 한 정 보 를 되 돌 릴 수 있 는 지 알 수 있 습 니 다.사실 클 라 이언 트 의 요청 은 서버 에 이러한 내용 을 알려 주 었 습 니 다.요청 줄,요청 머리,빈 줄,요청 데이터 입 니 다.

4.요청 방법(방법)
HTTP 요청 은 여러 가지 요청 방법 을 사용 할 수 있 지만 파충 류 는 주로 두 가지 방법 으로 GET 와 POST 방법 을 사용한다.
get 요청:일반적인 경우 서버 에서 만 데 이 터 를 가 져 오고 서버 자원 에 영향 을 주지 않 을 때 get 요청 을 사용 합 니 다.
post 요청:서버 에 데이터 전송(로그 인),파일 업로드 등 서버 자원 에 영향 을 미 칠 때 사용 합 니 다.
post 요청.
이상 은 사이트 개발 에서 자주 사용 하 는 두 가지 방법 이다.그리고 일반적으로 사용 원칙 을 따른다.그러나 일부 사이트 와 서버 는 반 파충류 체 제 를 만 들 기 위해 상식 적 으로 카드 를 내지 않 는 경우 도 많다.get 방법 을 사용 해 야 하 는 요청 은 반드시 post 요청 으로 바 꿔 야 할 수도 있다.이 는 상황 에 따라 결정 해 야 한다.
GET 와 POST 방법의 차이 점:
1.GET 는 서버 에서 데 이 터 를 가 져 오고 POST 는 서버 에 데 이 터 를 전송 합 니 다.
2.GET 요청 매개 변 수 는 모두 브 라 우 저 사이트 에 표 시 됩 니 다.즉,Get"요청 한 매개 변 수 는 URL 의 일부분 입 니 다.예 를 들 면: http://www.baidu.com/s?wd=Chinese
3.POST 요청 매개 변 수 는 요청 체 에서 메시지 길이 가 제한 되 지 않 고 암시 적 으로 보 내 며 보통 HTTP 서버 에 비교적 많은 데 이 터 를 제출 하 는 데 사 용 됩 니 다.요청 한 매개 변수 형식 은'Content-type'메시지 헤더 에 포함 되 어 있 으 며 요청 을 보 낼 때 제출 할 데이터 형식 을 가 리 킵 니 다.
주의:
사이트 제작 자 는 보안 문제 가 발생 할 수 있 기 때문에 Get 방식 으로 양식 을 제출 하지 않 는 다.예 를 들 어 로그 인 폼 에 Get 방식 을 사용 하면 사용자 가 입력 한 사용자 이름과 비밀 번 호 는 주소 표시 줄 에 남김없이 노출 된다.또한 브 라 우 저 는 과거 기록 정 보 를 기록 하여 계 정 이 안전 하지 않 은 요소 가 존재 합 니 다.
5.자주 사용 하 는 요청 헤더
요청 헤드 는 클 라 이언 트 가 서버 에 요청 을 보 낼 때 사용 하 는 인 코딩 과 내용 을 보 내 는 길 이 를 설명 하고 서버 에 로그 인 했 는 지,어떤 브 라 우 저 를 사용 하 는 지 알려 줍 니 다.
1.Accept:브 라 우 저 는 서버 에 자신 이 어떤 데이터 형식,문자,그림 등 을 받 아들 이 는 지 알려 줍 니 다.
2.Accept-charset:브 라 우 저 는 자신 이 받 은 문자 집합 을 설명 합 니 다.
3.Accept-Encoding:브 라 우 저 는 자신 이 받 은 인 코딩 방법 을 설명 합 니 다.보통 압축 방법 을 지정 합 니 다.압축 을 지원 하 는 지,어떤 압축 방법 을 지원 하 는 지(gzip,deflate,br)를 지정 합 니 다.
4.Accept-language:브 라 우 저 는 자신 이 받 은 언어 를 설명 합 니 다.
5.Authorization:권한 수여 정 보 는 서버 에서 보 낸 WWW-Authenticate 헤드 에 대한 응답 에 나타 납 니 다.
6.content-length 는 요청 메시지 의 본문 길 이 를 표시 합 니 다.
7.origin:요청 자원 의 시작 위 치 를 설명 합 니 다.
8.connection:이번 요청 을 처리 한 후 연결 을 끊 을 까요,계속 연결 할 까요?9.Cookie:WEB 서버 에 보 내 는 Cookie 콘 텐 츠 는 로그 인 여 부 를 판단 하 는 데 자주 사 용 됩 니 다.
9.Cookie:WEB 서버 에 보 내 는 Cookie 콘 텐 츠 는 로그 인 여 부 를 판단 하 는 데 자주 사 용 됩 니 다.
10.Host:클 라 이언 트 가 방문 하고 싶 은 WEB 서버 의 도 메 인/IP 주소 와 포트 번 호 를 지정 합 니 다.
11.If-Modified-since:클 라 이언 트 는 이 헤드 를 통 해 서버 에 자원 의 캐 시 시간 을 알려 줍 니 다.요청 한 내용 이 지 정 된 시간 후에 수정 을 거 쳐 야 되 돌아 갑 니 다.그렇지 않 으 면 304"Not Modified"응답 을 되 돌려 줍 니 다.
12.Pragma:"no-cache"값 을 지정 하면 서버 가 리 셋 된 문 서 를 되 돌려 야 합 니 다.프 록 시 서버 이 고 페이지 의 로 컬 복사 가 있 더 라 도.
13.Referer:서버 에 이 페이지 가 어느 페이지 에서 연결 되 었 는 지 알려 줍 니 다.
14.From∶발송 자의 이메일 주 소 를 요청 합 니 다.일부 특수 한 웹 클 라 이언 트 프로그램 에서 사용 하고 브 라 우 저 는 사용 하지 않 습 니 다.
15.(user-agent:브 라 우 저 는 자신의 신분 을 표시 합 니 다(어떤 브 라 우 저 입 니까?)
16.upgrade-insecure-requests∶브 라 우 저 는 http 요청 에서 https 요청 으로 자동 으로 업그레이드 하 는 것 을 지원 하 며,이후 요청 을 보 낼 때 https 를 사용 합 니 다.
UA-Pixels,uA-Color,uA-oS,UA-CPU:일부 버 전의 IE 브 라 우 저 에서 보 내 는 표준 이 아 닌 요청 헤드 는 화면 크기,색상 깊이,운영 체제 와 CPU 유형 을 표시 합 니 다.
6.requests 모듈 보기 요청 체
우리 가 requests 모듈 로 데 이 터 를 요청 할 때 항소 청구 헤더 의 필드 정 보 를 가지 고 우리 의 파충류 코드 를 위장 합 니 다.같은 위장 후에 우 리 는 코드 를 통 해 요청 체 의 필드 정 보 를 볼 수 있 습 니 다.다음 과 같은 몇 가지 흔 한 속성 이 있 습 니 다.

#       url  
response.request.url
#            
response.request.headers
#           
response.request.method
파 이 썬 파충류 기초 설명 요청 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 요청 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 찾 아 보 세 요.앞으로 많은 응원 부 탁 드 리 겠 습 니 다!

좋은 웹페이지 즐겨찾기