python 에서 urlparse 모듈 소개 및 사용 예시

3096 단어 pythonurlparse 모듈
간단 한 소개
urlparse 모듈 은 주로 url 의 인 자 를 분석 하 는 데 사 용 됩 니 다.  url 을 일정한 형식 으로 나 누 거나 연결 합 니 다.urlparse 라 이브 러 리 는 url 을 각 구성 요소 로 분석 하고 file,ftp,http,https,imap,mailto,mms,news,Ntp,prospero,rsync,rtsp,rtspu,sftp,shttp,sips,snews,svn+ssh,telnet 등 거의 모든 형식 을 지원 합 니 다.
메모:홈 페이지 의 설명 에 따 르 면 Python 3.0 에서 이 라 이브 러 리 는 urllib.parse 로 바 뀌 었 습 니 다.
사용 설명
1.urlparse.urlparse
url 을 6 개 부분 으로 나 누 어 6 개의 문자열 항목 을 포함 하 는 원 그룹:프로 토 콜,위치,경로,파라미터,조회,세 션 을 되 돌려 줍 니 다.

import urlparse
url_change = urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1')
print url_change
출력 결 과 는:

ParseResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', params='', query='opt=1', fragment='')
그 중 scheme 는 프로 토 콜 입 니 다.  netloc 는 도 메 인 네 임 서버 입 니 다.  path 상대 경로  params 는 매개 변수 이 고 query 는 조회 조건 입 니 다.

urlparse.parse_qs(urlparse.urlparse(url).query)
이것 은 urlparse 분할 을 가 져 온 원조 중 하나 입 니 다.  urlparse.urlparse(url).query   검색 조건 가 져 오기
parse_qs 몇 가지 실현
  • urlparse.parse_qs 사전 되 돌려 주기
  • urlparse.parse_qsl 반환 목록
  • 2. urlparse.urlsplit
    url parse 와 차이 가 많 지 않 습 니 다.url 을 5 부분 으로 나 누 어 5 개의 문자열 항목 을 포함 하 는 원 그룹 을 되 돌려 줍 니 다.프로 토 콜,위치,경로,조회,세 션.
    
    import urlparse
    url_change = urlparse.urlsplit('https://i.cnblogs.com/EditPosts.aspx?opt=1')
    print url_change
    
    SplitResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', query='opt=1', fragment='')
    그 중 scheme 는 프로 토 콜 입 니 다.  netloc 는 도 메 인 네 임 서버 입 니 다.  path 상대 경로 query 는 검색 조건 입 니 다.
    3.urlparse.urljoin
    상대 적 인 주 소 를 url 로 조합 합 니 다.입력 에 제한 이 없습니다.시작 은 http://이 어야 합 니 다.그렇지 않 으 면 앞 을 조합 하지 않 습 니 다.
    
    import urlparse
    new_url = urlparse.urljoin('https://baidu.com/ssss/','88888')
    print new_url
    출력https://baidu.com/ssss/88888
    잘못된 정 보 를 입력 하면  new_url = urlparse.urljoin('122','88888')    결코 둘 을 합병 하지 않 을 것 이다.   출력
    url parse url 뒤의 인자 가 져 오기
    URL 을 지정 하면:http://url/api?param=2¶m2=4 매개 변수 이름과 매개 변수 값 을 가 져 오 려 면 python 표준 라 이브 러 리 urlparse 를 사용 할 수 있 습 니 다.
    
    import urlparse
    def qs(url):
      query = urlparse.urlparse(url).query
      return dict([(k,v[0]) for k,v in urlparse.parse_qs(query).items()])
    print qs('http://url/api?param=2&param2=4') 돌아 온 결과:{'param':'2','param2':'4'}주의:이 모듈 의 parseqs 방법 은 2;5 버 전 은 존재 하지 않 습 니 다.2.5 이상 만 있 습 니 다.이 방법 을 호출 해 야 할 때 먼저 dir(urlparse)를 통 해 모듈 urlparse 에 해당 하 는 방법 이 있 는 지 확인 할 수 있 습 니 다.
    공식 문서 주소  http://docs.python.org/library/urlparse.html
    총결산
    이상 은 이 글 의 전체 내용 입 니 다.본 논문 의 내용 이 여러분 의 학습 이나 업무 에 어느 정도 참고 학습 가치 가 있 기 를 바 랍 니 다.궁금 한 점 이 있 으 시 면 댓 글 을 남 겨 주 셔 서 저희 에 대한 지지 에 감 사 드 립 니 다.

    좋은 웹페이지 즐겨찾기