python 에서 urlparse 모듈 소개 및 사용 예시
3096 단어 pythonurlparse 모듈
urlparse 모듈 은 주로 url 의 인 자 를 분석 하 는 데 사 용 됩 니 다. url 을 일정한 형식 으로 나 누 거나 연결 합 니 다.urlparse 라 이브 러 리 는 url 을 각 구성 요소 로 분석 하고 file,ftp,http,https,imap,mailto,mms,news,Ntp,prospero,rsync,rtsp,rtspu,sftp,shttp,sips,snews,svn+ssh,telnet 등 거의 모든 형식 을 지원 합 니 다.
메모:홈 페이지 의 설명 에 따 르 면 Python 3.0 에서 이 라 이브 러 리 는 urllib.parse 로 바 뀌 었 습 니 다.
사용 설명
1.urlparse.urlparse
url 을 6 개 부분 으로 나 누 어 6 개의 문자열 항목 을 포함 하 는 원 그룹:프로 토 콜,위치,경로,파라미터,조회,세 션 을 되 돌려 줍 니 다.
import urlparse
url_change = urlparse.urlparse('https://i.cnblogs.com/EditPosts.aspx?opt=1')
print url_change
출력 결 과 는:
ParseResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', params='', query='opt=1', fragment='')
그 중 scheme 는 프로 토 콜 입 니 다. netloc 는 도 메 인 네 임 서버 입 니 다. path 상대 경로 params 는 매개 변수 이 고 query 는 조회 조건 입 니 다.
urlparse.parse_qs(urlparse.urlparse(url).query)
이것 은 urlparse 분할 을 가 져 온 원조 중 하나 입 니 다. urlparse.urlparse(url).query 검색 조건 가 져 오기parse_qs 몇 가지 실현
url parse 와 차이 가 많 지 않 습 니 다.url 을 5 부분 으로 나 누 어 5 개의 문자열 항목 을 포함 하 는 원 그룹 을 되 돌려 줍 니 다.프로 토 콜,위치,경로,조회,세 션.
import urlparse
url_change = urlparse.urlsplit('https://i.cnblogs.com/EditPosts.aspx?opt=1')
print url_change
SplitResult(scheme='https', netloc='i.cnblogs.com', path='/EditPosts.aspx', query='opt=1', fragment='')
그 중 scheme 는 프로 토 콜 입 니 다. netloc 는 도 메 인 네 임 서버 입 니 다. path 상대 경로 query 는 검색 조건 입 니 다.3.urlparse.urljoin
상대 적 인 주 소 를 url 로 조합 합 니 다.입력 에 제한 이 없습니다.시작 은 http://이 어야 합 니 다.그렇지 않 으 면 앞 을 조합 하지 않 습 니 다.
import urlparse
new_url = urlparse.urljoin('https://baidu.com/ssss/','88888')
print new_url
출력https://baidu.com/ssss/88888잘못된 정 보 를 입력 하면 new_url = urlparse.urljoin('122','88888') 결코 둘 을 합병 하지 않 을 것 이다. 출력
url parse url 뒤의 인자 가 져 오기
URL 을 지정 하면:http://url/api?param=2¶m2=4 매개 변수 이름과 매개 변수 값 을 가 져 오 려 면 python 표준 라 이브 러 리 urlparse 를 사용 할 수 있 습 니 다.
import urlparse
def qs(url):
query = urlparse.urlparse(url).query
return dict([(k,v[0]) for k,v in urlparse.parse_qs(query).items()])
print qs('http://url/api?param=2¶m2=4')
돌아 온 결과:{'param':'2','param2':'4'}
주의:이 모듈 의 parseqs 방법 은 2;5 버 전 은 존재 하지 않 습 니 다.2.5 이상 만 있 습 니 다.이 방법 을 호출 해 야 할 때 먼저 dir(urlparse)를 통 해 모듈 urlparse 에 해당 하 는 방법 이 있 는 지 확인 할 수 있 습 니 다.공식 문서 주소 http://docs.python.org/library/urlparse.html
총결산
이상 은 이 글 의 전체 내용 입 니 다.본 논문 의 내용 이 여러분 의 학습 이나 업무 에 어느 정도 참고 학습 가치 가 있 기 를 바 랍 니 다.궁금 한 점 이 있 으 시 면 댓 글 을 남 겨 주 셔 서 저희 에 대한 지지 에 감 사 드 립 니 다.
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
로마 숫자를 정수로 또는 그 반대로 변환그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다. 문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.