Python 설치 Bs4 및 사용 방법
① python 폴 더 에 들 어가 명령 을 실행 합 니 다(전 제 는 pip 명령 을 지원 합 니 다).
pip3 install Beautifulsoup4
② 리 턴 설치 완료 시 아래 빨간색 상자 의 내용 이 나타 나 면 설치 성공 을 의미 합 니 다.③ 실행 에 성공 할 수 있 는 지,cmd 실행 을 실행 할 수 있 는 지 검증 합 니 다.모듈 import bs4 리 턴 을 참조 하여 오류 가 발생 하지 않 으 면 설치 가 완료 되 었 음 을 증명 하고 정상적으로 사용 할 수 있 습 니 다.
설치 방법 2
(우리 회사 와 같은 각종 네트워크 제한 은 pip 를 사용 하면 설치 할 수 없고 retry 에서 순환 합 니 다)
① 홈 페이지 에 접속 하여 압축 파일 다운로드:Beautiful Soup 홈 페이지 다운로드 링크
② 압축 패 키 지 를 python 파일 에 압축 해제 하고 압축 해제 파일 에 들 어간 후 명령 을 입력 합 니 다(앞의 python 이 없어 서 는 안 됩 니 다).
python setup.py install
③ 실행 이 완료 되면 python 을 입력 하고 help('modules')를 입력 하면 현재 python 이 가지 고 있 는 모든 모듈 을 볼 수 있 습 니 다.다음 과 같 습 니 다.④ 위의 설치 가 완료 되면 bs4 를 정상적으로 도입 할 수 있 는 지 확인 하고 입력:import bs4 리 턴
설치 방법
(python 3 파트너 라면 위의 두 가지 방법 이 안 되 는 것 을 발견 할 수 있 습 니 다.help('modules')를 실행 해도 bs4 모듈 을 찾 을 수 없습니다.이 때 는 다음 과 같은 방법 을 사용 해 야 합 니 다)
① 위의 두 번 째 방법 을 똑 같이 진행 한 후 BeautifulSoup 4 폴 더 의 bs4 폴 더 를 python 설치 디 렉 터 리 의 lib 에 복사 합 니 다.
② python 설치 디 렉 터 리 에 있 는 Tools/script/2to 3.py 파일 도 python 설치 디 렉 터 리 에 있 는 lib 에 잘 라 냅 니 다.
③ cmd 에서 lib 디 렉 터 리 에 cd 를 넣 고 python 2to 3.py bs4-w 를 실행 하면 됩 니 다.
기본 용법:
import bs4
from bs4 import BeautifulSoup
html_doc = """<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
BeautifulSoup 대상 만 들 기
soup = BeautifulSoup(html_doc,“html.parser”)
문서 출력 포맷
soup.prettify()
제목 가 져 오기
soup.title.text
모든 태그 속성 가 져 오기
soup.a.attrs
어떤 태그 속성 이 있 는 지 판단 합 니 다.
soup.a.has_attr(‘class')
탭 의 하위 요소 가 져 오기
list(soup.p.children)
list(soup.p.children)[0].text
모든 탭 꺼 내기
soup.find_all(‘a')
for a in soup.find_all(‘a'):
print(a.attrs[‘href'])
지정 한 id 찾기
soup.find(id=‘link3')
모든 글자 의 내용 을 찾아내다
soup.get_text()
파 이 썬 의 Bs4 설치 및 사용 방법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 설치 Bs4 사용 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python의 None과 NULL의 차이점 상세 정보그래서 대상 = 속성 + 방법 (사실 방법도 하나의 속성, 데이터 속성과 구별되는 호출 가능한 속성 같은 속성과 방법을 가진 대상을 클래스, 즉 Classl로 분류할 수 있다.클래스는 하나의 청사진과 같아서 하나의 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.