Python 설치 Bs4 및 사용 방법

설치 방법 1:
① python 폴 더 에 들 어가 명령 을 실행 합 니 다(전 제 는 pip 명령 을 지원 합 니 다).

pip3 install Beautifulsoup4 
② 리 턴 설치 완료 시 아래 빨간색 상자 의 내용 이 나타 나 면 설치 성공 을 의미 합 니 다.

③ 실행 에 성공 할 수 있 는 지,cmd 실행 을 실행 할 수 있 는 지 검증 합 니 다.모듈 import bs4 리 턴 을 참조 하여 오류 가 발생 하지 않 으 면 설치 가 완료 되 었 음 을 증명 하고 정상적으로 사용 할 수 있 습 니 다.

설치 방법 2
(우리 회사 와 같은 각종 네트워크 제한 은 pip 를 사용 하면 설치 할 수 없고 retry 에서 순환 합 니 다)
① 홈 페이지 에 접속 하여 압축 파일 다운로드:Beautiful Soup 홈 페이지 다운로드 링크
② 압축 패 키 지 를 python 파일 에 압축 해제 하고 압축 해제 파일 에 들 어간 후 명령 을 입력 합 니 다(앞의 python 이 없어 서 는 안 됩 니 다).

python setup.py install
③ 실행 이 완료 되면 python 을 입력 하고 help('modules')를 입력 하면 현재 python 이 가지 고 있 는 모든 모듈 을 볼 수 있 습 니 다.다음 과 같 습 니 다.

④ 위의 설치 가 완료 되면 bs4 를 정상적으로 도입 할 수 있 는 지 확인 하고 입력:import bs4 리 턴
설치 방법
(python 3 파트너 라면 위의 두 가지 방법 이 안 되 는 것 을 발견 할 수 있 습 니 다.help('modules')를 실행 해도 bs4 모듈 을 찾 을 수 없습니다.이 때 는 다음 과 같은 방법 을 사용 해 야 합 니 다)
① 위의 두 번 째 방법 을 똑 같이 진행 한 후 BeautifulSoup 4 폴 더 의 bs4 폴 더 를 python 설치 디 렉 터 리 의 lib 에 복사 합 니 다.
② python 설치 디 렉 터 리 에 있 는 Tools/script/2to 3.py 파일 도 python 설치 디 렉 터 리 에 있 는 lib 에 잘 라 냅 니 다.
③ cmd 에서 lib 디 렉 터 리 에 cd 를 넣 고 python 2to 3.py bs4-w 를 실행 하면 됩 니 다.
기본 용법:

import bs4
from bs4 import BeautifulSoup

html_doc = """<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title"><b>The Dormouse's story</b></p>

<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow"  class="sister" id="link1">Elsie</a>,
<a href="http://example.com/lacie" rel="external nofollow"  class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow"  class="sister" id="link3">Tillie</a>;
and they lived at the bottom of a well.</p>

<p class="story">...</p>
"""
BeautifulSoup 대상 만 들 기

soup = BeautifulSoup(html_doc,“html.parser”)
문서 출력 포맷

soup.prettify()
在这里插入图片描述
제목 가 져 오기

soup.title.text
在这里插入图片描述
모든 태그 속성 가 져 오기

soup.a.attrs
在这里插入图片描述
어떤 태그 속성 이 있 는 지 판단 합 니 다.

soup.a.has_attr(‘class')
在这里插入图片描述
탭 의 하위 요소 가 져 오기

list(soup.p.children)
在这里插入图片描述

list(soup.p.children)[0].text
在这里插入图片描述
모든 탭 꺼 내기

soup.find_all(‘a')
for a in soup.find_all(‘a'):
print(a.attrs[‘href'])
在这里插入图片描述
지정 한 id 찾기

soup.find(id=‘link3')
在这里插入图片描述
모든 글자 의 내용 을 찾아내다

soup.get_text()
在这里插入图片描述
파 이 썬 의 Bs4 설치 및 사용 방법 에 관 한 이 글 은 여기까지 소개 되 었 습 니 다.더 많은 파 이 썬 설치 Bs4 사용 내용 은 우리 의 이전 글 을 검색 하거나 아래 의 관련 글 을 계속 조회 하 시기 바 랍 니 다.앞으로 많은 응원 바 랍 니 다!

좋은 웹페이지 즐겨찾기