BeautifulSoup 처리 html

1364 단어 htmlpython
html 같은 텍스트 콘 텐 츠 를 처리 하 는 python 라 이브 러 리 입 니 다.http://www.crummy.com/software/BeautifulSoup/#Download 
이것 은 중국어 문서 입 니 다.
http://zm6.sm-img2.com/?src=http%3A%2F%2Fwww.crummy.com%2Fsoftware%2FBeautifulSoup%2Fbs3%2Fdocumentation.zh.html&uid=51558658fb275070cd84ef8a462ae6b9&hid=&restype=1&from=derive&depth=2&link_type=60&query=&uc_param_str=
이것 은 4 버 전의 영문 문서 입 니 다.
http://zm6.sm-img2.com/?src=http%3A%2F%2Fwww.crummy.com%2Fsoftware%2FBeautifulSoup%2Fdocumentation.html&uid=51558658fb275070cd84ef8a462ae6b9&hid=&restype=1&from=derive&depth=3&link_type=60&uc_param_str=&query=beautifulsoup
그것 은 두 가지 판본 이 있다.하 나 는 Beautiful Soup,다른 하 나 는 Beautiful Soup 4.
설치 방법 은 홈 페이지 에 다 있 습 니 다.
다음은 Beautiful Soup 버 전 입 니 다.잘 안 돼 요.
from BeautifulSoup import BeautifulSoup
soup=BeautifulSoup(html)
len(soup)
<del>soup.contents[0].text</del>

html 는 str 형식 이 고 길 이 는 len 으로 가 져 옵 니 다.
html 안의 텍스트 는 innerText 에 해당 하 는 텍스트 로 표 시 됩 니 다.
원판 은 그다지 좋 지 않 습 니 다.역시 bs4 버 전이 좋 습 니 다.
from bs4 import BeautifulSoup

markup = '<a href="http://example.com/">
I linked to <i>example.com</i>
</a>' soup = BeautifulSoup(markup) print soup.get_text()

좋은 웹페이지 즐겨찾기