단순 코드 1
1370 단어 python3.x
from bs4 import BeautifulSoup
def getHtml(url):
import urllib
import urllib.request
print(" ")
request = urllib.request.Request(url)
request.add_header("user-agent", "Mozilla/5.0")
response2 = urllib.request.urlopen(url)
print(response2.getcode())
# print(response2)
# response2.read()
# print(len(response2.read()))
data=response2.read().decode("utf-8")
return data
def urllist():
baseurl="http://www.sanye.cx/?cate=69"
lists=[]
for x in range(1,11):
url=baseurl+"&page="+str(x)
lists.append(url)
# lists.reverse()
return lists
def logtext(content):
f=open('sanye.md','a+',encoding="utf-8")
f.write(content)
f.write("\r
")
def parsedata(data):
soup=BeautifulSoup(data,'html.parser')
print(soup.title.text)
div=soup.find(class_='list')
ul=div.find('ul')
lis=ul.find_all ('li')
for li in lis:
a=li.find('h2').find('a')
name=a.get_text()
print(name)
name="##"+name
logtext(name)
def run():
urllists=urllist()
print(urllists)
for url in urllists:
data=getHtml(url)
parsedata(data)
run()
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
단순 코드 1from bs4 import BeautifulSoup def getHtml(url): import urllib import urllib.request print("第二种方法") request = urllib.requ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.