단순 코드 1
1370 단어 python3.x
from bs4 import BeautifulSoup
def getHtml(url):
import urllib
import urllib.request
print(" ")
request = urllib.request.Request(url)
request.add_header("user-agent", "Mozilla/5.0")
response2 = urllib.request.urlopen(url)
print(response2.getcode())
# print(response2)
# response2.read()
# print(len(response2.read()))
data=response2.read().decode("utf-8")
return data
def urllist():
baseurl="http://www.sanye.cx/?cate=69"
lists=[]
for x in range(1,11):
url=baseurl+"&page="+str(x)
lists.append(url)
# lists.reverse()
return lists
def logtext(content):
f=open('sanye.md','a+',encoding="utf-8")
f.write(content)
f.write("\r
")
def parsedata(data):
soup=BeautifulSoup(data,'html.parser')
print(soup.title.text)
div=soup.find(class_='list')
ul=div.find('ul')
lis=ul.find_all ('li')
for li in lis:
a=li.find('h2').find('a')
name=a.get_text()
print(name)
name="##"+name
logtext(name)
def run():
urllists=urllist()
print(urllists)
for url in urllists:
data=getHtml(url)
parsedata(data)
run()
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Django | admin 백그라운드 미화 처리 JSONfield1 간단한 설명 일부 업무 수요에서 모델의 일부 필드에 대해 JSONField 적합한 업무를 사용하지만 이런 필드는 django admin에서 표시하고 수정하는 것이 직관적이고 편리하지 않기 때문에 여기에 생각을 하...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.