서황각 소설 기어오르기

1408 단어 스스로 즐기다.
dir를 서황각 모 소설 목록으로 바꾸고,name을 파일 이름으로 바꾸면 기어내릴 수 있다
from bs4 import BeautifulSoup
import requests

headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36'}

def download(url, path):
    res = requests.get(url, headers = headers)
    res.encoding = 'gbk'
    bs = BeautifulSoup(res.text, 'html.parser')#.replace(' ','')
    tag = bs.find('div', {'id':'content'})
    with open(path, 'a', encoding = 'utf-8') as f:
        f.write('

' + bs.title.get_text() + '

') f.write(tag.get_text()) def getdir(url, baseurl): res = requests.get(url, headers = headers) bs = BeautifulSoup(res.text, 'html.parser') tags = bs.find('div', {'id':'list'}).findAll(['dd', 'dt']) start = 1 while True: if tags[start].name == 'dt': break start+=1 for i in range(start+1, len(tags)): yield baseurl+tags[i].a['href'] #dir=input() #name=input() dir='https://www.shuhuangge.org/0_71/' baseurl='https://www.shuhuangge.org' name=' ' for url in getdir(dir, baseurl): download(url,name + '.txt') print(url) #time.sleep(1)

좋은 웹페이지 즐겨찾기