고 층: 맨 윗부분 에서 모든 탭 을 가 져 옵 니 다. 난이도 가 간단 합 니 다 -- wh 04
실험 설명
1. 환경 로그 인
비밀번호 없 이 자동 로그 인, 시스템 사용자 이름 shiyanlou
2. 환경 소개
이 실험 환경 은 데스크 톱 이 있 는 Ubuntu Linux 환경 을 사용 합 니 다. 실험 에 서 는 데스크 톱 프로그램 을 사용 합 니 다.
3. 환경 사용
GVim 편집기 로 실험 에 필요 한 코드 와 파일 을 입력 하고 터미널 실행 에 필요 한 명령 을 사용 합 니 다.
실험 보고 서 는 개인 홈 페이지 에서 볼 수 있 습 니 다. 그 중에서 매번 실험의 캡 처 와 필기, 그리고 매번 실험의 효과 적 인 학습 시간 (실험 데스크 톱 에서 조작 하 는 시간 을 말 합 니 다. 조작 하지 않 으 면 시스템 은 멍 때 리 는 시간 으로 기록 합 니 다) 을 포함 합 니 다.이것들 은 모두 당신 이 배 운 진실성 증명 입 니 다.
실험 건물 가상 머 신 은 python 2. X 와 python 3. X 버 전 을 가지 고 있 습 니 다. 이 실험 을 설치 할 필요 가 없습니다. python 2.7 버 전, 즉 기본 버 전 을 사용 하 는 것 을 권장 합 니 다.
과정 소개
이 절 은 이번 파충류 수업 인 기초 수업 의 마무리 작업 이다.
미녀
탭 일치 규칙
실험 코드
#!/usr/bin/env python
# 上面这一行称为 shebang,它能找到当前环境的python的执行环境
#文件名:meizi_tag
import re
import urllib2
import meizi_series_nextpage
def loadurl(url):
try:
conn = urllib2.urlopen(url,data=None,timeout=5)
html = conn.read()
return html
except Exception:
return ''
#下面是主函数
def meizi(url,path):
#见上面的html代码截图,对比无误
reTagContent = '.*?(.*?)'
reTagUrl = ''
print 'start open meiziwang'
html = ''
while True:
html = loadurl(url)
if html == '':
print 'load', url,'error'
continue
else:
break
tagContent = re.findall(reTagContent, html, re.S)
taglists = re.findall(reTagUrl, tagContent[0], re.S)
#你仔细看会发现,链接又重,而且匹配、添加到列表,重复依旧在,所以啦,需要去重和排序,
taglists = sorted(list(set(taglists)))
for url in taglists:
meizi_series_nextpage.nextpage(url,path)
meizi('http://www.meizitu.com','/home/shiyanlou/Desktop/meizi')
print 'Spider Stop'
실험 건물 환경 캡 처 는 이 절 코드 만 실 행 했 을 뿐 이전 코드 를 호출 하지 않 았 다.
실험 동 환경 캡 처 - 고 층
고 - 중 - 저층, 3 층 코드 를 연결 하여 운행 합 니 다. 실험 건물 환경 캡 처 [가상 환경 에 있 습 니 다. 저 는 첫 번 째 태그, 첫 번 째 페이지, 첫 번 째 세트 그림 의 모든 그림 만 테스트 합 니 다]
기초 파충류 - 테스트 캡 처
4. 과정 기초 총화
기초 과정의 총 결 은 다음 과 같다.
후속 실험 은 더욱 효율 적 인 파충 류 를 완성 할 것 이다.
Python 3 튜 토리 얼, 프로젝트 사이트 - 전송 문
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
다양한 언어의 JSONJSON은 Javascript 표기법을 사용하여 데이터 구조를 레이아웃하는 데이터 형식입니다. 그러나 Javascript가 코드에서 이러한 구조를 나타낼 수 있는 유일한 언어는 아닙니다. 저는 일반적으로 '객체'{}...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.