Python 파충류 (1) - 데이터 세척 및 추출
4054 단어 파 이 썬 파충류
예:
#sub(" ",' ',' ')
html=re.sub('
','',html)
#findall(" "," ")
ret=re.findall(pattern_1,html)
#match(" "," ")
re.match(password_patter,pass1)
Xpath 의 기본 문법
표현 식
묘사 하 다.
/
루트 노드 선택 또는 하위
//
임의의 노드, 위치 고려 하지 않 음
.
현재 노드
…
현재 노드 의 부모 노드
@
속성 선택
*
임의의 노드 일치
[nodename]
노드 에 따라 선별
contains (@ 속성, "포 함 된 내용")
모호 조회
text()
텍스트 내용
JSonPath 사용
주로 4 가지 방법 이 있 습 니 다: dumps (): python 대상 을 json 대상 loads () 로 변환 합 니 다. json 대상 을 python 대상 dump () 로 변환 합 니 다. python 대상 을 json 대상 으로 변환 하고 로 컬 load () 로 저장 합 니 다. 로 컬 json 대상 을 불 러 오고 python 으로 변환 합 니 다.
예:
import json
python_data=[
{
'name':'name1',
'vip':True
},
{
'name':None,
'vip':False
}
]
#dumps python json
json_data=json.dumps(python_data)
#loads json python
python_data=json.loads(json_data)
#dump python json
json.dump(pythton_data,open('json.txt','w'))
#load json python
python_data2=json.load(open('json.txt'))
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
Python 파충류 (1) - 데이터 세척 및 추출re 모듈 의 사용 추출, 일치, 교체 추출: findall () 일치: match () 교체: sub () 예: Xpath 의 기본 문법 표현 식 묘사 하 다. 루트 노드 선택 또는 하위 임의의 노드, 위치 고려 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.