R 언어 파충류 실천(상): 중고 주택 데이터 수집
1914 단어 R 언어 학습 노트
gurl % html_session %>%
read_html(encoding="utf-8") %>%
html_nodes("div.f-main-list>div>div")
# puid
puid % html_attr("puid")
#
itemURL % html_attr("href") %>% gsub(pattern="/fang5",replacement="http://cs.ganji.com/fang5")
#
smallImg % html_nodes("dl>dt>div>a>img") %>% html_attr("src")
#
iTitle % html_nodes("dl>dd>a") %>% html_attr("title")
# --
# :f_mew_list > div.f-main.f-clear.f-w1190 > div.f-main-left.f-fl.f-w980 > div.f-main-list > div > div:nth-child(1) > dl > dd.dd-item.size > span:nth-child(1)
iLayout % html_nodes("dl > dd.dd-item.size > span:nth-child(1)") %>% html_text
# --
# :f_mew_list > div.f-main.f-clear.f-w1190 > div.f-main-left.f-fl.f-w980 > div.f-main-list > div > div:nth-child(1) > dl > dd.dd-item.size > span:nth-child(3)
iArea % html_nodes("dl > dd.dd-item.size > span:nth-child(3)") %>% html_text
#
iOrientation% html_nodes("dl > dd.dd-item.size > span:nth-child(5)") %>% html_text#
iFloor % html_nodes("dl > dd.dd-item.size > span:nth-child(7)") %>% html_text#
#
iAddr % html_nodes("dl>dd>span.area") %>% html_text %>% gsub(pattern="
",replacement=" ") %>% gsub(pattern=" ",replacement="")
#
iPrice % html_nodes("dl>dd>div.price>span:first-child") %>% html_text
#
iunitPrice % html_nodes("dl>dd>div.time") %>% html_text %>% gsub(pattern="[^0-9]",replacement="") %>% as.numeric
#
iData
이 내용에 흥미가 있습니까?
현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:
R 언어의 표본 추출 방법과 통계 함수 설명흔한 표본 추출 방법 단순 무작위 표본 추출 층별 표본 추출 시스템 표본 추출 단순 무작위 표본 추출 단순 무작위 표본 추출의 가장 기본적인 표본 추출 방법.중복 추출과 중복 추출이 없는 추출로 나뉜다.사회 조사는 ...
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.