TIL - Python 날씨 크롤링

크롤링


인터넷을 돌아다니며 웹사이트 등의 공개된 서버에서 자료를 긁어 모으는 것을 의미

! 지역, 기온, 습도를 크롤링해보자

[ 사전 준비 ]

기상청 (도시별 현재날씨) 주소

[ 설치 라이브러리 ]

pip install requests	# 웹사이트 내용을 가져옴
pip install bs4		# html로 파싱

실습


1. 라이브러리 호출

import requests
from bs4 import BeautifulSoup

2. 기상청 주소 내용 호출 및 html 파싱

address = 'https://www.weather.go.kr/weather/observation/currentweather.jsp'

source = requests.get(address)
soup = BeautifulSoup(source.content, "html.parser")

3. F12를 눌러 html 코드 확인

4. 각 태그명을 확인하여 크롤링

table = soup.find('table', {'class':'table_develop3'})

```python
print("Today's Weather")
print('지점\t 기온\t 습도')

for tr in table.find_all('tr'): # tr태그 자료 탐색
    tds = list(tr.find_all('td')) # tr태그 내의 td태그 리스트화
    for td in tds: # td태그 자료 탐색
        if td.find('a'): # # 지점은 a태그
            point = td.find('a').text
            temp = tds[5].text # 6번째 태그 ( 1번째 = 리스트 0번째 )
            humidity = tds[9].text
            print("{0:<7} {1:<7} {2:<7}".format(point,temp,humidity))

5. 결과 출력

좋은 웹페이지 즐겨찾기