python,crawling
python(파이썬)
- 파이썬을 설치해서 사용.
- 파이썬의 설치 : 인간의 언어로 만든 코드를 컴퓨터 언어로 바꿔주는 번역팩 을 구비하는 느낌
python의 기초문법
- 변수, 자료형, 조건문, 반복문, 함수
1. 변수와 선언
- 파이썬에서 변수의 선언은 자바스크립트와 다르게 변수 이름만 쓴다.
a = 10
이런식으로 var,let이 붙지 않고 변수이름만 써주면 된다.
<주의> 당연하지만 파이썬에서도 변수선언할 때 자료형 주의
2. 자료형과 연산자
- 파이썬에서의 자료형과 연산자는 자바스크립트에서의 자료형과 연산자와 같다.
자바스크립트의 자료형과 연산자 참고자료
- 잘 몰랐던 딕셔너리 자료형을 조금더 다뤄보자.
- 딕셔너리는 일련의 연관된 정보를 저장하는 배열과 같다.
dict = {"date":210914 , "name":"정혜원"}
# ':'은 연관된 정보를 입력할 때 사용한다.
-이런식으로 저장하면 dict을 호출하면 날짜와 이름데이터가 나온다.
-' : '이건 배열에 찍어도 안읽힌다.(배열과 딕셔너리의 차이점)
- 따라서 배열안에 딕셔너리를 사용하면 관련된 여러가지 데이터들을 한 배열 에 정리가 가능해서 유용하다.
3. if 조건문
- 자바스크립트의 조건문과 비슷하지만, 자바스크립트에서는 영역 구분을{}로 헸다면, 파이썬에서는 들여쓰기와 ':' , 줄바꿈으로 한다.
if 조건식1:
----실행할 코드----
elif 조건식2:
----실행할 코드----
else:
----실행할 코드----
<주의>파이썬에선 else if가 elif로 쓰인다.
elif의 등장순서는 파이썬이나 자바스크립트나 중요하다.
4.for 반복문
- 대부분 리스트와 같이 쓰인다.
names = ["혜원","지수","선영","수진","동윤","혜인"]
for name in names:
print(name)
1.name은 변수의 이름이다.(단수 복수를 사용한게 아님..)
2.in names로 변수의 범위를 설정했기때문에 배열을 한번 다 돌고 나면 반복문은 끝이난다.
5. def 함수
- 자바스크립트에서는 function이었지만 파이썬에서는 def로 사용한다.
def func1 (a,b):
return a*b
result = func1(3,4)
1.func1은 함수의 이름이다.
2.a,b는 매개변수이며, 여러개 올 수 있다.
3.return 뒤에는 a,b관련식이 온다.
4.호출은 자바스크립트와 똑같이 한다.
파이썬에서는 줄바꿈,들여쓰기,':'으로 영역을 구분한다. 따라서 줄바꿈과 들여쓰기에 주의하며 코드를 작성해야 한다.
6.python 패키지
- 가상환경(virtual environments) : 프로젝트별로 패키지를 담은 공구함.라이브러리를 담아두는 폴더
- 파이썬 패키지 설치 : pyCharm > preference > '+' > 패키지 검색 > install
- 패키지 사용하기 : python request 구글링 후 임포트템플릿 끌어와서 사용.
crawling
-
웹페이지의 정보를 긁어오는 것
-
크롤링이 가능한 이유는 서버가 이미 저장된 문서를 내게 보내줬기때문에 받은 문서에서 속아내서 사용이 가능하다.
크롤링 하는법
1.bs4패키지를 install 후 임포트하고 시작.
2.웹페이지에서 원하는 부분을 검사한다.
3.추출을 원하는 코드를 괄호안에 넣어준다.
변수=soup.selsct("추출")
//추출한 정보중에 하나만 뽑아쓰고싶을때
변수=soup.select_one("그 하나만 포인팅하는 코드")
4.정보를 추출 후 <<추출코드.속성>>을 이용하여 속성을 끌어올수도 있다.
5.변수의 속성 가지고 올 때는 [""]를 사용한다.
(이건 임포트에서 그렇게 하라고 명령한거지 해당 코드가 딕셔너리라서 사용하는게 아니다.)
-
반복문 영역에 코드쓸 때 반복문 변수를 생각하면서 쓰자. 엉뚱한 변수가 나오면 당연히 안돌아간다.
Author And Source
이 문제에 관하여(python,crawling), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://velog.io/@jaake97/pythoncrawling
저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
- 변수, 자료형, 조건문, 반복문, 함수
1. 변수와 선언
- 파이썬에서 변수의 선언은 자바스크립트와 다르게 변수 이름만 쓴다.
a = 10
이런식으로 var,let이 붙지 않고 변수이름만 써주면 된다.
<주의> 당연하지만 파이썬에서도 변수선언할 때 자료형 주의
2. 자료형과 연산자
- 파이썬에서의 자료형과 연산자는 자바스크립트에서의 자료형과 연산자와 같다.
자바스크립트의 자료형과 연산자 참고자료 - 잘 몰랐던 딕셔너리 자료형을 조금더 다뤄보자.
- 딕셔너리는 일련의 연관된 정보를 저장하는 배열과 같다.
-이런식으로 저장하면 dict을 호출하면 날짜와 이름데이터가 나온다.dict = {"date":210914 , "name":"정혜원"} # ':'은 연관된 정보를 입력할 때 사용한다.
-' : '이건 배열에 찍어도 안읽힌다.(배열과 딕셔너리의 차이점) - 따라서 배열안에 딕셔너리를 사용하면 관련된 여러가지 데이터들을 한 배열 에 정리가 가능해서 유용하다.
- 딕셔너리는 일련의 연관된 정보를 저장하는 배열과 같다.
3. if 조건문
- 자바스크립트의 조건문과 비슷하지만, 자바스크립트에서는 영역 구분을{}로 헸다면, 파이썬에서는 들여쓰기와 ':' , 줄바꿈으로 한다.
if 조건식1: ----실행할 코드---- elif 조건식2: ----실행할 코드---- else: ----실행할 코드----
<주의>파이썬에선 else if가 elif로 쓰인다.
elif의 등장순서는 파이썬이나 자바스크립트나 중요하다.
4.for 반복문
- 대부분 리스트와 같이 쓰인다.
names = ["혜원","지수","선영","수진","동윤","혜인"]
for name in names:
print(name)
1.name은 변수의 이름이다.(단수 복수를 사용한게 아님..)
2.in names로 변수의 범위를 설정했기때문에 배열을 한번 다 돌고 나면 반복문은 끝이난다.
5. def 함수
- 자바스크립트에서는 function이었지만 파이썬에서는 def로 사용한다.
def func1 (a,b):
return a*b
result = func1(3,4)
1.func1은 함수의 이름이다.
2.a,b는 매개변수이며, 여러개 올 수 있다.
3.return 뒤에는 a,b관련식이 온다.
4.호출은 자바스크립트와 똑같이 한다.
파이썬에서는 줄바꿈,들여쓰기,':'으로 영역을 구분한다. 따라서 줄바꿈과 들여쓰기에 주의하며 코드를 작성해야 한다.
6.python 패키지
- 가상환경(virtual environments) : 프로젝트별로 패키지를 담은 공구함.라이브러리를 담아두는 폴더
- 파이썬 패키지 설치 : pyCharm > preference > '+' > 패키지 검색 > install
- 패키지 사용하기 : python request 구글링 후 임포트템플릿 끌어와서 사용.
crawling
-
웹페이지의 정보를 긁어오는 것
-
크롤링이 가능한 이유는 서버가 이미 저장된 문서를 내게 보내줬기때문에 받은 문서에서 속아내서 사용이 가능하다.
크롤링 하는법
1.bs4패키지를 install 후 임포트하고 시작.
2.웹페이지에서 원하는 부분을 검사한다.
3.추출을 원하는 코드를 괄호안에 넣어준다.
변수=soup.selsct("추출")
//추출한 정보중에 하나만 뽑아쓰고싶을때
변수=soup.select_one("그 하나만 포인팅하는 코드")
4.정보를 추출 후 <<추출코드.속성>>을 이용하여 속성을 끌어올수도 있다.
5.변수의 속성 가지고 올 때는 [""]를 사용한다.
(이건 임포트에서 그렇게 하라고 명령한거지 해당 코드가 딕셔너리라서 사용하는게 아니다.)
-
반복문 영역에 코드쓸 때 반복문 변수를 생각하면서 쓰자. 엉뚱한 변수가 나오면 당연히 안돌아간다.
Author And Source
이 문제에 관하여(python,crawling), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://velog.io/@jaake97/pythoncrawling
저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
names = ["혜원","지수","선영","수진","동윤","혜인"] for name in names: print(name)
1.name은 변수의 이름이다.(단수 복수를 사용한게 아님..)
2.in names로 변수의 범위를 설정했기때문에 배열을 한번 다 돌고 나면 반복문은 끝이난다.
- 자바스크립트에서는 function이었지만 파이썬에서는 def로 사용한다.
def func1 (a,b): return a*b result = func1(3,4)
1.func1은 함수의 이름이다.
2.a,b는 매개변수이며, 여러개 올 수 있다.
3.return 뒤에는 a,b관련식이 온다.
4.호출은 자바스크립트와 똑같이 한다.
파이썬에서는 줄바꿈,들여쓰기,':'으로 영역을 구분한다. 따라서 줄바꿈과 들여쓰기에 주의하며 코드를 작성해야 한다.
6.python 패키지
- 가상환경(virtual environments) : 프로젝트별로 패키지를 담은 공구함.라이브러리를 담아두는 폴더
- 파이썬 패키지 설치 : pyCharm > preference > '+' > 패키지 검색 > install
- 패키지 사용하기 : python request 구글링 후 임포트템플릿 끌어와서 사용.
crawling
-
웹페이지의 정보를 긁어오는 것
-
크롤링이 가능한 이유는 서버가 이미 저장된 문서를 내게 보내줬기때문에 받은 문서에서 속아내서 사용이 가능하다.
크롤링 하는법
1.bs4패키지를 install 후 임포트하고 시작.
2.웹페이지에서 원하는 부분을 검사한다.
3.추출을 원하는 코드를 괄호안에 넣어준다.
변수=soup.selsct("추출")
//추출한 정보중에 하나만 뽑아쓰고싶을때
변수=soup.select_one("그 하나만 포인팅하는 코드")
4.정보를 추출 후 <<추출코드.속성>>을 이용하여 속성을 끌어올수도 있다.
5.변수의 속성 가지고 올 때는 [""]를 사용한다.
(이건 임포트에서 그렇게 하라고 명령한거지 해당 코드가 딕셔너리라서 사용하는게 아니다.)
-
반복문 영역에 코드쓸 때 반복문 변수를 생각하면서 쓰자. 엉뚱한 변수가 나오면 당연히 안돌아간다.
Author And Source
이 문제에 관하여(python,crawling), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://velog.io/@jaake97/pythoncrawling
저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
-
웹페이지의 정보를 긁어오는 것
-
크롤링이 가능한 이유는 서버가 이미 저장된 문서를 내게 보내줬기때문에 받은 문서에서 속아내서 사용이 가능하다.
크롤링 하는법
1.bs4패키지를 install 후 임포트하고 시작.
2.웹페이지에서 원하는 부분을 검사한다.
3.추출을 원하는 코드를 괄호안에 넣어준다.변수=soup.selsct("추출") //추출한 정보중에 하나만 뽑아쓰고싶을때 변수=soup.select_one("그 하나만 포인팅하는 코드")
4.정보를 추출 후 <<추출코드.속성>>을 이용하여 속성을 끌어올수도 있다.
5.변수의 속성 가지고 올 때는 [""]를 사용한다.
(이건 임포트에서 그렇게 하라고 명령한거지 해당 코드가 딕셔너리라서 사용하는게 아니다.) -
반복문 영역에 코드쓸 때 반복문 변수를 생각하면서 쓰자. 엉뚱한 변수가 나오면 당연히 안돌아간다.
Author And Source
이 문제에 관하여(python,crawling), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://velog.io/@jaake97/pythoncrawling저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)