[Pandas] .pandas-datareader를 사용하여 주가 정보를 얻습니다. .no.32



안녕하세요, 마유미입니다.

Pandas에 대한 기사를 시리즈로 작성하고 있습니다.

이번 기사는 제32회

이번 기사에서는 Pandas의 'pandas-datareader'를 사용하여 다양한 회사의 주가 정보를 꺼내고 싶습니다.

그럼 바로 시작하겠네요.

pandas-datareader 설치



먼저 명령 줄을 사용하여 pandas-datareader를 설치합시다.

설치할 환경을 결정하고 해당 환경을 활성화합니다.

그 후
conda install pandas-datareader

라고 입력하면 설치가 시작됩니다.



설치가 시작되기 전에 아래의 스쿠쇼와 같습니다.

"pandas-datareader"가 제대로 있는지 확인하십시오.

Proceed([y]/n)? 뒤에 y를 입력하고 Enter를 누릅니다.



(Anaconda를 설치하거나 conda를 사용하는 방법을 모르는 경우 이 기사을 참조하십시오.)

pandas_datareader 사용



방금 설치한 pandas_datareader를 가져옵니다.

별칭 이름 pdr로 가져왔습니다.
import pandas_datareader as pdr

pdr.DataReader()가 어떤 파라미터를 취할 수 있는지,

Tab + Shift

를 눌러 문서를 봅니다.


아래와 같이 문서가 표시되었습니다.


우리는 주가 정보를 얻는 데 필요한 매개 변수를 하나씩 설명합니다.

매개변수 name



name 에는 조사하고 싶은 회사의 회사명을 넣습니다.
다만, 정식명을 쓰는 것이 아니라, 3~4문자 정도의 알파벳으로 생긴, 「티커 기호」라고 하는 것을 씁니다

(여러 회사의 티커 심볼을 조사하고 싶은 사람은 이 사이트의 검색 바에서 확인해보십시오.)



매개변수 data_source



매개 변수 data_source는 pandas_datareader가 어떤 소스에서 정보를 가져오는지 인수로 작성합니다.

다만, 그 소스원은 잘 변경되므로, 에러가 표시되었을 때는, 여러가지 다른 정보 소스를 넣어 보세요.

이번에 내가 시도했을 때,

data_source = "google"이면 오류가 발생했지만 data_source = "yahoo"에서 잘 갔습니다.



StackOverflow에서도 정보 소스로 google을 사용할 수 없다는 것에 대한 해답이 있었으므로 붙여 둡니다.


인용구: stackoverflow



파라미터 start, end



start는 기간의 시작입니다.

end에는 기간의 끝을 인수로 전달합니다.

Microsoft와 Facebook의 각각 지정된 기간에 대한 주가 데이터는 다음과 같습니다.



제일 왼쪽 하시에 있는 'DatetimeIndex'의 날짜가 곳곳에서 빠져 있는 것은 주식시장이 휴일이기 때문입니다.

※DatetimeIndex를 모르는 사람은 이 기사

페이스 북의 주가 가득한 DataFrame을 facebook이라는 변수에 대입하여 어떤 속성을 사용할 수 있는지 살펴 보겠습니다.

다양한 속성을 사용해 봅시다.



facebook.을 입력하고 Tab 키를 누르면 어떤 속성을 사용할 수 있는지 제안합니다.




'values'를 사용하면 numpy array를 반환하고 'index'를 사용하면 인덱스의 레이블을 반환합니다.

그 밖에도 많은 후보가 있으므로, 꼭 시험해 보세요.

요약



이번 기사는 이것으로 마무리 해 드리겠습니다.

또 나중에, 이러한 주가 정보를 그래프로 나타내는 방법도 기사로 해 가고 싶습니다.

아무쪼록 잘 부탁드립니다!

좋은 웹페이지 즐겨찾기