Pandas의 주가 분석에 사용할 수있는 기능 소개 (Facebook 주가 데이터 사용) no.6



안녕하세요, 마유미입니다.

Pandas에 대해 시리즈에서 기사를 쓰고 있습니다.

이번은 제6회째가 됩니다.

지금까지 기초적인 것을 써 왔으므로, 이번 기사에서는, Pandas의 편리한 기능을 사용해
  • CSV 데이터를 쉽게 읽을 수 있습니다
  • 원하는 데이터 만 검색하거나
  • 데이터 재정렬

  • 해보려고 생각합니다.

    이번은 했다. rld씨의 사이트로부터 「Facebook」의 주가의 데이터를 사용해 가고 싶습니다. (나 자신, Facebook의 주식을 조금 보유하고 있기 때문에 흥분합니다 (웃음))

    주가 분석에 도움이 될 것 같은 Pandas의 기능





    CSV 파일의 사용하려는 부분 지정


    import pandas as pd
    pd.read_csv("CSVファイル名", usecols=["コラム名"], squeeze=True)
    

    Pandas의 read_csv() 메소드는

    CSV 파일 전체(DataFrame)를 읽어들이므로, 사용하지 않는 데이터도 함께 읽어 버립니다.

    usecols=["칼럼 이름"]

    에서 사용하고 싶은 부분을 지정합시다.



    이번은 「Close」라고 칼럼명이 붙은 부분만을 꺼냅니다(주가의 각각의 날의 종가)

    그리고 DataFrame을 Series로 바꾸기 위해,

    squeeze=True

    및 () 안에 씁니다.

    ※DataFrame Series라고 하는 사람은 이 기사 부터 부디.

    ※squeeze 란 무엇? 라고 하는 사람은, 마지막 기사 의 1 칼럼만 꺼낸 DataFrame 를 Series 로 한다고 하는 항목에 쓰고 있습니다

    이상의 실행 결과는 다음과 같습니다. 시리즈를 만들 수있었습니다.



    데이터의 처음과 마지막 부분만 살펴보기



    Facebook 주가 데이터의 처음과 마지막 부분을보고 싶을 때
    .head()
    .tail()
    

    사용할 수 있습니다.



    .head() 는 데이터의 처음 5rows를
    .tail()은 데이터의 마지막 5rows를 반환합니다.

    인수의 값을 바꾸면, 그 숫자분의 row 를 돌려줍니다.

    주가를 낮은 순서, 높은 순서로 정렬



    Facebook의 주식을 계속 가지고 있다면 얼마나 돈을 벌었는지 알고 싶을 때는 주가를 낮은 순서로 또는 높은 순서로 정렬하는 기능을 사용합시다.
    .sort_values()
    

    를 사용하면 낮은 순서로 나란히 줍니다.



    만약, 주가가 18달러 정도의 때에 사달라고 하고 있으면, 지금쯤은. . . (망상...)

    또한 sort_values() 는 다양한 매개 변수를 취할 수 있습니다. ( Pandas 문서 참고 )

    sort_values의
    ascending=False
    

    매개 변수의 인수 값을 False로 설정하면

    높은 순서로 나란히 해줍니다.

    inplace 매개 변수 사용



    다만 이 『.sort_values()』는 원래의 데이터를 재기록하는 것은 아닙니다.

    주가를 높은 순서 혹은 낮은 순서로 늘어놓은 것을 돌려주는 것만으로 덮어쓰는 것은 아닙니다.

    무슨 뜻인지 실제로 예를 내면서 설명합니다.



    예를 들어, 인수를 ascending=False 로 하여 주가가 높은 순서에서 늘어놓더라도 원래 데이터를 다시 호출해 보면 주가가 낮은 순서가 됩니다.

    그렇다면 데이터를 덮어 쓰는 방법이 있습니까?



    기본적으로 False 인 inplace = 인수를 True로 변경하면 덮어 쓸 수 있습니다.



    요약



    이번 기사는 이 정도로 끝납니다

    Pandas 라이브러리는 강력하고 다양한 일을 할 수 있으므로 조금씩 Pandas에 대해 기사로 갈 것입니다.

    좋은 웹페이지 즐겨찾기