[DataRobot 쓰담쓰담] 4분기 보고 데이터로 주가의 등락을 예측할 수 있습니까?

개시하다


타고하일제 시판 DataRobot을 만져봤습니다!

하고 싶은 일


우선 수중에 있는 4분기 신문학과 500의'대진단 전체 출시 품종'데이터를 사용하여 약 1개월(6/17-7/10)의 상승과 하락률을 배울 수 있습니다.참고로 저는 주식 투자에 대한 인식이 그리 많지 않습니다. 원래 설정 문제가 좀 억지스러우니 양해해 주십시오.

데이터


사계절 500원 구매하면 다운로드할 수 있는 데이터.
데이터는 다음과 같은 항목이 있다.
  • 증권 코드
  • 회사명
  • 업종
  • 실적 예측 변화율
  • PER
  • PBR
  • 배당금
  • 이론 주가
  • 이론 주가 수정 여지
  • 실적진도율
  • 진행률 분기별 결산 기간
  • 회사 계획 영업이익률
  • 파산 위험도
  • 주가일자
  • 주가
  • 이 데이터는 7월 10일 시점의 마감가와 아래 사이트에서 얻은 것으로 결합하여 등락률을 계산하고 있다.(Excel 사용)
    https://mujinzou.com/
    또 회사 규모에도 상관이 있기 때문에 다음 사이트에서 매출액 정보를 얻어 추가했다.(Excel 사용)
    20년 결산이 6월 17일에 나오지 않은 것 같아 19년간 데이터를 사용했다.
    https://irbank.net/download

    DataRobot에 업로드


    DataRobot의 프로젝트 시작 화면에서 로컬 파일을 선택하여 Excel 상태에서 업로드를 완료합니다.

    데이터 확인 및 선택


    처음에 이 화면이 나왔어요. 에이, 목표는 손으로 치는 거예요?깜짝 놀랐어요.웃다 웃다

    아래로 스크롤하여 피쳐 양을 선택하고 대상을 지정합니다.

    결제 기간이 수치형이기 때문에 카테고리에 대해 모수 변환을 진행했다.사용법이 있나?

    등락률 자체가 이런 느낌이다.스케줄러:불경기야.

    이번에는 간단한 문제 해결을 위해 모든 브랜드의 등락률 평균치가 높은지 낮은지 2치 목표를 정해 공부했다.
    (처음에는 등락률을 목표로 했지만 결과는 엉망이었다.

    학습에 필요한 특징량을 선택하여 특징량집을 제작한다.7월 10일 시점의 주가 등 미래 정보가 담긴 열을 제외했다.또 데이터로봇은 EDA가 추천하는 특징량 패키지를 제작한다.편리합니다!
    하지만 정보의 뜻을 설명하지 않고(미래정보를 포괄하는 팀 등) 일손이 관리해야 한다.엑셀의 단계가 예쁘면 DataRobot의 추천을 직접 사용할 수 있다.

    학습과 평가


    자동 보조를 시작하다.

    공부를 시작하다.오른쪽 페인의 스태프 수는 기본 2이기 때문에 맥스의 8까지 병행하기로 했습니다.

    모형의 화면을 보면서 기다리다.
    몇 분이 걸리기 때문에 기다리는 동안 다음 손(특징과 목표의 재평가)을 고려한다.

    결과가 나왔습니다.퍼포먼스가 가장 좋은 것은 SVM이다.
    그럼에도 불구하고 AUC는 한계가 0.7을 넘을 정도로 미묘하다.

    각 특징량의 예측은 EDA가 구한 유용도 순서에 따라 배열된다고 한다.

    해설의 특징량의 충격은 실제 제작된 모델의 목표와 관련이 있음을 알 수 있다.실적 예측 변화율이 -100~0 정도인 곳이 주식 가격 증감에 미치는 영향이 좋지 않을까요?데이터 양이 많아서 그런가 봐요.

    총결산


    유감스럽게도 좋은 결과를 얻지 못했다.페어 같은 게 더 강력한 연관이 있으면 재밌을 것 같아.
    이번에는 20년 6월의 데이터만 보고 시장 환경 변화의 영향이 크다고 느꼈다.
    과거 데이터를 더 많이 얻고 더 긴 상승률을 목표로 공부를 한다면 더 좋은 예측 모델을 만들 수 있을 것이다.
    특징을 집중해 예측할 수 있는 모델이 생기면 회사 정보의 업데이트에 따라 미래의 등락률을 예측할 수 있다.그렇게 지도 모른다, 아마, 아마...
    DataRobot과 관련해서는 처음 접하기는 했지만 알기 쉬운 비주얼 효과여서 무난하게 접했다.
    DataRobot에 학습을 맡기는 동안 스스로 문제를 어떻게 설정하고 데이터에 어떻게 공을 들일지 고민할 수 있어서 정말 좋았습니다.
    Jupyter에서 하려면 많은 문제 설정, 데이터의 노력, 모델 개발, 학습 등을 보아야 하기 때문에 DataRobot의 단순성이 상당히 편리하다고 생각합니다!!
    (물결만 따라가면 모델 개발이 발전하지 않기 때문에 노력해야 한다.

    좋은 웹페이지 즐겨찾기