유가증권 보고서를 파이썬으로 취득해 본다(R→Python)

3911 단어 RPython3EDINETxbrlXML

소개



제 IT 경력의 대부분은 금융업종입니다. 쭉 과제라고 생각했던 것이 「프라이빗의 성과물이 없다」라고 하는 것이었습니다. 당연히 NDA(비밀 유지 계약)를 맺기 때문에, 가지고 돌아갈 수 없고, 나의 소스입니다! 라고 말할 수도 없다. 힘들군요, 집에 돌아가고 나서도 프로그램 만들기는 뭐라고. 그래서, 그래도 최근 역시 움직이지 않는다고 생각해, 무엇을 만들까라고 계속 생각하고 생각하지 못하고 있어의 반복으로, 좋을 수 있는 것으로부터 해 보자! 그래서 공개 된 기업의 금융 데이터를 다루는 곳에서 시작해 보겠습니다. 라고 생각했지만 어쩐지 R로 쓰고 있고, 에서, 잘 보면 어쩐지 늘어져 막하되어 "그대로의 코피페에서는 움직이지 않을 것입니다. 개변 개소는 생각해 주세요"라든지 쓰고 있습니다. 벌써, 치키 쇼

참고



R에서 XBRL 데이터를 검색해 보았습니다.
투자를 위한 재무분석 step1 「재무정보 XBRL 취득」
ElementTree 또는 lxml에서 네임스페이스를 포함하는 XML 요소를 가져옵니다.
유보 캐처 API 정보

이 책을 사려고



평소의 나라면 즉시 포치하고 있지만, 여기에서도 이상한 신경을 써서, 책을 보고 눈앞의 소스가 완성된다면, 이 소스를 「번역」하는 쪽이 경험치적으로도 돈인가로부터 되지 않는다 적으로도 합리적이라고 생각했다. R을 읽는 힘, 파이썬으로 변환하는 힘, 얻은 것은 생각했던 것보다 컸다. 이른바 교과서적인 책을 읽으면서 좋은 프로그램을 만드는 것보다 누군가가 버린 (?) 프로그램을 번역함으로써 얻을 수 있는 경험치는 굉장히 맛이 있다.


출처



미리 시장 파일을 master 폴더에 CSV로 저장하십시오.



htps //w w. jpx. 이. jp/마르케 ts/s들 s 치 cs-에 쿠치 s/미 sc/01. HTML
다음과 같은 정보가 적혀 있습니다. "코드"를 사용하여 다운로드를 수행하는 것입니다.


날짜
코드
유명 상표
시장·상품 구분
33업종 코드
33업종 구분
17 업종 코드
17 업종 구분
규모 코드
규모 구분


20190628
1305년
다이와 상장 투신 - 토픽
ETF·ETN
-
-
-
-
-
-

20190628
1400년
루덴 홀딩스
JASDAQ(글로스·내국주)
2050년
건설업
3
건설·자재
-
-

20190628
4875
메디시노바 잉크
JASDAQ(스탠다드·외국주)
3250
의약품
5
의약품
-
-

20190628
1432년
동력
PRO 마켓
2050년
건설업
3
건설·자재
-
-

20190628
2971
에스콘 재팬 리트 투자 법인
REIT · 벤처 펀드 · 컨트리 펀드 · 인프라 펀드
-
-
-
-
-
-

20190628
6697
테크 포인트 · 잉크 JDR
마더스(외국주)
3650
전기 장비
9
전기·정밀
-
-

20190628
1401년
엠비에스
마더스(내국주)
2050년
건설업
3
건설·자재
-
-

20190628
1773년
와이 티 엘 코퍼레이션 버하드
시장 제일부(외국주)
2050년
건설업
3
건설·자재
-
-

20190628
1301
극양
시장 제일부(내국주)
50
수산·농림업
1
음식
7
TOPIX Small 2

20190628
9399
비트 홀딩스 리미티드
시장 제2부(외국주)
5250
정보·통신업
10
정보 통신 · 서비스 기타
-
-

20190628
1434년
제스코 홀딩스
시장 제2부(내국주)
2050년
건설업
3
건설·자재
-
-

20190628
8301
일본 은행 출자 증권
출자증권
-
-
-
-
-
-


금융청이 언젠가 좋은 움직임을했다.



EDINET, 데이터를 가공하기 쉽게 금융청 2019/4/3 20:00 일본경제신문 전자판

그 중 이쪽의 API 사용 형태로 다시하고 싶다!
금융청 EDINET-API(본가)

다음 단계



원시 xbrl 상태에서 서식까지 가져갈 수 있을까?
취득 데이터로부터 데이터 마트를 만들려고 시도했다.

좋은 웹페이지 즐겨찾기