FX 데이터를 특이값 ​​분해(Singular Value Decomposition)

1920 단어 pandasFXPython3numpy

이전 준비



우선 FX 데이터를 준비한다. 이번에 이용한 FX의 데이터는 stooq 으로부터 입수한 csv 파일을 이용하였다. 데이터 양에 관해서는 임의. 또한 실행하는 파일과 FX의 데이터는 동일한 디렉토리에 저장되어 있습니다.

전처리


import pandas as pd
import numpy as np
A = pd.read_csv("usdjpy20142019.csv")
A.head()

실행 결과(이번 데이터는 최근 최근 약 5년분의 데이터를 이용했다.)


Date를 제외하고. Date를 포함하면, 「TypeError: No loop matching the specified signature and casting was found for ufunc svd_n_f」라는 에러를 토출하기 위해.
그리고 마지막으로 특이 값 분해를 한 결과를 csv 형식으로 저장합니다.
df = A.iloc[:, 1:]
U, S, V = np.linalg.svd(df, full_matrices=True)
U = pd.DataFrame(U)
U.to_csv("U.csv", index=True)
V = pd.DataFrame(V)
V.to_csv("V.csv", index=True)
S = pd.DataFrame(S)
S.to_csv("S.csv", index=True)

데이터 해석에 대해서는 또 이번, 우선 이번은 방법등을 한가지 실행할 수 있는 것의 확인의 생각으로 가 보았다. 또 이번에 실시한 프로그램에 대해서

1. 파일의 취급에 있어서, 다른 디렉토리의 경우의 보존 방법
2. Date는 포함되어야 하는지 여부
3.2에 포함시킬 수 있는 경우의 해결 방법
4. excel 파일의 경우 로딩 방법
5. excel 파일과 csv 파일의 차이

이상에 대해 조금 신경이 쓰이기 때문에 조사해 보려고 생각한다.

(추기)
pd.read_csv 및 pd.to_csv
pd.read_excel 및 pd.to_excel
excel과 CSV의 차이 은 이계의 대학에서는 실험 장치에 접속하고 있는 PC가 Office를 인스톨 하고 있는 것은 아니기 때문이다. 간단하게 말하면 호환성이 높기 때문에 csv 파일로 취급하고 있다.

좋은 웹페이지 즐겨찾기