OCI Data Science에서 Oracle Database에 연결하려고했습니다.

소개



Oracle Cloud Infrastructure(이후 OCI) Data Science는 2020년 2월에 출시된 데이터 분석 플랫폼입니다.

은근하게 만진 인상에서는, 특징은 이하라고 생각했습니다.
  • 노트북 세션 (JupyterLab) 사용 가능
  • 팀의 분석 환경 집약에 의해 정보 공유, 의사 결정이 촉진
    (그 사람 어떤 상황일까 환경을 살짝 볼 수 있다)
  • Oracle Accelerated Data Science(ADS) SDK 사용 가능
    ADS SDK는 OCI Data Science 서비스의 일부로 사전 설치된 Python 라이브러리입니다.
    알고리즘의 선택과 튜닝을 자동화해 주는 Auto ML 기능을 가지고 있습니다.
  • 저렴하게 사용 가능
    PaaS로서는 무료이며, Data Science 서비스를 세우자마자 바인드 하는 Compute 인스턴스의 요금만
     (활성화할 때마다 Compute 인스턴스의 셰이프나 블록 볼륨의 사이즈를 변경 가능).

  • 먼저 사용해 보자.



    노트북 세션 만들기



    아래의 기사를 참고로 작성했습니다.
    Oracle Cloud Infrastructure Data Science를 사용해 봅시다.

    노트북 세션 연결



    클라우드 콘솔의 열기에서 연결합니다.


    노트북 세션을 활성화할 때 컴퓨팅 인스턴스의 모양을 지정할 수 있으므로 필요할 때마다 필요한만큼 셰이프를 올려 청구를 줄일 수 있습니다.


    기존 OCI Database에 연결



    라이브러리 가져오기
    import pandas as pd
    import cx_Oracle
    import seaborn as sns
    

    DB에 연결하여 SELECT 결과 얻기
    connect=cx_Oracle.connect(user='<スキーマ名>', password='<PW>', dsn='<IPアドレス>:<ポート番号>/<サービス名>') 
    
    cursor = connect.cursor() # connect cursor
    
    #SQL Execute
    cursor.execute("select col_id, col1, col2, col3 from T_TEST") 
    #fetch
    data = cursor.fetchall() 
    # データフレームに列名指定
    headers = [ x[0] for x in cursor.description]
    df = pd.DataFrame(data, columns=headers)
    

    pairplot에서 산점도 행렬 시각화
    sns.pairplot(df,vars=['COL1','COL2','COL3'])
    



    ADS 사용해보기

    seaborn에서 세련된 그림을 얻어 OCI Data Science의 특징 중 하나 ADS를 잊어 버려.
    #ADS import
    import ads
    from ads.dataset.factory import DatasetFactory
    
    #データフレームをADSDatasetに格納
    ds = DatasetFactory.from_dataframe(df)
    
    #データ分布概要取得
    ds.show_in_notebook()
    





    ↑각 열마다의 통계량을 커맨드 하나로 취득 가능
    ADS의 매뉴얼 에서는 이하와 같이 그래프도 맞추어 묘화해 준다(그래프가 출력되지 않는 때도 있다, 원인은 지금까지 불명).

    #To plot a single column
    ds.plot("COL1").show_in_notebook()
    


    #To plot two columns against each other:
    ds.plot("COL1", y="COL3").show_in_notebook()
    



    ADS에 의한 Model Training 등은 향후.
    이상입니다.

    참조



    Oracle Cloud Infrastructure 문서 데이터 과학
    htps : // / cs. cぉd. 오 c. 코 m/쟈-jp/아아 s/다타-s 시엔세/우신 g/다타-s 시엔세. htm

    Oracle Accelerated Data Science SDK(ADS)
    htps : // / cs. cぉd. 오 c. 이 m/엔-우 s/아 아 s/와 오/s/아 ds-sdk/아 st/이어 x. HTML

    Oracle Cloud Infrastructure Data Science를 사용해 봅시다.
    htps : // 혼자서 ty. 오 c. 코 m / cs / C 1036110

    좋은 웹페이지 즐겨찾기