빠른 팁: Python 클라이언트를 사용하여 SingleStoreDB에 액세스

5873 단어 singlestoredbpython

추상적인



Python Client을 통해 개발자는 SingleStoreDB를 빠르게 시작하고 실행할 수 있습니다. 이 짧은 기사에서는 Python 클라이언트를 구성하고 사용하는 방법에 대해 설명합니다. 우리는 Deepnote를 개발 환경으로 사용할 것입니다.

소개



Python은 오늘날 가장 인기 있는 프로그래밍 언어 중 하나입니다. 또한 데이터 과학자들이 널리 사용합니다. Python을 SingleStoreDB와 함께 사용하는 방법에 대한 몇 가지 작은 코드 예제와 수행에 관심이 있을 수 있는 일부 데이터 분석을 살펴보겠습니다.

딥노트 계정 만들기



Deepnote 웹사이트에 무료account를 생성해 드립니다. 로그인하면 새로운 Deepnote 프로젝트를 생성하여 새 노트북을 제공합니다. data 폴더도 만들어야 합니다. data 폴더에 CSV을 포함하는 Iris flower data set 파일을 저장합니다.

SingleStoreDB 클라우드 계정 생성



A는 무료 SingleStoreDB Cloud 계정을 만드는 데 필요한 단계를 보여주었습니다. Iris Demo Group을 작업 공간 그룹 이름으로 사용하고 iris-demo를 작업 공간 이름으로 사용합니다. 암호와 호스트 이름을 기록해 둡니다. 마지막으로 SQL 편집기를 사용하여 새 데이터베이스를 만듭니다.

CREATE DATABASE iris_demo;


딥노트 노트북



이제 노트북을 작성해 보겠습니다.

먼저 Python 클라이언트를 설치해야 합니다.

!pip install singlestoredb


다음으로 라이브러리를 가져옵니다.

import singlestoredb as s2


이제 SingleStoreDB에 대한 연결을 생성합니다.

conn = s2.connect(
            host = "<host>",
            port = "3306",
            user = "admin",
            password = "<password>",
            database = "iris_demo",
            results_format = "dataframe"
        )

<host><password>를 SingleStoreDB Cloud 계정의 값으로 바꿉니다. results_format는 몇 가지 옵션을 제공하며 이 예에서는 Pandas Dataframe을 사용합니다.

이제 다음과 같이 CSV 데이터를 Pandas Dataframe으로 읽어 봅시다.

import pandas as pd

df = pd.read_csv("data/iris.csv", index_col = False)


다음과 같이 데이터를 볼 수 있습니다.

print(df.head(5))


출력은 다음과 유사해야 합니다.

   sepal_length  sepal_width  petal_length  petal_width      species
0           5.1          3.5           1.4          0.2  Iris-setosa
1           4.9          3.0           1.4          0.2  Iris-setosa
2           4.7          3.2           1.3          0.2  Iris-setosa
3           4.6          3.1           1.5          0.2  Iris-setosa
4           5.0          3.6           1.4          0.2  Iris-setosa


이제 데이터를 SingleStoreDB에 삽입하기 위한 SQL 문을 준비하겠습니다.

stmt = """
    INSERT INTO iris (
        sepal_length,
        sepal_width,
        petal_length,
        petal_width,
        species
    ) VALUES (:1, :2, :3, :4, :5)
"""


다음으로 테이블을 만들고 Pandas Dataframe의 데이터를 SingleStoreDB에 삽입한 다음 SingleStoreDB에서 새 Dataframe으로 데이터를 다시 검색합니다.

with conn:
    conn.autocommit(True)
    with conn.cursor() as cur:
        cur.execute("""
            CREATE TABLE iris (
                sepal_length FLOAT,
                sepal_width FLOAT,
                petal_length FLOAT,
                petal_width FLOAT,
                species VARCHAR(20)
            )
        """)
        cur.executemany(stmt, df)
        cur.execute("""
            SELECT *
            FROM iris
        """)
        iris_df = cur.fetchall()


이제 PCA과 같은 일부 데이터 분석을 수행할 수 있습니다.

# https://plotly.com/python/pca-visualization/

import plotly.express as px
from sklearn.decomposition import PCA

X = iris_df[[
    "sepal_length",
    "sepal_width",
    "petal_length",
    "petal_width"
]]

pca = PCA(n_components = 2)
components = pca.fit_transform(X)

pca_fig = px.scatter(
    components,
    x = 0,
    y = 1,
    color = iris_df["species"]
)

pca_fig.show()


출력은 그림 1과 유사해야 합니다.



그림 1. PCA

상관 관계도 확인할 수 있습니다.

import matplotlib.pyplot as plt
import seaborn as sns

sns.heatmap(
    iris_df.corr(),
    cmap = "OrRd",
    annot = True
)

plt.title("Correlations")
plt.plot()


출력은 그림 2와 유사해야 합니다.



그림 2. 상관 관계.

등등.

요약



Python 클라이언트는 다양한 옵션을 제공하며, 이 기사에서는 대량 데이터로 작업하는 편리한 방법인 데이터 프레임을 사용했습니다. documentation에서는 다른 옵션을 사용하는 방법에 대한 예를 제공합니다.

좋은 웹페이지 즐겨찾기