빠른 팁: Python 클라이언트를 사용하여 SingleStoreDB에 액세스
5873 단어 singlestoredbpython
추상적인
Python Client을 통해 개발자는 SingleStoreDB를 빠르게 시작하고 실행할 수 있습니다. 이 짧은 기사에서는 Python 클라이언트를 구성하고 사용하는 방법에 대해 설명합니다. 우리는 Deepnote를 개발 환경으로 사용할 것입니다.
소개
Python은 오늘날 가장 인기 있는 프로그래밍 언어 중 하나입니다. 또한 데이터 과학자들이 널리 사용합니다. Python을 SingleStoreDB와 함께 사용하는 방법에 대한 몇 가지 작은 코드 예제와 수행에 관심이 있을 수 있는 일부 데이터 분석을 살펴보겠습니다.
딥노트 계정 만들기
Deepnote 웹사이트에 무료account를 생성해 드립니다. 로그인하면 새로운 Deepnote 프로젝트를 생성하여 새 노트북을 제공합니다.
data
폴더도 만들어야 합니다. data
폴더에 CSV을 포함하는 Iris flower data set 파일을 저장합니다.SingleStoreDB 클라우드 계정 생성
A는 무료 SingleStoreDB Cloud 계정을 만드는 데 필요한 단계를 보여주었습니다. Iris Demo Group을 작업 공간 그룹 이름으로 사용하고 iris-demo를 작업 공간 이름으로 사용합니다. 암호와 호스트 이름을 기록해 둡니다. 마지막으로 SQL 편집기를 사용하여 새 데이터베이스를 만듭니다.
CREATE DATABASE iris_demo;
딥노트 노트북
이제 노트북을 작성해 보겠습니다.
먼저 Python 클라이언트를 설치해야 합니다.
!pip install singlestoredb
다음으로 라이브러리를 가져옵니다.
import singlestoredb as s2
이제 SingleStoreDB에 대한 연결을 생성합니다.
conn = s2.connect(
host = "<host>",
port = "3306",
user = "admin",
password = "<password>",
database = "iris_demo",
results_format = "dataframe"
)
<host>
및 <password>
를 SingleStoreDB Cloud 계정의 값으로 바꿉니다. results_format
는 몇 가지 옵션을 제공하며 이 예에서는 Pandas Dataframe을 사용합니다.이제 다음과 같이 CSV 데이터를 Pandas Dataframe으로 읽어 봅시다.
import pandas as pd
df = pd.read_csv("data/iris.csv", index_col = False)
다음과 같이 데이터를 볼 수 있습니다.
print(df.head(5))
출력은 다음과 유사해야 합니다.
sepal_length sepal_width petal_length petal_width species
0 5.1 3.5 1.4 0.2 Iris-setosa
1 4.9 3.0 1.4 0.2 Iris-setosa
2 4.7 3.2 1.3 0.2 Iris-setosa
3 4.6 3.1 1.5 0.2 Iris-setosa
4 5.0 3.6 1.4 0.2 Iris-setosa
이제 데이터를 SingleStoreDB에 삽입하기 위한 SQL 문을 준비하겠습니다.
stmt = """
INSERT INTO iris (
sepal_length,
sepal_width,
petal_length,
petal_width,
species
) VALUES (:1, :2, :3, :4, :5)
"""
다음으로 테이블을 만들고 Pandas Dataframe의 데이터를 SingleStoreDB에 삽입한 다음 SingleStoreDB에서 새 Dataframe으로 데이터를 다시 검색합니다.
with conn:
conn.autocommit(True)
with conn.cursor() as cur:
cur.execute("""
CREATE TABLE iris (
sepal_length FLOAT,
sepal_width FLOAT,
petal_length FLOAT,
petal_width FLOAT,
species VARCHAR(20)
)
""")
cur.executemany(stmt, df)
cur.execute("""
SELECT *
FROM iris
""")
iris_df = cur.fetchall()
이제 PCA과 같은 일부 데이터 분석을 수행할 수 있습니다.
# https://plotly.com/python/pca-visualization/
import plotly.express as px
from sklearn.decomposition import PCA
X = iris_df[[
"sepal_length",
"sepal_width",
"petal_length",
"petal_width"
]]
pca = PCA(n_components = 2)
components = pca.fit_transform(X)
pca_fig = px.scatter(
components,
x = 0,
y = 1,
color = iris_df["species"]
)
pca_fig.show()
출력은 그림 1과 유사해야 합니다.
그림 1. PCA
상관 관계도 확인할 수 있습니다.
import matplotlib.pyplot as plt
import seaborn as sns
sns.heatmap(
iris_df.corr(),
cmap = "OrRd",
annot = True
)
plt.title("Correlations")
plt.plot()
출력은 그림 2와 유사해야 합니다.
그림 2. 상관 관계.
등등.
요약
Python 클라이언트는 다양한 옵션을 제공하며, 이 기사에서는 대량 데이터로 작업하는 편리한 방법인 데이터 프레임을 사용했습니다. documentation에서는 다른 옵션을 사용하는 방법에 대한 예를 제공합니다.
Reference
이 문제에 관하여(빠른 팁: Python 클라이언트를 사용하여 SingleStoreDB에 액세스), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://dev.to/veryfatboy/quick-tip-accessing-singlestoredb-using-the-python-client-3514텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)