๐ Kedro - ๋ด ๋ฐ์ดํฐ๋ ํ ์ด๋ธ์ด ์๋๋๋ค
DataFrames๋ ๋๋ถ๋ถ์ ํ์ดํ๋ผ์ธ์ ํต์ฌ์ ๋๋ค.
์ด๋ฌํ ๋ฐ์ดํฐ ์ปจํ ์ด๋์๋ ํ ์ด๋ธ๊ณผ ๊ฐ์ ๋ฐ์ดํฐ ๊ตฌ์กฐ๋ฅผ ์กฐ์ํ๋ ํธ๋ฆฌํ ๋ฐฉ๋ฒ์ด ๋ง์ด ํฌํจ๋์ด ์์ต๋๋ค. ๋๋๋ก ์ฐ๋ฆฌ๋ ๋ค๋ฅธ ๋ฐ์ดํฐ ์ ํ, ์ฆ ๋ฐ๋๋ผ๋ฅผ ํ์ฉํฉ๋๋ค.
๋ชฉ๋ก ๋ฐ ์ฌ์ ๊ณผ ๊ฐ์ ์ ํ ๋๋ numpy ๋ฐ์ดํฐ ์ ํ.
๐คทโโ๏ธ ์ผ๋๋ก(ํ์ธ )๋?
Waylon Walker ใป 2020๋ 2์ 24์ผ ใป 3๋ถ ์ฝ๊ธฐ
unfamiliar with kedro, check out this post
๋๋๋ก ๋ฐ์ดํฐ ์ธํธ๋ ํ ์ด๋ธ์ด ์๋๋๋ค.
๋ฐ์ดํฐ๊ฐ DataFrame์ ์ ๋ง์ง ์๋ ๊ฒฝ์ฐ๊ฐ ์์ต๋๋ค. ์ด ์ข๊ฒ๋ Kedro๋ ์ฆ์ ํผํด์ ์ง์ํฉ๋๋ค. Pickle์ ํ์ด์ฌ์ ์ ์ฅํ๋ ๋ฐฉ๋ฒ์ ๋๋ค.
๊ฐ์ฒด๋ฅผ ๋์คํฌ์. ์ถ์ฒ๋ฅผ ์ ์ ์๋ ํผํด ํ์ผ์ ์ ์ฑ ์ฝ๋๋ฅผ ์คํํ ์ ์์ผ๋ฉฐ ์์ ํ์ง ์์ ๊ฒ์ผ๋ก ๊ฐ์ฃผ๋ฉ๋๋ค. ๋๋ถ๋ถ์ ๊ฒฝ์ฐ
์์ ์ ํผํด ํ์ผ์ ์ฝ๊ณ ์ฐ์ญ์์ค. ๊ทธ๋ค์ ๊ณ ๋ คํด์ผ ํ ์ข์ ๋๊ตฌ์ ๋๋ค.
See more about pickle from python.org.
ํผํด ๋ถ๋ฅ
์ผ๋ถ ์๋์ฐจ๋ฅผ ์ค๋ช ํ๋ ์ฌ์ ์ด ์์ ์ ์์ต๋๋ค.
{
'truck-012-abc': {
'type': 'truck'
'sales': [12, 2, 3, 4, 8]
'weight': 9024,
'accesories': ['leather', 'audio-1']
}
์นดํ๋ก๊ทธ์์ ์ ํ์
pickle.PickleDataSet
๋ก ์ค์ ํ๊ณ filepath
๋ฅผ ์ง์ ํฉ๋๋ค.cars:
filepath: data/cars.pkl
type: pickle.PickleDataSet
This
filepath
does not have to be on the local filesystem it can be on the cloud thanks to how kedro utilizesfsspec
for each of its datasets.
๋ฐ์ดํฐ์ธํธ ๋ก๋
MemoryDataSet
๋ก ๋๋ ๊ฒ๊ณผ ๋น๊ตํ์ฌ ์ด ๋ฐ์ดํฐ ์ธํธ๋ฅผ ์นดํ๋ก๊ทธํํ๋ ์ด์ ์ ์ถ๊ฐ ๊ฐ๋ฐ ๋๋ ๋๋ฒ๊น
์ ์ํด ํ์ดํ๋ผ์ธ์ ์คํํ์ง ์๊ณ ๋ ์ด ๋ฐ์ดํฐ๋ฅผ ๋ฉ๋ชจ๋ฆฌ๋ก ๋ค์ ์ฝ๊ฒ ๋ก๋ํ ์ ์๋ค๋ ๊ฒ์
๋๋ค.catalog.load('cars')
Reference
์ด ๋ฌธ์ ์ ๊ดํ์ฌ(๐ Kedro - ๋ด ๋ฐ์ดํฐ๋ ํ ์ด๋ธ์ด ์๋๋๋ค), ์ฐ๋ฆฌ๋ ์ด๊ณณ์์ ๋ ๋ง์ ์๋ฃ๋ฅผ ๋ฐ๊ฒฌํ๊ณ ๋งํฌ๋ฅผ ํด๋ฆญํ์ฌ ๋ณด์๋ค https://dev.to/waylonwalker/kedro-my-data-is-not-a-table-2kdiํ ์คํธ๋ฅผ ์์ ๋กญ๊ฒ ๊ณต์ ํ๊ฑฐ๋ ๋ณต์ฌํ ์ ์์ต๋๋ค.ํ์ง๋ง ์ด ๋ฌธ์์ URL์ ์ฐธ์กฐ URL๋ก ๋จ๊ฒจ ๋์ญ์์ค.
์ฐ์ํ ๊ฐ๋ฐ์ ์ฝํ ์ธ ๋ฐ๊ฒฌ์ ์ ๋ (Collection and Share based on the CC Protocol.)
์ข์ ์นํ์ด์ง ์ฆ๊ฒจ์ฐพ๊ธฐ
๊ฐ๋ฐ์ ์ฐ์ ์ฌ์ดํธ ์์ง
๊ฐ๋ฐ์๊ฐ ์์์ผ ํ ํ์ ์ฌ์ดํธ 100์ ์ถ์ฒ ์ฐ๋ฆฌ๋ ๋น์ ์ ์ํด 100๊ฐ์ ์์ฃผ ์ฌ์ฉํ๋ ๊ฐ๋ฐ์ ํ์ต ์ฌ์ดํธ๋ฅผ ์ ๋ฆฌํ์ต๋๋ค