【Pandas】기초 1(DataFrame, Series)
소개
기계 학습이나 심층 학습이 인기의 요즈음,
데이터를 가공하고 전처리를 할 기회가 매우 많아지고 있다.
데이터 처리 방법은 다양하게 존재하지만, 그 데이터 처리 툴의 하나로서 python의 pandas가 존재한다.
그래서 이번에는 공식 pandas intro 기사
pandas의 기초에 DaraFrame, Series에 대해 적는다.
원래 Pandas는 어떤 데이터를 처리하기에 적합합니까?
테이블 형식의 데이터를 처리하는 데 매우 적합합니다.
예를 들어 엑셀이나 SQL 같은 데이터이다.
pandas를 이용함으로써 데이터의 검색이나 데이터의 처리 등을 행할 수 있다.
DataFrame
pandas가 사용할 수 있는 데이터 테이블이다.
아래 그림과 같이 행(rows) 열(columns)로 구성되어 있다.
파이썬으로 작성하는 방법
수동으로 dataframe을 만들려면 파이썬 dictonary를 사용하십시오.
dictonary의 키가 DataFrame의 열의 head로서, dictonary의 리스트가 DataFrame의 행이 된다.
df = pd.DataFrame({
"Name": ["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"]}
)
출력 결과
시리즈
Series란 DataFrame의 각 열을 말한다.
이미지는 다음과 같습니다
파이썬으로 작성하는 방법
예를 들어 위의 DataFrame에서 'Name'을 가져옵니다.
series = df['Name']
또는 수동으로 만들 수 있습니다.
series2 = pd.Series(["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
name = 'Name'
)
출력 결과
요약
테이블 형식의 데이터를 처리하는 데 매우 적합합니다.
예를 들어 엑셀이나 SQL 같은 데이터이다.
pandas를 이용함으로써 데이터의 검색이나 데이터의 처리 등을 행할 수 있다.
DataFrame
pandas가 사용할 수 있는 데이터 테이블이다.
아래 그림과 같이 행(rows) 열(columns)로 구성되어 있다.
파이썬으로 작성하는 방법
수동으로 dataframe을 만들려면 파이썬 dictonary를 사용하십시오.
dictonary의 키가 DataFrame의 열의 head로서, dictonary의 리스트가 DataFrame의 행이 된다.
df = pd.DataFrame({
"Name": ["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"]}
)
출력 결과
시리즈
Series란 DataFrame의 각 열을 말한다.
이미지는 다음과 같습니다
파이썬으로 작성하는 방법
예를 들어 위의 DataFrame에서 'Name'을 가져옵니다.
series = df['Name']
또는 수동으로 만들 수 있습니다.
series2 = pd.Series(["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
name = 'Name'
)
출력 결과
요약
df = pd.DataFrame({
"Name": ["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
"Age": [22, 35, 58],
"Sex": ["male", "male", "female"]}
)
Series란 DataFrame의 각 열을 말한다.
이미지는 다음과 같습니다
파이썬으로 작성하는 방법
예를 들어 위의 DataFrame에서 'Name'을 가져옵니다.
series = df['Name']
또는 수동으로 만들 수 있습니다.
series2 = pd.Series(["Braund, Mr. Owen Harris",
"Allen, Mr. William Henry",
"Bonnell, Miss. Elizabeth"],
name = 'Name'
)
출력 결과
요약
참고
Reference
이 문제에 관하여(【Pandas】기초 1(DataFrame, Series)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/hgaiji/items/bd3843a2c8b01a954ac0텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)