Python Library - Pandas(3)

본 게시물은 코드프레소의 code.PRESS-UP 체험단 과정을 담은 게시물입니다.

해당 게시물 수강강좌 :

파이썬으로 배우는 데이터 분석 : Pandas

Pandas 라이브러리로 데이터 분석 시작하기

https://www.codepresso.kr/course/56

이번 포스팅에서는 DataFrame의 데이터를 조회/변경/추가/삭제하는 방법에 대해 알아보겠습니다.

DataFrame을 다루는데 가장 기초적인 부분이니 코드프레소 강의를 통해 꼼꼼하게 체크 하도록 합시다.

1. DataFrame 데이터 조회

1-1. 열 데이터 조회

📌 인덱싱 기법 사용

DataFrame['name']
DataFrame[['name', 'subject', 'class']]

📌 연산자 사용

DataFrame.name
DataFrame.subject

여러 개의열 데이터를 조회시에는 인덱스 값을 리스트 형태로 전달 할 수 있는 인덱싱 기법 사용

1-2. 행 데이터 조회

📌 행 데이터 조회를 위해 loc 프로퍼티 사용
📌 조회하고자 하는 행의 인덱스 값 전달하는 방식

DataFrame.loc[1]
DataFrame.loc[[0, 2, 4]]

1-3. 행&열 데이터 조회

📌 행과 열의 조건을 동시에 지정하여 조회

row_idx = [1, 2, 4]
col_idx = ['name', 'subject', 'grade']
DataFrame.loc[row_idx, col_idx]

2. DataFrame 데이터 변경

2-1. 열 데이터 변경

📌 변경하고 싶은 열에 값을 대입

dataframe['etc'] = 0
dataframe['example'] = [1, 2, 3, 4, 5]

2-2. 행 데이터 변경

📌 변경하고 싶은 행 인덱스를 지정 후 리스트 값 대입

dataframe.loc[0] = ['Jessi', 'java', 70, 'C', 1]
dataframe.loc[1] = ['code', 'presso', 'best', 'study', 'platform']

3. DataFrame 데이터 추가

3-1. 새로운 열 데이터 추가

📌 Series를 이용하여 열 데이터 추가

new_data_set = pd.Series([])
dataframe['new column'] = new_data_set

📌 연산을 이용하여 열 데이터 추가

# boolean 값으로 반환
dataframe['high_score'] = df['score'] > 90

3-2. 새로운 행 데이터 추가

📌 loc 프로퍼티를 이용하여 행 데이터 추가

dataframe.loc['new row']
dataframe.loc[6] = ['Jina', 'python', 100, 'A', 1,'20-02', True]

4. DataFrame 데이터 삭제

4-1. 열 데이터 삭제

📌 열 데이터 삭제시 columns 인자에 삭제할 열의 인덱스 지정

dataframe.drop(index, columns)
dataframe.drop(columns = [col_index])

4-2. 행 데이터 삭제

📌 drop() 함수를 이용한 데이터 삭제
기본적으로 drop() 함수는 행 데이터를 삭제한다.
삭제된 상태의 객체를 반환할 뿐, 원본 데이터는 삭제하지 않음
삭제된 객체는 새로운 변수에 저장하여 사용 권장

dataframe.drop(index)
dataframe.drop(6)

## 원본 데이터 삭제
dataframe.drop(index, inplace = True)
## inplace = True를 입력하면, 원본 데이터를 변경함

여기까지 코드프레소 강의를 통한 DataFrame 데이터를 조회/변경/추가/삭제 하는 방법을 알아보았습니다.

조회/변경/추가/삭제는 Dataframe 뿐만 아니라 DataBase의 기초적인 CRUD 이론의 그 자체입니다.

확실하게 개념을 가지고 간다면 다른 데이터베이스를 다루는데에도 큰 문제가 없을 것입니다.

좋은 웹페이지 즐겨찾기