Pandas Basic(2): DataFrame의 행, 열 및 데이터 유형
2730 단어 Pandas 베이스
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
'year': [2000, 2001, 2002, 2001, 2002, 2003],
'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data)
출력:
state year pop
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
5 Nevada 2003 3.2
1. DataFrame의 데이터 형식은 dtypes 방법으로 표의 각 열의 데이터 형식을 볼 수 있습니다
df.dtypes
출력:
state object
year int64
pop float64
dtype: object
2. 모든 열 이름 보기
df.columns
출력:
Index(['state', 'year', 'pop'], dtype='object')
3. 표에 열거된 총 수를 보기
df.shape[1] #
df.columns.size #
4. 테이블에서 행의 총 수를 봅니다.
df.shape[0] #
len(df) #
5.shape 방법shape 방법표 규모(행, 열) 보기
df.shape
출력:
(6, 3)
6. 지정된 열 순서로 순서 변경
df.columns = ['year','state', 'pop' ]
출력:
year state pop
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
5 Nevada 2003 3.2
7. 열 이름 바꾸기
df.rename(columns={ df.columns[2]: "new name" }, inplace=True)
출력:
year state new name
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
5 Nevada 2003 3.2
df = df.rename(columns={'col_1': 'col_a'})
출력:
col_a state new name
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
5 Nevada 2003 3.2
모든 열 이름 바꾸기
df.columns = ['one','two','three']
출력:
one two three
0 Ohio 2000 1.5
1 Ohio 2001 1.7
2 Ohio 2002 3.6
3 Nevada 2001 2.4
4 Nevada 2002 2.9
5 Nevada 2003 3.2
8. 행 정보 보기
df.index
출력:
RangeIndex(start=0, stop=6, step=1)
9. 어떤 열의 수치 종류를 보고 이 열의 모든 종류를 보여 줍니다
df['state'].unique()
출력:
array(['Ohio', 'Nevada'], dtype=object)
모든 종류의 수를 계산하다
df['state'].nunique()
출력:
2
10. 열당 수치가 나타나는 횟수 보기
df['state'].value_counts()
출력:
Ohio 3
Nevada 3
Name: state, dtype: int64