Pandas Basic(2): DataFrame의 행, 열 및 데이터 유형

2730 단어 Pandas 베이스
DataFrame 데이터 설정:
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada', 'Nevada'],
        'year': [2000, 2001, 2002, 2001, 2002, 2003],
        'pop': [1.5, 1.7, 3.6, 2.4, 2.9, 3.2]}
df = pd.DataFrame(data)

출력:
	state	year	pop
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2


1. DataFrame의 데이터 형식은 dtypes 방법으로 표의 각 열의 데이터 형식을 볼 수 있습니다
df.dtypes

출력:
state     object
year       int64
pop      float64
dtype: object

2. 모든 열 이름 보기
df.columns

출력:
Index(['state', 'year', 'pop'], dtype='object')

3. 표에 열거된 총 수를 보기
df.shape[1]		# 
df.columns.size # 

4. 테이블에서 행의 총 수를 봅니다.
df.shape[0]		# 
len(df)			# 

5.shape 방법shape 방법표 규모(행, 열) 보기
df.shape

출력:
(6, 3)

6. 지정된 열 순서로 순서 변경
df.columns = ['year','state', 'pop' ]

출력:
	year	state	pop
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2


7. 열 이름 바꾸기
df.rename(columns={ df.columns[2]: "new name" }, inplace=True)

출력:
	year	state	new name
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2

df = df.rename(columns={'col_1': 'col_a'})

출력:
	col_a	state	new name
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2


모든 열 이름 바꾸기
df.columns = ['one','two','three']

출력:
	one		two		three
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2


8. 행 정보 보기
df.index

출력:
RangeIndex(start=0, stop=6, step=1)

9. 어떤 열의 수치 종류를 보고 이 열의 모든 종류를 보여 줍니다
df['state'].unique()

출력:
array(['Ohio', 'Nevada'], dtype=object)

모든 종류의 수를 계산하다
df['state'].nunique()

출력:
2

10. 열당 수치가 나타나는 횟수 보기
df['state'].value_counts()

출력:
Ohio      3
Nevada    3
Name: state, dtype: int64

좋은 웹페이지 즐겨찾기