세부 사항 요약

소개



파이썬에서의 여러가지 조작을 잊어 버리므로 정리해 가고 싶습니다!
공부하면 업데이트 할 예정입니다

zip 파일 압축 풀기



google colaboratry 등의 노트북을 사용했을 때 데이터 세트 등의 zip을 압축 해제하는 방법입니다
!unzip "drive/My Drive/~/nyannyan.zip"

.csv, .tsv 로드


import pandas as pd
#csvを読み込む
csv = pd.read_csv('path.csv')

#tsvを読み込む
tsv = pd.read_table('path.tsv')

zip 등으로 압축된 csv 파일을 그대로 읽을 수도 있다.

df_zip = pd.read_csv('Path.zip')

DataFrame의 값을 목록 형식으로 변환


import pandas as pd

df = pd.DataFrame([['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun'], ['a', 'b', 'c', 'd', 'e', 'f', 'g']])

#valuesのtolistでリスト形式に戻す
df.values.tolist()

DataFrame의 컬럼 추출



열 이름(열 이름)을 지정하여 특정 열을 추출할 수 있습니다.
import pandas as pd
#"A"列を抽出
df['A']

# . (ドット) を利用しても同じ結果が得られます。
df.A

#複数のカラムを抽出
df[['A', 'B', 'C']]

DataFrame의 열 이름 바꾸기


#'A'のカラム名を'a'に変更、'C'のカラム名を'c'に変更
df.rename(columns={'A': 'a', 'C': 'c'})

DataFrame에서 조건을 지정하여 값 추출


#'age'のカラムの値が25未満のものを抽出
df[df['age'] < 25]

#.query()を使っても同じ結果を得られる
df.query('age < 25')

#複数選択も可能
#ageの値が25 かつ pointが50以上のものを抽出
df_store.query('(age == "25" & point > 50)')

#notも使える(age=50またはpoimnt>50でないものを抽出)
#| = OR, & = AND,  
df_store.query('not(age == "25" | point > 50)')

특정 문자열을 포함하는 행 추출



이것은 100 개의 데이터 처리 노크에서 처음으로 사용되었습니다

#str.contains('li'):特定の文字列を含む
df[df['name'].str.contains('li')]

#str.endswith():特定の文字列で終わる
df[df['name'].str.endswith('e')]

#str.startswith(): 特定の文字列で始まる
df[df['name'].str.startswith('B')]

참고문헌



Google Colaboratory에서 zip 파일의 압축해제라든지. 이거 메모

pandas에서 csv/tsv 파일 로드(read_csv, read_table)

【편리한】Python 표준의 리스트와 Pandas 의 DataFrame, Series를 상호 변환하는 방법을 정리해 보았다

Pandas에서 데이터 프레임에서 특정 행 및 열 가져 오기

pandas.DataFrame의 행 이름과 열 이름 변경

pandas.DataFrame의 행을 조건으로 추출하는 query

pandas에서 특정 문자열을 포함하는 행 추출 (완전 일치, 부분 일치)

좋은 웹페이지 즐겨찾기