세부 사항 요약
8008 단어 GoogleColaboratorypandasPython3
소개
파이썬에서의 여러가지 조작을 잊어 버리므로 정리해 가고 싶습니다!
공부하면 업데이트 할 예정입니다
zip 파일 압축 풀기
google colaboratry 등의 노트북을 사용했을 때 데이터 세트 등의 zip을 압축 해제하는 방법입니다
!unzip "drive/My Drive/~/nyannyan.zip"
.csv, .tsv 로드
import pandas as pd
#csvを読み込む
csv = pd.read_csv('path.csv')
#tsvを読み込む
tsv = pd.read_table('path.tsv')
zip 등으로 압축된 csv 파일을 그대로 읽을 수도 있다.
df_zip = pd.read_csv('Path.zip')
DataFrame의 값을 목록 형식으로 변환
import pandas as pd
df = pd.DataFrame([['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun'], ['a', 'b', 'c', 'd', 'e', 'f', 'g']])
#valuesのtolistでリスト形式に戻す
df.values.tolist()
DataFrame의 컬럼 추출
열 이름(열 이름)을 지정하여 특정 열을 추출할 수 있습니다.
import pandas as pd
#"A"列を抽出
df['A']
# . (ドット) を利用しても同じ結果が得られます。
df.A
#複数のカラムを抽出
df[['A', 'B', 'C']]
DataFrame의 열 이름 바꾸기
#'A'のカラム名を'a'に変更、'C'のカラム名を'c'に変更
df.rename(columns={'A': 'a', 'C': 'c'})
DataFrame에서 조건을 지정하여 값 추출
#'age'のカラムの値が25未満のものを抽出
df[df['age'] < 25]
#.query()を使っても同じ結果を得られる
df.query('age < 25')
#複数選択も可能
#ageの値が25 かつ pointが50以上のものを抽出
df_store.query('(age == "25" & point > 50)')
#notも使える(age=50またはpoimnt>50でないものを抽出)
#| = OR, & = AND,
df_store.query('not(age == "25" | point > 50)')
특정 문자열을 포함하는 행 추출
이것은 100 개의 데이터 처리 노크에서 처음으로 사용되었습니다
#str.contains('li'):特定の文字列を含む
df[df['name'].str.contains('li')]
#str.endswith():特定の文字列で終わる
df[df['name'].str.endswith('e')]
#str.startswith(): 特定の文字列で始まる
df[df['name'].str.startswith('B')]
참고문헌
Google Colaboratory에서 zip 파일의 압축해제라든지. 이거 메모
pandas에서 csv/tsv 파일 로드(read_csv, read_table)
【편리한】Python 표준의 리스트와 Pandas 의 DataFrame, Series를 상호 변환하는 방법을 정리해 보았다
Pandas에서 데이터 프레임에서 특정 행 및 열 가져 오기
pandas.DataFrame의 행 이름과 열 이름 변경
pandas.DataFrame의 행을 조건으로 추출하는 query
pandas에서 특정 문자열을 포함하는 행 추출 (완전 일치, 부분 일치)
Reference
이 문제에 관하여(세부 사항 요약), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
https://qiita.com/nekotanku/items/5f18fe87497b4138a6f0
텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념
(Collection and Share based on the CC Protocol.)
#'age'のカラムの値が25未満のものを抽出
df[df['age'] < 25]
#.query()を使っても同じ結果を得られる
df.query('age < 25')
#複数選択も可能
#ageの値が25 かつ pointが50以上のものを抽出
df_store.query('(age == "25" & point > 50)')
#notも使える(age=50またはpoimnt>50でないものを抽出)
#| = OR, & = AND,
df_store.query('not(age == "25" | point > 50)')
#str.contains('li'):特定の文字列を含む
df[df['name'].str.contains('li')]
#str.endswith():特定の文字列で終わる
df[df['name'].str.endswith('e')]
#str.startswith(): 特定の文字列で始まる
df[df['name'].str.startswith('B')]
Reference
이 문제에 관하여(세부 사항 요약), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/nekotanku/items/5f18fe87497b4138a6f0텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)