【Pandas】기초 1(DataFrame, Series)

소개



기계 학습이나 심층 학습이 인기의 요즈음,
데이터를 가공하고 전처리를 할 기회가 매우 많아지고 있다.

데이터 처리 방법은 다양하게 존재하지만, 그 데이터 처리 툴의 하나로서 python의 pandas가 존재한다.

그래서 이번에는 공식 pandas intro 기사
pandas의 기초에 DaraFrame, Series에 대해 적는다.

원래 Pandas는 어떤 데이터를 처리하기에 적합합니까?



테이블 형식의 데이터를 처리하는 데 매우 적합합니다.
예를 들어 엑셀이나 SQL 같은 데이터이다.

pandas를 이용함으로써 데이터의 검색이나 데이터의 처리 등을 행할 수 있다.

DataFrame



pandas가 사용할 수 있는 데이터 테이블이다.

아래 그림과 같이 행(rows) 열(columns)로 구성되어 있다.


파이썬으로 작성하는 방법



수동으로 dataframe을 만들려면 파이썬 dictonary를 사용하십시오.

dictonary의 키가 DataFrame의 열의 head로서, dictonary의 리스트가 DataFrame의 행이 된다.
df = pd.DataFrame({
        "Name": ["Braund, Mr. Owen Harris",
                 "Allen, Mr. William Henry",
                 "Bonnell, Miss. Elizabeth"],
        "Age": [22, 35, 58],
        "Sex": ["male", "male", "female"]}
     )

출력 결과





시리즈



Series란 DataFrame의 각 열을 말한다.



이미지는 다음과 같습니다


파이썬으로 작성하는 방법



예를 들어 위의 DataFrame에서 'Name'을 가져옵니다.
series = df['Name']

또는 수동으로 만들 수 있습니다.
series2 = pd.Series(["Braund, Mr. Owen Harris",
                     "Allen, Mr. William Henry",
                     "Bonnell, Miss. Elizabeth"],
                     name = 'Name'
          )

출력 결과





요약


  • DataFrame
  • pandas에서 다루는 데이터 테이블

  • Series
  • DataFrame의 각 열입니다.


  • 참고


  • htps // 팬더 s. py였다. 오 rg/도 cs/갓찐 g_s r d/이어 x. html
  • 좋은 웹페이지 즐겨찾기