판다스 [Pandas] 특정 문자를 포함하는 행 추출, 특정 조건 만족하는 행 추출, 판다스 인덱스 리셋 먼저 다음과 같은 데이터 프레임이 있다. contents 칼럼은 문자열로 이루어져 있는데, 이 중 문자 'w'를 포함하는 행을 삭제하는 작업을 해보자. for문을 돌려서 해볼 수도 있겠지만 데이터프레임 규모가 큰 경우 시간이 오래 걸린다. 굳이 for문으로 코딩하지 않더라도 코드 한 줄로 원하는 작업을 할 수 있다면 쓰지 않을 이유가 없다. 다음과 같이 코드를 입력하고 test_df를 확인해... 파이썬python판다스pandaspandas [판다스] 왕초보 판다스 - 개념과 시리즈, 데이터프레임 만들기 판다스(Pandas)는 파이썬에서 2차원 배열 데이터를 간편하게 다룰 수 있도록 만들어진 라이브러리다. 정형 데이터를 다루는 라이브러리다. 엑셀과 비슷한 느낌이라고 생각하면 되겠다. Python Data Analysis Library 를 뜻하고, 다차원 정형 데이터를 나타내는 경제학 용어인 panel data에서 그 이름을 따왔다고 한다. 정형(structured) vs. 반정형(semi s... dataframe판다스pandasdataframe 판다스 각각의 로우(row) 백분율 구하는 방법(The method Compute row percentages in pandas DataFrame) 판다스로 작업을 하다보면 각각의 데이터(행, row) 마다 백분율을 구하게 되는 경우가 있다. 이해를 돕기 위해 아래의 예시를 먼저 보자. "서울시의 시군구와 연령별 인구 수" 에 대한 테이블이 있다. 이때 우리는 해당 데이터를 봤을때 어떤 시군구에 어떤 연령층이 많은지 알고싶어도 위와같이 "인구 수"를 나열한 것으로 정보를 가독하기 힘들다. 이때는 각 시군구(행, row, 데이터) 별로 백... 판다스판다스 [Pandas] Modin.pandas를 사용한 판다스(pandas) 속도 높이기 이 글은 빅데이터에서 판다스를 사용할 때 너무 느린 속도를 빠르게 하는 방법을 정리한 글이다. 1. 판다스(pandas) 판다스는 데이터 분석을 위해서 사용하는 대표적인 툴 설치방법 사용방법 여기까지는 기본 판다스를 사용하는 방법이다. 참고했던 자료들에 따르면, 기존 판다스는 1GB 이내에서 사용할만 하다고 한다. 데이터가 10GB 넘어가고 난리 났을 때는 이 판다스를 쓰면 안된다. modi... pandas판다스속도높이기pandas SW과정 머신러닝 1014(7) 1. pandas03 코드 정리 2. matplotlib 3. Kobis Open API 주요내용 메모 판다스 차트 라이브러리 정리 python import time... 머신러닝파이썬판다스머신러닝 SW과정 머신러닝 1022(13) 1. Titanic 분석 2. 손글씨.ipynb... 머신러닝파이썬판다스머신러닝 [Data Handling] Pandas :: (7) Built-in functions Numeric type 데이터의 요약 정보를 보여줌 earn height sex race ed age male white female white female white female female white earn height ed age count mean std min max unique series data의 유일한 값을 list로 반환 array(['white', 'other', 'hi... 머신러닝머신러닝을 위한 파이썬판다스파이썬머신러닝 파이썬 데이터분석 첫걸음 - 1주차 colab으로 만들어진? 주피터노트북은 링크 공유받아서 써봤는데, 내가 컴퓨터에 설치해서 써본 건 처음이다. 회사의 아이맥에도 아나콘다( ) 설치하고 집에 있는 윈도우 데스크탑에도 설치했다. 파이썬 기본문법은 대충 다 아는 내용일 줄 알았는데, list, dict 리스트와 딕셔너리까지는 알았지만, set에서 멈칫했다. set에 넣으면 중복된 원소는 알아서 사라진다(?). set은 수학의 집합... 스파르타코딩클럽파이썬판다스국비지원데이터분석pandaspandas [Data Handling] Data Cleansing :: (3) feature scaling Feature scaling 두 변수중 하나의 값의 크기가 너무 크다? ex) 몸무게와 키가 변수일 때, 키가 영향을 많이 줌 feature간의 최대-최소값의 차이를 맞춘다! big small big small small Feature scaling 전략 Min-Max Normalization Standardization (Z-score Normalization) 기존 변수 범위를 정규 분포... 판다스넘파이머신러닝머신러닝을 위한 파이썬파이썬넘파이 [생활코딩] 머신러닝 실습 - '판다스' 판다스(Pandas)를 파이썬에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 데이터를 분석 및 조작하기 위한 소프트웨어 라이브러리이다. 이번 실습에서는 Jupyter Notebook을 이용하였다. 순서는 다음과 같이 하였다. 데이터를 불러온다 종속변수와 독립변수로 분리한다. 실습을 통해 배울 도구들 파일 읽어오기: read_csv('/경로/파일명.csv') 모... 머신러닝표를 다루는 도구판다스생활코딩머신러닝 [Aiffel] 아이펠 6일차 개념 정리 및 회고 data.loc[행라벨, 열 라벨]: 해당 라벨을 가진 데이터를 추출 1) 클래스: 프로그래밍에서 객체를 만들 때 사용 인스턴스 속성, 인스턴스 메소드가 필요없을 때 사용. 정적 메소드와 같이 인스턴스 없이 호출 가능 다만 클래스 속성, 클래스 메소드에 접근해야할 때 사용 (2) 결측치가 있는 열 측정 방법 (3) 결측치가 있는 열 삭제 방법 (4) 결측치가 있는 행 측정 방법 ⇒ isnul... 원-핫 인코딩인공지능데이터전처리판다스정규화결측치이상치범주형 데이터수치형 데이터객체지향데이터국비교육구간화아이펠객체지향
[Pandas] 특정 문자를 포함하는 행 추출, 특정 조건 만족하는 행 추출, 판다스 인덱스 리셋 먼저 다음과 같은 데이터 프레임이 있다. contents 칼럼은 문자열로 이루어져 있는데, 이 중 문자 'w'를 포함하는 행을 삭제하는 작업을 해보자. for문을 돌려서 해볼 수도 있겠지만 데이터프레임 규모가 큰 경우 시간이 오래 걸린다. 굳이 for문으로 코딩하지 않더라도 코드 한 줄로 원하는 작업을 할 수 있다면 쓰지 않을 이유가 없다. 다음과 같이 코드를 입력하고 test_df를 확인해... 파이썬python판다스pandaspandas [판다스] 왕초보 판다스 - 개념과 시리즈, 데이터프레임 만들기 판다스(Pandas)는 파이썬에서 2차원 배열 데이터를 간편하게 다룰 수 있도록 만들어진 라이브러리다. 정형 데이터를 다루는 라이브러리다. 엑셀과 비슷한 느낌이라고 생각하면 되겠다. Python Data Analysis Library 를 뜻하고, 다차원 정형 데이터를 나타내는 경제학 용어인 panel data에서 그 이름을 따왔다고 한다. 정형(structured) vs. 반정형(semi s... dataframe판다스pandasdataframe 판다스 각각의 로우(row) 백분율 구하는 방법(The method Compute row percentages in pandas DataFrame) 판다스로 작업을 하다보면 각각의 데이터(행, row) 마다 백분율을 구하게 되는 경우가 있다. 이해를 돕기 위해 아래의 예시를 먼저 보자. "서울시의 시군구와 연령별 인구 수" 에 대한 테이블이 있다. 이때 우리는 해당 데이터를 봤을때 어떤 시군구에 어떤 연령층이 많은지 알고싶어도 위와같이 "인구 수"를 나열한 것으로 정보를 가독하기 힘들다. 이때는 각 시군구(행, row, 데이터) 별로 백... 판다스판다스 [Pandas] Modin.pandas를 사용한 판다스(pandas) 속도 높이기 이 글은 빅데이터에서 판다스를 사용할 때 너무 느린 속도를 빠르게 하는 방법을 정리한 글이다. 1. 판다스(pandas) 판다스는 데이터 분석을 위해서 사용하는 대표적인 툴 설치방법 사용방법 여기까지는 기본 판다스를 사용하는 방법이다. 참고했던 자료들에 따르면, 기존 판다스는 1GB 이내에서 사용할만 하다고 한다. 데이터가 10GB 넘어가고 난리 났을 때는 이 판다스를 쓰면 안된다. modi... pandas판다스속도높이기pandas SW과정 머신러닝 1014(7) 1. pandas03 코드 정리 2. matplotlib 3. Kobis Open API 주요내용 메모 판다스 차트 라이브러리 정리 python import time... 머신러닝파이썬판다스머신러닝 SW과정 머신러닝 1022(13) 1. Titanic 분석 2. 손글씨.ipynb... 머신러닝파이썬판다스머신러닝 [Data Handling] Pandas :: (7) Built-in functions Numeric type 데이터의 요약 정보를 보여줌 earn height sex race ed age male white female white female white female female white earn height ed age count mean std min max unique series data의 유일한 값을 list로 반환 array(['white', 'other', 'hi... 머신러닝머신러닝을 위한 파이썬판다스파이썬머신러닝 파이썬 데이터분석 첫걸음 - 1주차 colab으로 만들어진? 주피터노트북은 링크 공유받아서 써봤는데, 내가 컴퓨터에 설치해서 써본 건 처음이다. 회사의 아이맥에도 아나콘다( ) 설치하고 집에 있는 윈도우 데스크탑에도 설치했다. 파이썬 기본문법은 대충 다 아는 내용일 줄 알았는데, list, dict 리스트와 딕셔너리까지는 알았지만, set에서 멈칫했다. set에 넣으면 중복된 원소는 알아서 사라진다(?). set은 수학의 집합... 스파르타코딩클럽파이썬판다스국비지원데이터분석pandaspandas [Data Handling] Data Cleansing :: (3) feature scaling Feature scaling 두 변수중 하나의 값의 크기가 너무 크다? ex) 몸무게와 키가 변수일 때, 키가 영향을 많이 줌 feature간의 최대-최소값의 차이를 맞춘다! big small big small small Feature scaling 전략 Min-Max Normalization Standardization (Z-score Normalization) 기존 변수 범위를 정규 분포... 판다스넘파이머신러닝머신러닝을 위한 파이썬파이썬넘파이 [생활코딩] 머신러닝 실습 - '판다스' 판다스(Pandas)를 파이썬에서 사용하는 데이터분석 라이브러리로, 행과 열로 이루어진 데이터 객체를 만들어 데이터를 분석 및 조작하기 위한 소프트웨어 라이브러리이다. 이번 실습에서는 Jupyter Notebook을 이용하였다. 순서는 다음과 같이 하였다. 데이터를 불러온다 종속변수와 독립변수로 분리한다. 실습을 통해 배울 도구들 파일 읽어오기: read_csv('/경로/파일명.csv') 모... 머신러닝표를 다루는 도구판다스생활코딩머신러닝 [Aiffel] 아이펠 6일차 개념 정리 및 회고 data.loc[행라벨, 열 라벨]: 해당 라벨을 가진 데이터를 추출 1) 클래스: 프로그래밍에서 객체를 만들 때 사용 인스턴스 속성, 인스턴스 메소드가 필요없을 때 사용. 정적 메소드와 같이 인스턴스 없이 호출 가능 다만 클래스 속성, 클래스 메소드에 접근해야할 때 사용 (2) 결측치가 있는 열 측정 방법 (3) 결측치가 있는 열 삭제 방법 (4) 결측치가 있는 행 측정 방법 ⇒ isnul... 원-핫 인코딩인공지능데이터전처리판다스정규화결측치이상치범주형 데이터수치형 데이터객체지향데이터국비교육구간화아이펠객체지향