판다스 [Pandas] 특정 문자를 포함하는 행 추출, 특정 조건 만족하는 행 추출, 판다스 인덱스 리셋 먼저 다음과 같은 데이터 프레임이 있다. contents 칼럼은 문자열로 이루어져 있는데, 이 중 문자 'w'를 포함하는 행을 삭제하는 작업을 해보자. for문을 돌려서 해볼 수도 있겠지만 데이터프레임 규모가 큰 경우 시간이 오래 걸린다. 굳이 for문으로 코딩하지 않더라도 코드 한 줄로 원하는 작업을 할 수 있다면 쓰지 않을 이유가 없다. 다음과 같이 코드를 입력하고 test_df를 확인해... 파이썬python판다스pandaspandas [판다스] 왕초보 판다스 - 개념과 시리즈, 데이터프레임 만들기 판다스(Pandas)는 파이썬에서 2차원 배열 데이터를 간편하게 다룰 수 있도록 만들어진 라이브러리다. 정형 데이터를 다루는 라이브러리다. 엑셀과 비슷한 느낌이라고 생각하면 되겠다. Python Data Analysis Library 를 뜻하고, 다차원 정형 데이터를 나타내는 경제학 용어인 panel data에서 그 이름을 따왔다고 한다. 정형(structured) vs. 반정형(semi s... dataframe판다스pandasdataframe 판다스 각각의 로우(row) 백분율 구하는 방법(The method Compute row percentages in pandas DataFrame) 판다스로 작업을 하다보면 각각의 데이터(행, row) 마다 백분율을 구하게 되는 경우가 있다. 이해를 돕기 위해 아래의 예시를 먼저 보자. "서울시의 시군구와 연령별 인구 수" 에 대한 테이블이 있다. 이때 우리는 해당 데이터를 봤을때 어떤 시군구에 어떤 연령층이 많은지 알고싶어도 위와같이 "인구 수"를 나열한 것으로 정보를 가독하기 힘들다. 이때는 각 시군구(행, row, 데이터) 별로 백... 판다스판다스 [Pandas] Modin.pandas를 사용한 판다스(pandas) 속도 높이기 이 글은 빅데이터에서 판다스를 사용할 때 너무 느린 속도를 빠르게 하는 방법을 정리한 글이다. 1. 판다스(pandas) 판다스는 데이터 분석을 위해서 사용하는 대표적인 툴 설치방법 사용방법 여기까지는 기본 판다스를 사용하는 방법이다. 참고했던 자료들에 따르면, 기존 판다스는 1GB 이내에서 사용할만 하다고 한다. 데이터가 10GB 넘어가고 난리 났을 때는 이 판다스를 쓰면 안된다. modi... pandas판다스속도높이기pandas SW과정 머신러닝 1022(13) 1. Titanic 분석 2. 손글씨.ipynb... 머신러닝파이썬판다스머신러닝 파이썬 데이터분석 첫걸음 - 1주차 colab으로 만들어진? 주피터노트북은 링크 공유받아서 써봤는데, 내가 컴퓨터에 설치해서 써본 건 처음이다. 회사의 아이맥에도 아나콘다( ) 설치하고 집에 있는 윈도우 데스크탑에도 설치했다. 파이썬 기본문법은 대충 다 아는 내용일 줄 알았는데, list, dict 리스트와 딕셔너리까지는 알았지만, set에서 멈칫했다. set에 넣으면 중복된 원소는 알아서 사라진다(?). set은 수학의 집합... 스파르타코딩클럽파이썬판다스국비지원데이터분석pandaspandas [Data Handling] Pandas :: (3) DataFrame age city San Francisco Baltimore Tina Ali Miami Jake Milner Douglas age city San Francisco Baltimore Miami Douglas age city debt San Francisco NaN Baltimore NaN Tina Ali NaN Jake Douglas NaN NaN 2 Tina 3 Jake Name: first... 판다스머신러닝을 위한 파이썬파이썬머신러닝머신러닝 [Data Handling] Data Cleansing :: (3) feature scaling Feature scaling 두 변수중 하나의 값의 크기가 너무 크다? ex) 몸무게와 키가 변수일 때, 키가 영향을 많이 줌 feature간의 최대-최소값의 차이를 맞춘다! big small big small small Feature scaling 전략 Min-Max Normalization Standardization (Z-score Normalization) 기존 변수 범위를 정규 분포... 판다스넘파이머신러닝머신러닝을 위한 파이썬파이썬넘파이
[Pandas] 특정 문자를 포함하는 행 추출, 특정 조건 만족하는 행 추출, 판다스 인덱스 리셋 먼저 다음과 같은 데이터 프레임이 있다. contents 칼럼은 문자열로 이루어져 있는데, 이 중 문자 'w'를 포함하는 행을 삭제하는 작업을 해보자. for문을 돌려서 해볼 수도 있겠지만 데이터프레임 규모가 큰 경우 시간이 오래 걸린다. 굳이 for문으로 코딩하지 않더라도 코드 한 줄로 원하는 작업을 할 수 있다면 쓰지 않을 이유가 없다. 다음과 같이 코드를 입력하고 test_df를 확인해... 파이썬python판다스pandaspandas [판다스] 왕초보 판다스 - 개념과 시리즈, 데이터프레임 만들기 판다스(Pandas)는 파이썬에서 2차원 배열 데이터를 간편하게 다룰 수 있도록 만들어진 라이브러리다. 정형 데이터를 다루는 라이브러리다. 엑셀과 비슷한 느낌이라고 생각하면 되겠다. Python Data Analysis Library 를 뜻하고, 다차원 정형 데이터를 나타내는 경제학 용어인 panel data에서 그 이름을 따왔다고 한다. 정형(structured) vs. 반정형(semi s... dataframe판다스pandasdataframe 판다스 각각의 로우(row) 백분율 구하는 방법(The method Compute row percentages in pandas DataFrame) 판다스로 작업을 하다보면 각각의 데이터(행, row) 마다 백분율을 구하게 되는 경우가 있다. 이해를 돕기 위해 아래의 예시를 먼저 보자. "서울시의 시군구와 연령별 인구 수" 에 대한 테이블이 있다. 이때 우리는 해당 데이터를 봤을때 어떤 시군구에 어떤 연령층이 많은지 알고싶어도 위와같이 "인구 수"를 나열한 것으로 정보를 가독하기 힘들다. 이때는 각 시군구(행, row, 데이터) 별로 백... 판다스판다스 [Pandas] Modin.pandas를 사용한 판다스(pandas) 속도 높이기 이 글은 빅데이터에서 판다스를 사용할 때 너무 느린 속도를 빠르게 하는 방법을 정리한 글이다. 1. 판다스(pandas) 판다스는 데이터 분석을 위해서 사용하는 대표적인 툴 설치방법 사용방법 여기까지는 기본 판다스를 사용하는 방법이다. 참고했던 자료들에 따르면, 기존 판다스는 1GB 이내에서 사용할만 하다고 한다. 데이터가 10GB 넘어가고 난리 났을 때는 이 판다스를 쓰면 안된다. modi... pandas판다스속도높이기pandas SW과정 머신러닝 1022(13) 1. Titanic 분석 2. 손글씨.ipynb... 머신러닝파이썬판다스머신러닝 파이썬 데이터분석 첫걸음 - 1주차 colab으로 만들어진? 주피터노트북은 링크 공유받아서 써봤는데, 내가 컴퓨터에 설치해서 써본 건 처음이다. 회사의 아이맥에도 아나콘다( ) 설치하고 집에 있는 윈도우 데스크탑에도 설치했다. 파이썬 기본문법은 대충 다 아는 내용일 줄 알았는데, list, dict 리스트와 딕셔너리까지는 알았지만, set에서 멈칫했다. set에 넣으면 중복된 원소는 알아서 사라진다(?). set은 수학의 집합... 스파르타코딩클럽파이썬판다스국비지원데이터분석pandaspandas [Data Handling] Pandas :: (3) DataFrame age city San Francisco Baltimore Tina Ali Miami Jake Milner Douglas age city San Francisco Baltimore Miami Douglas age city debt San Francisco NaN Baltimore NaN Tina Ali NaN Jake Douglas NaN NaN 2 Tina 3 Jake Name: first... 판다스머신러닝을 위한 파이썬파이썬머신러닝머신러닝 [Data Handling] Data Cleansing :: (3) feature scaling Feature scaling 두 변수중 하나의 값의 크기가 너무 크다? ex) 몸무게와 키가 변수일 때, 키가 영향을 많이 줌 feature간의 최대-최소값의 차이를 맞춘다! big small big small small Feature scaling 전략 Min-Max Normalization Standardization (Z-score Normalization) 기존 변수 범위를 정규 분포... 판다스넘파이머신러닝머신러닝을 위한 파이썬파이썬넘파이