EDA EDA Salon 제2회 - 세계의 가축 생산량 데이터 photo by pixabay 이번 달은 세계의 가축 생산량에 관한 데이터를 탐색적으로 데이터 분석해 보세요! 데이터는 에서 다운로드하십시오. 다운로드할 수 있는 형식은 EDF와 CSV로 제공됩니다. EDF의 경우 데이터 랭링의 단계도 가져올 수 있으므로 어떤 랭링을 수행하는지 보려면 EDF를 사용하는 것이 좋습니다. 이 데이터는 FAO(Food and Agriculture Organizat... EDAEDASalon데이터 과학Exploratory [프로그래머스 과제관] 채용 공고 추천 - EDA 및 전처리 Programmers 채용 공고 페이지를 방문한 개발자들의 방문/지원 기록을 바탕으로 추천 모델을 만들어야 합니다. 전체 학습 데이터 중 applied = 1인 데이터와 applied = 0인 데이터의 수를 살펴보았다. 유저 태그만 데이터 수가 많아서 중복을 확인해 보았다. 아이디 수와 채용 공고의 수 확인 데이터는 196명의 고유 아이디, 708개의 채용 공고로 이루어져 있다. 유저들이 가... EDA추천 시스템프로그래머스 과제관EDA Data Analysis Process, 데이터 불러오기 데이터 분석은 다음과 같은 절차를 따른다. 실제 데이터 사이언티드스들은 데이터 분석 단계 중 데이서 수집 및 가공(전처리)하는 과정에 80%이상이 비중을 둔다고 한다. 그만큼 중요하고 필수적인 과정이라는 뜻이다. 전체적인 과정을 머리속에 그려두고, 앞으로의 배움에 있어 어떤 과정을 진행하고 있는지 확인 할 필요가 있다. 자료출처 : ✍️ 데이터 불러오기 Description을 통해 데이터셋에... EDAData Analysis ProcessData AnalysispandasData Analysis Titanic with EDA 살아남은 승객의 비율이 사망한 승객보다 작음을 알 수 있다. 배에 탑승한 전체 비율은 male이 많지만 살아남은 사람은 female이 male의 약 2배임을 알 수 있다. 위의 그래프를 보면 Pclass:1의 사람들이 높은 구조순위를 가졌음을 알 수 있다. 위의 그래프로 보아 Pclass:1, female 이 가장 우선적인 구조를 받았음을 알 수 있고, Pclass 등급이 낮아질수록 생존률이... PyTorchEDAAIkaggleAI [Python] FIFA 데이터 EDA 2. 데이터 불러오기 18278명의 선수와 104개의 컬럼이 있다는 것을 확인할 수 있다. ID 부터 시작해서 포지션별 능력치까지 총 104개의 컬럼이 있는것을 확인할 수 있다. overall : 선수의 전체적인 능력치 value_eur : 선수가치 wage_eur : 선수임금 선수들의 전체적인 능력치를 나타내는 OVERALL을 기준으로 선수들의 분포를 확인하면 6~70 에 대부분의 선수들이... pythonbigdataEDAanacondaEDA [TIL] EDA 엑셀파일 로드 xls = pd.ExcelFile('file_name_or_fath') sheet name 확인하기 ❗ 이름으로 불러와야 하는데 띄어쓰기 있을 수 있음 xls.sheet_names 요걸로 확인 sheet 별로 dataframe에 저장 나눔고딕 설치 런타임 재시작 matplotlib 의 폰트 Nanum 폰트로 지정 import warnings warnings.filterwarni... errorEDAEDA EDA (II) (4) 특징 분석과 가시화 특징 분석 (1) 단변수 분석 분류 변수 countplot:sns.countplot(hue=“sex”, x=“survived”, data=titanic, palette=“Greens_d”)`; 연속형 변수 distplot:sns.distplot(x); boxplot:sns.boxplot(data=iris, orient=“h”); (2) 다변수 분석 분류 변수 + 기... EDA 무지에서 시작된 사건 구동 구조~ 실천편~ 본고는 AWS DynamoDB Stream을 이용하여 간단한 이벤트 구동 구조를 구축하는 과정을 총괄하고자 한다. 주문 기록을 삽입할 때 DynamoDB Stream에서 Lambda 함수 로그인에 성공하면 다음 화면이 표시됩니다. AWS 관리 콘솔의 헤더에 있는 서비스를 누르면 AWS의 서비스 일람이 표시됩니다. 그런 다음 Order 테이블에 레코드를 삽입한 후 실행 중인 Lambda 함수에... EDA이벤트 구동AWS서버 아키텍처 없음 무지에서 시작된 이벤트 구동 구조~ 도입편~ 필자는 이벤트 구동 구조(Event Driven Archeitecture)와 서버 없는 구조에 대해 아무것도 모른다.이러한 필자는 보도에서 학습 활동 구동 구조의 과정을 남겼고 앞으로 학습 활동 구동 구조를 시작하는 사람들에게 참고 가치가 있기를 바란다. 발주 관리 서비스는 배송 예약 서비스와 재고 관리 서비스에 요청을 보내는 것이 아니라 사건만 발송하며, 배송 예약 서비스와 재고 관리 서비... EDA이벤트 구동AWS서버 아키텍처 없음 Dacon-가스공급량 수요예측 EDA Training set에는 2013년 1월 1일 부터 2018년 12월 31일 까지의 가스 공급량에 대한 데이터가 있다. Testing set에는 2019년 1월 1일 부터 2019년 12월 31일 까지의 시계열 변수와 구분 변수가 있다. 변수 'date'를 'Year', 'Month', 'Day' 세개의 변수로 나누는게 좋을 수 있다. 요일 변수('weekday')를 추가하는게 좋을 것으로... dacon가스공급량EDAEDA
EDA Salon 제2회 - 세계의 가축 생산량 데이터 photo by pixabay 이번 달은 세계의 가축 생산량에 관한 데이터를 탐색적으로 데이터 분석해 보세요! 데이터는 에서 다운로드하십시오. 다운로드할 수 있는 형식은 EDF와 CSV로 제공됩니다. EDF의 경우 데이터 랭링의 단계도 가져올 수 있으므로 어떤 랭링을 수행하는지 보려면 EDF를 사용하는 것이 좋습니다. 이 데이터는 FAO(Food and Agriculture Organizat... EDAEDASalon데이터 과학Exploratory [프로그래머스 과제관] 채용 공고 추천 - EDA 및 전처리 Programmers 채용 공고 페이지를 방문한 개발자들의 방문/지원 기록을 바탕으로 추천 모델을 만들어야 합니다. 전체 학습 데이터 중 applied = 1인 데이터와 applied = 0인 데이터의 수를 살펴보았다. 유저 태그만 데이터 수가 많아서 중복을 확인해 보았다. 아이디 수와 채용 공고의 수 확인 데이터는 196명의 고유 아이디, 708개의 채용 공고로 이루어져 있다. 유저들이 가... EDA추천 시스템프로그래머스 과제관EDA Data Analysis Process, 데이터 불러오기 데이터 분석은 다음과 같은 절차를 따른다. 실제 데이터 사이언티드스들은 데이터 분석 단계 중 데이서 수집 및 가공(전처리)하는 과정에 80%이상이 비중을 둔다고 한다. 그만큼 중요하고 필수적인 과정이라는 뜻이다. 전체적인 과정을 머리속에 그려두고, 앞으로의 배움에 있어 어떤 과정을 진행하고 있는지 확인 할 필요가 있다. 자료출처 : ✍️ 데이터 불러오기 Description을 통해 데이터셋에... EDAData Analysis ProcessData AnalysispandasData Analysis Titanic with EDA 살아남은 승객의 비율이 사망한 승객보다 작음을 알 수 있다. 배에 탑승한 전체 비율은 male이 많지만 살아남은 사람은 female이 male의 약 2배임을 알 수 있다. 위의 그래프를 보면 Pclass:1의 사람들이 높은 구조순위를 가졌음을 알 수 있다. 위의 그래프로 보아 Pclass:1, female 이 가장 우선적인 구조를 받았음을 알 수 있고, Pclass 등급이 낮아질수록 생존률이... PyTorchEDAAIkaggleAI [Python] FIFA 데이터 EDA 2. 데이터 불러오기 18278명의 선수와 104개의 컬럼이 있다는 것을 확인할 수 있다. ID 부터 시작해서 포지션별 능력치까지 총 104개의 컬럼이 있는것을 확인할 수 있다. overall : 선수의 전체적인 능력치 value_eur : 선수가치 wage_eur : 선수임금 선수들의 전체적인 능력치를 나타내는 OVERALL을 기준으로 선수들의 분포를 확인하면 6~70 에 대부분의 선수들이... pythonbigdataEDAanacondaEDA [TIL] EDA 엑셀파일 로드 xls = pd.ExcelFile('file_name_or_fath') sheet name 확인하기 ❗ 이름으로 불러와야 하는데 띄어쓰기 있을 수 있음 xls.sheet_names 요걸로 확인 sheet 별로 dataframe에 저장 나눔고딕 설치 런타임 재시작 matplotlib 의 폰트 Nanum 폰트로 지정 import warnings warnings.filterwarni... errorEDAEDA EDA (II) (4) 특징 분석과 가시화 특징 분석 (1) 단변수 분석 분류 변수 countplot:sns.countplot(hue=“sex”, x=“survived”, data=titanic, palette=“Greens_d”)`; 연속형 변수 distplot:sns.distplot(x); boxplot:sns.boxplot(data=iris, orient=“h”); (2) 다변수 분석 분류 변수 + 기... EDA 무지에서 시작된 사건 구동 구조~ 실천편~ 본고는 AWS DynamoDB Stream을 이용하여 간단한 이벤트 구동 구조를 구축하는 과정을 총괄하고자 한다. 주문 기록을 삽입할 때 DynamoDB Stream에서 Lambda 함수 로그인에 성공하면 다음 화면이 표시됩니다. AWS 관리 콘솔의 헤더에 있는 서비스를 누르면 AWS의 서비스 일람이 표시됩니다. 그런 다음 Order 테이블에 레코드를 삽입한 후 실행 중인 Lambda 함수에... EDA이벤트 구동AWS서버 아키텍처 없음 무지에서 시작된 이벤트 구동 구조~ 도입편~ 필자는 이벤트 구동 구조(Event Driven Archeitecture)와 서버 없는 구조에 대해 아무것도 모른다.이러한 필자는 보도에서 학습 활동 구동 구조의 과정을 남겼고 앞으로 학습 활동 구동 구조를 시작하는 사람들에게 참고 가치가 있기를 바란다. 발주 관리 서비스는 배송 예약 서비스와 재고 관리 서비스에 요청을 보내는 것이 아니라 사건만 발송하며, 배송 예약 서비스와 재고 관리 서비... EDA이벤트 구동AWS서버 아키텍처 없음 Dacon-가스공급량 수요예측 EDA Training set에는 2013년 1월 1일 부터 2018년 12월 31일 까지의 가스 공급량에 대한 데이터가 있다. Testing set에는 2019년 1월 1일 부터 2019년 12월 31일 까지의 시계열 변수와 구분 변수가 있다. 변수 'date'를 'Year', 'Month', 'Day' 세개의 변수로 나누는게 좋을 수 있다. 요일 변수('weekday')를 추가하는게 좋을 것으로... dacon가스공급량EDAEDA