dacon Dacon 손동작 분류 경진대회 주어진 센서 데이터를 이용해 손동작을 분류하는 경진대회 데이터 1. train.csv : 학습 데이터 sensor_1 ~ sensor_32 : 센서 데이터 2. test.csv : 테스트 데이터 sensor_1 ~ sensor_32 : 센서 데이터 총 32개의 센서 데이터를 이용하여 target 값을 예측하는 것이 이번 경진대회의 목표이다. 따라서, 4씩 차이 나는 센서들을 하나의 featu... dacondacon Dacon 전복 나이 예측 경진대회 데이터 1. train.csv : 학습 데이터 Whole Weight : 전복 전체 무게 하지만 결론적으로 모델링 과정에서 이상치를 제거한 경우에 성능이 떨어지는 것을 확인하여, 원 데이터 그대로 모델링을 진행하였다. 또한 피어슨 상관계수가 0.3 이상은 상관관계가 유의미하다는 것을 의미하므로, 전복의 무게, 키, 지름, 둘레가 나이가 많을수록 늘어난다는 것을 알 수 있다. 따라서 회귀 모델... dacondacon Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기 : head() 매서드를 통해 데이터의 대략적인 정보를 알 수 있다. : matplotlib 의 axis() 매서드로 그래프 축의 최솟값, 최댓값을 지정할 수 있다. : matplotlib 의 title() 매서드로 그래프의 제목을 지정할 수 있다. : matplotlib 의 show() 매서드로 그래프를 출력할 수 있다. : "fixed acidity"가 25%인 값을 "quantile_2... dacondacon 신용카드 사용자 연체 예측 AI 경진대회 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 신용카드사는 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정합니다. 신용카드사는 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측합니다. 사용자의 대금 연체 정도를 예측할 수 있는 인공지능 알고리즘을 개발해 금융업계에 제안할 수 있는 인사이트를 발굴해주세요... AIdacon대회MLAI Dacon-가스공급량 수요예측 EDA Training set에는 2013년 1월 1일 부터 2018년 12월 31일 까지의 가스 공급량에 대한 데이터가 있다. Testing set에는 2019년 1월 1일 부터 2019년 12월 31일 까지의 시계열 변수와 구분 변수가 있다. 변수 'date'를 'Year', 'Month', 'Day' 세개의 변수로 나누는게 좋을 수 있다. 요일 변수('weekday')를 추가하는게 좋을 것으로... dacon가스공급량EDAEDA 펭귄 몸무게 예측-EDA 데이터 불러오기 id는 필요 없어서 바로 drop 범주형, 연속형 변수 컬럼명 지정 결측치 체크 연속형 변수는 각 컬럼의 평균 값으로 넣어주고, 범주형 변수는 어차피 one-hot 인코딩 할 예정이라 그냥 둠 아래의 각 그래프들의 소스는 dacon의 운영자분의 코드를 참조하였음 boxplot으로 이상치 확인 특이한 이상치는 보이지 않는 것으로 판단 산점도 0 미만의 상관값을 가진 변수는 파란... pythondacondacon 펭귄 몸무게 예측-submission 학습 데이터 불러오기 및 초기화 전처리 모델학습 우선 학습에 쓰일 함수를 4가지 정의하고 밑에서 계속 불러서 쓸 예정 선형회귀, 릿지, 라쏘 LinearRegression RMSE : 299.574 Ridge RMSE : 282.328 Lasso RMSE : 297.308 릿지와 라쏘가 선형회귀보다 잘 나와서 이 두 개의 알파 값을 임의로 변경해보고 최적의 알파 값을 찾도록 해본다. 변화시킬... pythondacondacon
Dacon 손동작 분류 경진대회 주어진 센서 데이터를 이용해 손동작을 분류하는 경진대회 데이터 1. train.csv : 학습 데이터 sensor_1 ~ sensor_32 : 센서 데이터 2. test.csv : 테스트 데이터 sensor_1 ~ sensor_32 : 센서 데이터 총 32개의 센서 데이터를 이용하여 target 값을 예측하는 것이 이번 경진대회의 목표이다. 따라서, 4씩 차이 나는 센서들을 하나의 featu... dacondacon Dacon 전복 나이 예측 경진대회 데이터 1. train.csv : 학습 데이터 Whole Weight : 전복 전체 무게 하지만 결론적으로 모델링 과정에서 이상치를 제거한 경우에 성능이 떨어지는 것을 확인하여, 원 데이터 그대로 모델링을 진행하였다. 또한 피어슨 상관계수가 0.3 이상은 상관관계가 유의미하다는 것을 의미하므로, 전복의 무게, 키, 지름, 둘레가 나이가 많을수록 늘어난다는 것을 알 수 있다. 따라서 회귀 모델... dacondacon Lv3. 교차검증과 LGBM 모델을 활용한 와인 품질 분류하기 : head() 매서드를 통해 데이터의 대략적인 정보를 알 수 있다. : matplotlib 의 axis() 매서드로 그래프 축의 최솟값, 최댓값을 지정할 수 있다. : matplotlib 의 title() 매서드로 그래프의 제목을 지정할 수 있다. : matplotlib 의 show() 매서드로 그래프를 출력할 수 있다. : "fixed acidity"가 25%인 값을 "quantile_2... dacondacon 신용카드 사용자 연체 예측 AI 경진대회 신용카드 사용자 데이터를 보고 사용자의 대금 연체 정도를 예측하는 알고리즘 개발 신용카드사는 신용카드 신청자가 제출한 개인정보와 데이터를 활용해 신용 점수를 산정합니다. 신용카드사는 이 신용 점수를 활용해 신청자의 향후 채무 불이행과 신용카드 대급 연체 가능성을 예측합니다. 사용자의 대금 연체 정도를 예측할 수 있는 인공지능 알고리즘을 개발해 금융업계에 제안할 수 있는 인사이트를 발굴해주세요... AIdacon대회MLAI Dacon-가스공급량 수요예측 EDA Training set에는 2013년 1월 1일 부터 2018년 12월 31일 까지의 가스 공급량에 대한 데이터가 있다. Testing set에는 2019년 1월 1일 부터 2019년 12월 31일 까지의 시계열 변수와 구분 변수가 있다. 변수 'date'를 'Year', 'Month', 'Day' 세개의 변수로 나누는게 좋을 수 있다. 요일 변수('weekday')를 추가하는게 좋을 것으로... dacon가스공급량EDAEDA 펭귄 몸무게 예측-EDA 데이터 불러오기 id는 필요 없어서 바로 drop 범주형, 연속형 변수 컬럼명 지정 결측치 체크 연속형 변수는 각 컬럼의 평균 값으로 넣어주고, 범주형 변수는 어차피 one-hot 인코딩 할 예정이라 그냥 둠 아래의 각 그래프들의 소스는 dacon의 운영자분의 코드를 참조하였음 boxplot으로 이상치 확인 특이한 이상치는 보이지 않는 것으로 판단 산점도 0 미만의 상관값을 가진 변수는 파란... pythondacondacon 펭귄 몸무게 예측-submission 학습 데이터 불러오기 및 초기화 전처리 모델학습 우선 학습에 쓰일 함수를 4가지 정의하고 밑에서 계속 불러서 쓸 예정 선형회귀, 릿지, 라쏘 LinearRegression RMSE : 299.574 Ridge RMSE : 282.328 Lasso RMSE : 297.308 릿지와 라쏘가 선형회귀보다 잘 나와서 이 두 개의 알파 값을 임의로 변경해보고 최적의 알파 값을 찾도록 해본다. 변화시킬... pythondacondacon