데이터 과학 마라톤으로 진행 상황 추적하기

2830 단어
이것이 나의 새로운 표준이 될 것입니다. 기술 분야에서 얻은 모든 경험을 표현하여 진행 상황을 추적하고 사고 과정을 계획하는 데 도움이 됩니다.
저는 이전에 and에서 제공하는 "데이터 과학 및 기계 학습 마라톤"이라는 프로그램에 지원했습니다. 다행히 저는 2022년 3월 28일에 시작된 10일 프로그램에 합격하고 등록했습니다.
우리(참가자)가 교육의 기본 주기인 배우고, 잊고, 다시 배우는 가치 있는 마라톤이었습니다. 지금까지 나는 새로운 방법을 배우고 신화와 오래된 사실을 잊은 다음 업데이트와 내가 잊었을 수 있는 것을 다시 배웠습니다. 내가 당신에게 말하는 경험은 놀랍습니다.
제목 그대로 근면이라는 한 가지를 염두에 두고 몇 개월의 작업을 10일로 압축하는 것은 엄청난 작업이었습니다.
이제 저는 4일차이고 지금까지 수행한 모든 활동의 분석이 있습니다.

월요일



이것은 우리의 첫날이었고 나의 흥분과 에너지는 타의 추종을 불허했습니다. 우리는 Slack을 통해 상호 작용했고 그곳에서 저는 다른 나라에서 온 새로운 친구들을 만났고 그것은 제게 다양성이라는 의미를 가졌습니다. (이 친구들은 매우 훌륭한 책임 파트너를 형성합니다).
그것은 초보자 친화적이었고 그 단계를 지난 이후로 나에게 큰 도전을 제기하지 않았지만 한 가지는 상당히 뛰어났습니다. 입문 단계 임에도 불구하고 Git을 정확하게 배우는 데 여전히 새로운 것을 발견했습니다.
그래서 1일차는 다음과 같았습니다.
  • Python 소개, Python 기본 사항 마스터하기.
  • 노트북과 아나콘다 상호 작용.
  • 버전 제어 시스템, Git, GitHub, BitBucket, GitLab 등

  • 화요일



    2일차는 데이터베이스에 관한 것이었습니다. 나는 오랫동안 내가 항상 선호했던 SQL에 깊이 빠져들었고 더 흥미롭게도 데이터베이스에 대한 나의 시야를 넓혀준 Postgres와 MongoDb를 소개받았고 이 글을 함께 했다.

    수요일



    3일차는 Pandas, NumPy, Matplotlib 및 Seaborn과 같은 데이터 과학 기본 패키지에 관한 것이었습니다.
    데이터를 조작할 때 자주 사용되는 패키지입니다.
  • NumPy - 배열 및 행렬에서 수학 연산을 수행하는 데 사용되는 Python 라이브러리입니다.
  • Pandas - 주로 데이터 분석 및 Dataframes의 테이블 형식 데이터 관련 조작에 사용되는 Python 라이브러리입니다. Pandas를 사용하면 쉼표로 구분된 값, JSON, Parquet, SQL 데이터베이스 테이블 또는 쿼리, Microsoft Excel과 같은 다양한 파일 형식에서 데이터를 가져올 수 있습니다. 자세한 내용은
  • 를 참조하십시오.
  • Matlotlib - Python에서 정적, 애니메이션 및 대화형 시각화를 만들기 위한 포괄적인 Python 라이브러리입니다.
  • Seaborn - matplotlib 위에 구축되었으며 pandas 데이터 구조와 밀접하게 통합되어 Python에서 통계 그래픽을 만듭니다. Seaborn은 당면한 데이터의 탐색과 이해를 돕습니다.

  • 목요일



    4일차에는 나에게 완전히 새로운 것을 처리하는데 이것이 바로 pyforest 패키지입니다.
    pyforest 패키지는 사용자가 데이터 과학 분석 작업 및 머신 러닝 알고리즘 구축에 필요한 패키지를 자동으로 가져오는 데 도움이 되는 오픈 소스 모듈입니다. 이런 이유로 게으른 프로그래머에게 도움이 된다고 합니다. (이 시점에서 나는 그것을 정말 좋아했기 때문에 게으른 프로그래머입니다 😁😁.

    또한 Python을 MySQL에 연결하고 Python 스크립트를 사용하여 데이터베이스에 액세스하는 방법도 배웠습니다. 너무 멋져.
    다음은 프로세스에 대한 샘플 스크립트입니다.

    import mysql.connector
    
    mydb = mysql.connector.connect(
        host="localhost",
        user="root",
        password="*******",
        database="boatsdb",
        port = 3306
    )
    print("Hey, i think i'm connected")
    #Cursor
    cur = mydb.cursor()
    #Execute the query
    cur.execute("SELECT ID,NAME FROM boats where name = %s", ("Nathan",))
    
    rows = cur.fetchall()
    
    for r in rows:
        print(f" ID ={r[0]} NAME = {r[1]} ")
    
    #Close the cursor
    cur.close()
    #Close the connection
    mydb.close()
    


    거의 주말이 다가오고 프로그램이 저를 위해 무엇을 가지고 있는지 해결하기를 기다리고 있습니다. 나의 가장 큰 감사는 이 프로그램의 주인공이 누구인지, 그리고 나의 진행 상황을 공유할 수 있는 독자들에게 진심으로 감사하는 것입니다.

    즐겁고 유익한 하루 되시기 바랍니다! 👋 🌱

    이 문서에서 발견된 오류에 대해서는 의견에 언급해 주십시오. 🧑🏻‍💻

    좋은 웹페이지 즐겨찾기