3년 동안 데이터 분석에 종사한 후, 눈부터 대단한python 기술

3666 단어 Python

배경


현재 대학원에서는 주로 모방을 연구한다.
대학 시절부터python으로 데이터 분석을 하는 등 하고 싶은 일을 하려고 했지만 이번Python3 엔지니어 인증 데이터 분석 테스트 시험을 위해 구입했다교본.
대충 아는 내용이지만 지금까지 몰랐던 것도 있어 메모로 정리했다.더 좋은 작법이 있겠지...내 생각에는 이렇게 생각하는 사람을 향한 내용이겠지.
전면적이고 체계적으로 알고 싶은 사람은 아래의 책을 확인하세요.

"Python 새로운 데이터 분석 교과서"(상영사)
저자: 사다학, 츠지진오, 링무융해태, 복도진태랑(경칭약)

눈에서 비늘까지의python 기술


logging 모듈


일괄 처리 등에서 자주 사용하시죠print.
로그를 대체 방법으로 사용합니다.점이 기록 수준을 바꿀 수 있습니까?
로그 레벨은 아래 5단계로 내려갈수록 중요합니다.
  • debug
  • info
  • warning
  • error
  • critical
  • 이하
    이 예에서 info 이상을 출력합니다.
    import  logging 
    
    logging.basicConfig(
        filename = 'test.log' #ログファイル名の指定
        level = logging.INIFO, format = '%(asctime)s:%(levelname)s:%(message)s' #ログレベルの指定
    )
    

    코드 규약


    python에 표준 인코딩 규칙이 있는 것 같습니다.
    PEP 8 - Style for python Code
    예를 들어 여러 모듈import을 작성할 때 각각 작성합니다.
    import sys, os #PEP8 違反
    #PEP8に準拠した書き方↓
    import sys
    import os
    
    여기까지는 왠지 알 것 같아서...이런 느낌인데, 이거pycodestyle를 검사할 수 있는 게 있어!난 몰라.
    pip install pycodestyle
    pycodestyle main.py
    
    인코딩 약정을 수정할 수 있는 프로그램입니다.

    내가 정의했어. 이 변수로...?


    제목과 같다.
    이것을 검사한 물건은 flake8 있다.
    pip install flake8
    flake8 sample.py
    
    아니야.그런 것도 아니고.에서 다른 천장 유형을 선택합니다.

    pandas describe


    pandas의 DataFrame의 통계량에는 완전히 검사할 수 있는 것이 있는 것 같습니다.
    이것이 바로 describe() 방법이다.(방법적인 사용법이 있습니까?)
    다음은 예입니다.
    df.describe() # df : DataFrame
    
    이렇게 하면 평균, 최대, 최소치를 마음대로 계산할 수 있다.

    Jupyter Notebook 매직 명령


    %%와%로 시작하는 마술 명령이 있는 것 같습니다.사용할 수 있는 것은 %%timeit`명령으로 전체 칸의 계산 시간을 출력합니다.
    다른 것도 많은 것 같은데.참고로 아래의 내용을 열거하다.
  • Jupyter Notebook 매직 명령 요약
  • 압출 프레임: Scrapy


    python에서의 묘사는 request, BeautifulSoup4, selenium 등을 자주 사용하지만 대량의 페이지를 묘사하려면 Scrapy이 좋다.

    좋은 웹페이지 즐겨찾기