3년 동안 데이터 분석에 종사한 후, 눈부터 대단한python 기술
3666 단어 Python
배경
현재 대학원에서는 주로 모방을 연구한다.
대학 시절부터python으로 데이터 분석을 하는 등 하고 싶은 일을 하려고 했지만 이번Python3 엔지니어 인증 데이터 분석 테스트 시험을 위해 구입했다교본.
대충 아는 내용이지만 지금까지 몰랐던 것도 있어 메모로 정리했다.더 좋은 작법이 있겠지...내 생각에는 이렇게 생각하는 사람을 향한 내용이겠지.
전면적이고 체계적으로 알고 싶은 사람은 아래의 책을 확인하세요.
"Python 새로운 데이터 분석 교과서"(상영사)
저자: 사다학, 츠지진오, 링무융해태, 복도진태랑(경칭약)
눈에서 비늘까지의python 기술
logging 모듈
일괄 처리 등에서 자주 사용하시죠print
.
로그를 대체 방법으로 사용합니다.점이 기록 수준을 바꿀 수 있습니까?
로그 레벨은 아래 5단계로 내려갈수록 중요합니다.
logging 모듈
일괄 처리 등에서 자주 사용하시죠
print
.로그를 대체 방법으로 사용합니다.점이 기록 수준을 바꿀 수 있습니까?
로그 레벨은 아래 5단계로 내려갈수록 중요합니다.
이 예에서 info 이상을 출력합니다.
import logging
logging.basicConfig(
filename = 'test.log' #ログファイル名の指定
level = logging.INIFO, format = '%(asctime)s:%(levelname)s:%(message)s' #ログレベルの指定
)
코드 규약
python에 표준 인코딩 규칙이 있는 것 같습니다.
PEP 8 - Style for python Code
예를 들어 여러 모듈
import
을 작성할 때 각각 작성합니다.import sys, os #PEP8 違反
#PEP8に準拠した書き方↓
import sys
import os
여기까지는 왠지 알 것 같아서...이런 느낌인데, 이거pycodestyle
를 검사할 수 있는 게 있어!난 몰라.pip install pycodestyle
pycodestyle main.py
인코딩 약정을 수정할 수 있는 프로그램입니다.내가 정의했어. 이 변수로...?
제목과 같다.
이것을 검사한 물건은
flake8
있다.pip install flake8
flake8 sample.py
아니야.그런 것도 아니고.에서 다른 천장 유형을 선택합니다.pandas describe
pandas의 DataFrame의 통계량에는 완전히 검사할 수 있는 것이 있는 것 같습니다.
이것이 바로
describe()
방법이다.(방법적인 사용법이 있습니까?)다음은 예입니다.
df.describe() # df : DataFrame
이렇게 하면 평균, 최대, 최소치를 마음대로 계산할 수 있다.Jupyter Notebook 매직 명령
%%와%로 시작하는 마술 명령이 있는 것 같습니다.사용할 수 있는 것은
%%timeit
`명령으로 전체 칸의 계산 시간을 출력합니다.다른 것도 많은 것 같은데.참고로 아래의 내용을 열거하다.
압출 프레임: Scrapy
python에서의 묘사는
request
, BeautifulSoup4
, selenium
등을 자주 사용하지만 대량의 페이지를 묘사하려면 Scrapy
이 좋다.
Reference
이 문제에 관하여(3년 동안 데이터 분석에 종사한 후, 눈부터 대단한python 기술), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/dsduoa31/items/4a8960e0ad07495d908c텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)