【Pandas】간단한 영어처럼 사용할 수 있는 방법 소개 no.17


안녕하세요, 마유미입니다.

Pandas에 대한 기사를 시리즈로 작성

이번에는 17번째가 되

『Python은 간단한 영문처럼 코드를 쓸 수 있다』

라고 자주 말합니다만, Pandas의 영어 그 자체와 같은 메소드를 발견했으므로, 오늘은 그 메소드를 모아 기사를 써 보겠습니다.

여러가지 곳에서 활용할 수 있는 메소드이므로, 꼭 끝까지 읽어 봐 주세요.

그럼 바로 시작하겠습니다.

.isin() 메서드





이 메소드로 사용하는데 있어서 주의점은, 예를 들면 캐릭터 라인 1개만을 인수로서 사용하고 싶을 때도, 「리스트형」으로 하지 않으면 안된다는 것입니다.


인용 소스 : Pandas 문서

마지막 기사 에서 사용한 것과 같은 데이터 을 사용하여 실제 사용법을 보여줍니다.


read_csv() 메소드로 읽으면 위의 스쿠쇼와 같은 느낌이 듭니다.

칼럼 Group1안에, 「Toy」가 있는지 어떤지를 .isin() 메소드로 조사해 보겠습니다.


isin() 메소드의 인수로서 넣는 칼럼명은 1개 뿐입니다만, 리스트형으로 했습니다.

Group1이 Toy가 된 곳이 True로 반환됩니다.

이제 isin() 인수에 두 개의 열 이름을 사용해 보겠습니다.



Group1 열의 값이

Toy 또는 Sporting

row가 True로 반환되었습니다.

.isin() 메소드와 OR은 동일







(※2개 이상의 조건이 있고 OR을 사용하여 데이터를 튀는 방법은 마지막 기사 에 쓰고 있습니다)

.isin() 메소드는 조건을 2개 이상 사용할 때의 OR과 같은 결과가 됩니다만, 코드를 쓰는 양은 보다 적게 됩니다.

.isnull() .notnull() 메소드





.isnull()은 누락된 값을 False로 반환하고 .notnull()은 누락된 값을 True로 반환합니다.



Intelligence 열에 몇 가지 누락 값이 있으므로 (NaN이되고 있습니다.) Intelligence 열에 .isnull() .notnull()을 사용하여 실험합니다.



.isnull() 과 .notnull() 에서는 반대의 결과를 돌려줍니다.

.between() 메서드





.between() 메소드에서의 주의점은, 2개의 인수의 값을 포함한 범위가 지정된다고 하는 것입니다.

예를 들어 .between(2,5) 라고 하면, 2~5까지의 범위를 지정해, 2도 5도 범위에 포함합니다.

칼럼 AvgPopPrice(강아지 가격)에서 500달러에서 1000달러 사이의 진위를 확인해 봅시다.


1000달러 그냥 Affenpinscher도 True로 반환되었습니다.


인용 소스 : Pandas 문서

또, 이 메소드는 정수뿐만 아니라, 소수점(floating number)에서도, 시간(.to_datetime()으로 datetime 객체로 한 것)의 범위에서도 지정할 수가 있습니다

시도에 미식축구 선수의 데이터에 선수의 생일 데이터가 있기 때문에

1985년부터 1990년생 선수

의 데이터를 픽업

※연월일의 비교를 Pandas로 실시하기 위해서는, datetime 오브젝트로 재작성할 필요가 있으므로, 모르는 분은 이 기사 를 참고에 부디



이 범위에 태어난 선수의 데이터를 표시하네요.



요약



이번에는 간단한 영작문을 만드는 데 사용할 수 있는 Pandas 메서드를 소개했습니다.

도움이 되면 다행입니다.

좋은 웹페이지 즐겨찾기