머신러닝 스터디 - 넘파이(Numpy)

66528 단어 ML python ML

Numpy ndarray 개요

ndarray 생성
np.array()

import numpy as np

list1 = [1, 2, 3]
print("list1:",list1)
print("list1 type:",type(list1))

array1 = np.array(list1)
print("array1:",array1)
print("array1 type:", type(array1))

list1: [1, 2, 3]
list1 type: <class 'list'>
array1: [1 2 3]
array1 type: <class 'numpy.ndarray'>

ndarray 의 형태(shape)와 차원

array1 = np.array([1,2,3])
print('array1 type:',type(array1))
print('array1 array 형태:',array1.shape)

array2 = np.array([[1,2,3],
                  [2,3,4]])
print('array2 type:',type(array2))
print('array2 array 형태:',array2.shape)

array3 = np.array([[1,2,3]])
print('array3 type:',type(array3))
print('array3 array 형태:',array3.shape)

array1 type: <class 'numpy.ndarray'>
array1 array 형태: (3,)
array2 type: <class 'numpy.ndarray'>
array2 array 형태: (2, 3)
array3 type: <class 'numpy.ndarray'>
array3 array 형태: (1, 3)

print('array1: {:0}차원, array2: {:1}차원, array3: {:2}차원'.format(array1.ndim,array2.ndim,array3.ndim))

array1: 1차원, array2: 2차원, array3:  2차원

ndarray 데이터 값 타입

list1 = [1,2,3]
print(type(list1))
array1 = np.array(list1)

print(type(array1))
print(array1, array1.dtype)

<class 'list'>
<class 'numpy.ndarray'>
[1 2 3] int32

list2 = [1, 2, 'test']
array2 = np.array(list2)
print(array2, array2.dtype)

list3 = [1, 2, 3.0]
array3 = np.array(list3)
print(array3, array3.dtype)

['1' '2' 'test'] <U11
[1. 2. 3.] float64

astype()을 통한 타입 변환

array_int = np.array([1, 2, 3])
array_float = array_int.astype('float64')
print(array_float, array_float.dtype)

array_int1= array_float.astype('int32')
print(array_int1, array_int1.dtype)

array_float1 = np.array([1.1, 2.1, 3.1])
array_int2= array_float1.astype('int32')
print(array_int2, array_int2.dtype)

[1. 2. 3.] float64
[1 2 3] int32
[1 2 3] int32

ndarray에서 axis 기반의 연산함수 수행

array2 = np.array([[1,2,3],
                  [2,3,4]])

print(array2.sum())
print(array2.sum(axis=0))
print(array2.sum(axis=1))

15
[3 5 7]
[6 9]

ndarray를 편리하게 생성하기 - arange, zeros, ones

sequence_array = np.arange(10)
print(sequence_array)
print(sequence_array.dtype, sequence_array.shape)

[0 1 2 3 4 5 6 7 8 9]
int32 (10,)

zero_array = np.zeros((3,2),dtype='int32')
print(zero_array)
print(zero_array.dtype, zero_array.shape)

one_array = np.ones((3,2))
print(one_array)
print(one_array.dtype, one_array.shape)

[[0 0]
 [0 0]
 [0 0]]
int32 (3, 2)
[[1. 1.]
 [1. 1.]
 [1. 1.]]
float64 (3, 2)

ndarray의 shape를 변경하는 reshape()

array1 = np.arange(10)
print('array1:\n', array1)

array2 = array1.reshape(2,5)
print('array2:\n',array2)

array3 = array1.reshape(5,2)
print('array3:\n',array3)

array1:
 [0 1 2 3 4 5 6 7 8 9]
array2:
 [[0 1 2 3 4]
 [5 6 7 8 9]]
array3:
 [[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]

# 변환할 수 있는 shape구조를 입력하면 오류 발생.
array1.reshape(4,3)

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

~\AppData\Local\Temp/ipykernel_13696/1260719381.py in <module>
      1 # 변환할 수 있는 shape구조를 입력하면 오류 발생.
----> 2 array1.reshape(4,3)


ValueError: cannot reshape array of size 10 into shape (4,3)

reshape()에 -1 인자값을 부여하여 특정 차원으로 고정된 가변적인 ndarray형태 변환

array1 = np.arange(10)
print(array1)

#컬럼 axis 크기는 5에 고정하고 로우 axis크기를 이에 맞춰 자동으로 변환. 즉 2x5 형태로 변환 
array2 = array1.reshape(-1,5)
print('array2 shape:',array2.shape)
print('array2:\n', array2)

#로우 axis 크기는 5로 고정하고 컬럼 axis크기는 이에 맞춰 자동으로 변환. 즉 5x2 형태로 변환 
array3 = array1.reshape(5,-1)
print('array3 shape:',array3.shape)
print('array3:\n', array3)

[0 1 2 3 4 5 6 7 8 9]
array2 shape: (2, 5)
array2:
 [[0 1 2 3 4]
 [5 6 7 8 9]]
array3 shape: (5, 2)
array3:
 [[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]

# reshape()는 (-1, 1), (-1,)와 같은 형태로 주로 사용됨.
# 1차원 ndarray를 2차원으로 또는 2차원 ndarray를 1차원으로 변환 시 사용. 
array1 = np.arange(5)

# 1차원 ndarray를 2차원으로 변환하되, 컬럼axis크기는 반드시 1이여야 함. 
array2d_1 = array1.reshape(-1, 1)
print("array2d_1 shape:", array2d_1.shape)
print("array2d_1:\n",array2d_1)

# 2차원 ndarray를 1차원으로 변환 
array1d = array2d_1.reshape(-1,)
print("array1d shape:", array1d.shape)
print("array1d:\n",array1d)

array2d_1 shape: (5, 1)
array2d_1:
 [[0]
 [1]
 [2]
 [3]
 [4]]
array1d shape: (5,)
array1d:
 [0 1 2 3 4]

# -1 을 적용하여도 변환이 불가능한 형태로의 변환을 요구할 경우 오류 발생.
array1 = np.arange(10)
array4 = array1.reshape(-1,4)

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

~\AppData\Local\Temp/ipykernel_13696/1336941437.py in <module>
      1 # -1 을 적용하여도 변환이 불가능한 형태로의 변환을 요구할 경우 오류 발생.
      2 array1 = np.arange(10)
----> 3 array4 = array1.reshape(-1,4)


ValueError: cannot reshape array of size 10 into shape (4)

# 반드시 -1 값은 1개의 인자만 입력해야 함. 
array1.reshape(-1, -1)

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

~\AppData\Local\Temp/ipykernel_13696/828204032.py in <module>
      1 # 반드시 -1 값은 1개의 인자만 입력해야 함.
----> 2 array1.reshape(-1, -1)


ValueError: can only specify one unknown dimension

ndarray의 데이터 세트 선택하기 – 인덱싱(Indexing)

특정 위치의 단일값 추출

# 1에서 부터 9 까지의 1차원 ndarray 생성 
array1 = np.arange(start=1, stop=10)
print('array1:',array1)

# index는 0 부터 시작하므로 array1[2]는 3번째 index 위치의 데이터 값을 의미
value = array1[2]
print('value:',value)
print(type(value))

array1: [1 2 3 4 5 6 7 8 9]
value: 3
<class 'numpy.int32'>

print('맨 뒤의 값:',array1[-1], ', 맨 뒤에서 두번째 값:',array1[-2])

맨 뒤의 값: 9 , 맨 뒤에서 두번째 값: 8

array1[0] = 9
array1[8] = 0
print('array1:',array1)

array1: [9 2 3 4 5 6 7 8 0]

array1d = np.arange(start=1, stop=10)
array2d = array1d.reshape(3,3)
print(array2d)

print('(row=0,col=0) index 가리키는 값:', array2d[0,0] )
print('(row=0,col=1) index 가리키는 값:', array2d[0,1] )
print('(row=1,col=0) index 가리키는 값:', array2d[1,0] )
print('(row=2,col=2) index 가리키는 값:', array2d[2,2] )

[[1 2 3]
 [4 5 6]
 [7 8 9]]
(row=0,col=0) index 가리키는 값: 1
(row=0,col=1) index 가리키는 값: 2
(row=1,col=0) index 가리키는 값: 4
(row=2,col=2) index 가리키는 값: 9

슬라이싱(Slicing)

array1 = np.arange(start=1, stop=10)
print(array1)
array3 = array1[0:3]
print(array3)
print(type(array3))

[1 2 3 4 5 6 7 8 9]
[1 2 3]
<class 'numpy.ndarray'>

array1 = np.arange(start=1, stop=10)
array4 = array1[:3]
print(array4)

array5 = array1[3:]
print(array5)

array6 = array1[:]
print(array6)

[1 2 3]
[4 5 6 7 8 9]
[1 2 3 4 5 6 7 8 9]

array1d = np.arange(start=1, stop=10)
array2d = array1d.reshape(3,3)
print('array2d:\n',array2d)

print('array2d[0:2, 0:2] \n', array2d[0:2, 0:2])
print('array2d[1:3, 0:3] \n', array2d[1:3, 0:3])
print('array2d[1:3, :] \n', array2d[1:3, :])
print('array2d[:, :] \n', array2d[:, :])
print('array2d[:2, 1:] \n', array2d[:2, 1:])
print('array2d[:2, 0] \n', array2d[:2, 0])

array2d:
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
array2d[0:2, 0:2] 
 [[1 2]
 [4 5]]
array2d[1:3, 0:3] 
 [[4 5 6]
 [7 8 9]]
array2d[1:3, :] 
 [[4 5 6]
 [7 8 9]]
array2d[:, :] 
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
array2d[:2, 1:] 
 [[2 3]
 [5 6]]
array2d[:2, 0] 
 [1 4]

팬시 인덱싱(fancy indexing)

array1d = np.arange(start=1, stop=10)
array2d = array1d.reshape(3,3)
print(array2d)

array3 = array2d[[0,1], 2]
print('array2d[[0,1], 2] => ',array3.tolist())

array4 = array2d[[0,2], 0:2]
print('array2d[[0,2], 0:2] => ',array4.tolist())

array5 = array2d[[0,1]]
print('array2d[[0,1]] => ',array5.tolist())

[[1 2 3]
 [4 5 6]
 [7 8 9]]
array2d[[0,1], 2] =>  [3, 6]
array2d[[0,2], 0:2] =>  [[1, 2], [7, 8]]
array2d[[0,1]] =>  [[1, 2, 3], [4, 5, 6]]

불린 인덱싱(Boolean indexing)

array1d = np.arange(start=1, stop=10)
print(array1d)

[1 2 3 4 5 6 7 8 9]

print(array1d > 5)

var1 = array1d > 5
print("var1:",var1)
print(type(var1))

[False False False False False  True  True  True  True]
var1: [False False False False False  True  True  True  True]
<class 'numpy.ndarray'>

# [ ] 안에 array1d > 5 Boolean indexing을 적용 
print(array1d)
array3 = array1d[array1d > 5]
print('array1d > 5 불린 인덱싱 결과 값 :', array3)

[1 2 3 4 5 6 7 8 9]
array1d > 5 불린 인덱싱 결과 값 : [6 7 8 9]

boolean_indexes = np.array([False, False, False, False, False,  True,  True,  True,  True])
array3 = array1d[boolean_indexes]
print('불린 인덱스로 필터링 결과 :', array3)

불린 인덱스로 필터링 결과 : [6 7 8 9]

indexes = np.array([5,6,7,8])
array4 = array1d[ indexes ]
print('일반 인덱스로 필터링 결과 :',array4)

일반 인덱스로 필터링 결과 : [6 7 8 9]

array1d = np.arange(start=1, stop=10)
target = []

for i in range(0, 9):
    if array1d[i] > 5:
        target.append(array1d[i])

array_selected = np.array(target)
print(array_selected)

[6 7 8 9]

print(array1d[array1 > 5])

[6 7 8 9]

행렬의 정렬 – sort( )와 argsort( )

행렬 정렬

org_array = np.array([ 3, 1, 9, 5]) 
print('원본 행렬:', org_array)

# np.sort( )로 정렬 
sort_array1 = np.sort(org_array)         
print ('np.sort( ) 호출 후 반환된 정렬 행렬:', sort_array1) 
print('np.sort( ) 호출 후 원본 행렬:', org_array)

# ndarray.sort( )로 정렬
sort_array2 = org_array.sort()
org_array.sort()
print('org_array.sort( ) 호출 후 반환된 행렬:', sort_array2)
print('org_array.sort( ) 호출 후 원본 행렬:', org_array)

원본 행렬: [3 1 9 5]
np.sort( ) 호출 후 반환된 정렬 행렬: [1 3 5 9]
np.sort( ) 호출 후 원본 행렬: [3 1 9 5]
org_array.sort( ) 호출 후 반환된 행렬: None
org_array.sort( ) 호출 후 원본 행렬: [1 3 5 9]

sort_array1_desc = np.sort(org_array)[::-1]
print ('내림차순으로 정렬:', sort_array1_desc)

내림차순으로 정렬: [9 5 3 1]

array2d = np.array([[8, 12], 
                   [7, 1 ]])

sort_array2d_axis0 = np.sort(array2d, axis=0)
print('로우 방향으로 정렬:\n', sort_array2d_axis0)

sort_array2d_axis1 = np.sort(array2d, axis=1)
print('컬럼 방향으로 정렬:\n', sort_array2d_axis1)

로우 방향으로 정렬:
 [[ 7  1]
 [ 8 12]]
컬럼 방향으로 정렬:
 [[ 8 12]
 [ 1  7]]

argsort

org_array = np.array([ 3, 1, 9, 5]) 
print(np.sort(org_array))

sort_indices = np.argsort(org_array)
print(type(sort_indices))
print('행렬 정렬 시 원본 행렬의 인덱스:', sort_indices)

[1 3 5 9]
<class 'numpy.ndarray'>
행렬 정렬 시 원본 행렬의 인덱스: [1 0 3 2]

org_array = np.array([ 3, 1, 9, 5]) 
print(np.sort(org_array)[::-1])

sort_indices_desc = np.argsort(org_array)[::-1]
print('행렬 내림차순 정렬 시 원본 행렬의 인덱스:', sort_indices_desc)

[9 5 3 1]
행렬 내림차순 정렬 시 원본 행렬의 인덱스: [2 3 0 1]

key-value 형태의 데이터를 John=78, Mike=95, Sarah=84, Kate=98, Samuel=88을 ndarray로 만들고
argsort()를 이용하여 key값을 정렬

name_array=np.array(['John', 'Mike', 'Sarah', 'Kate', 'Samuel'])
score_array=np.array([78, 95, 84, 98, 88])

# score_array의 정렬된 값에 해당하는 원본 행렬 위치 인덱스 반환하고 이를 이용하여 name_array에서 name값 추출.  
sort_indices = np.argsort(score_array)
print("sort indices:", sort_indices)

name_array_sort = name_array[sort_indices]

score_array_sort = score_array[sort_indices]
print(name_array_sort)
print(score_array_sort)

sort indices: [0 2 4 1 3]
['John' 'Sarah' 'Samuel' 'Mike' 'Kate']
[78 84 88 95 98]

선형대수 연산 – 행렬 내적과 전치 행렬 구하기

행렬 내적

A = np.array([[1, 2, 3],
              [4, 5, 6]])
B = np.array([[7, 8],
              [9, 10],
              [11, 12]])

dot_product = np.dot(A, B)
print('행렬 내적 결과:\n', dot_product)

행렬 내적 결과:
 [[ 58  64]
 [139 154]]

전치 행렬

A = np.array([[1, 2],
              [3, 4]])
transpose_mat = np.transpose(A)
print('A의 전치 행렬:\n', transpose_mat)

A의 전치 행렬:
 [[1 3]
 [2 4]]


                
                    
        
    
    
    
    
    
                
                

                
                
                    
                        
                            

                            
                            Author And Source
                            


                            이 문제에 관하여(머신러닝 스터디 - 넘파이(Numpy)), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다
                                
                                https://velog.io/@taeho8822/머신러닝-스터디-넘파이Numpy-ii0uukwj
                            

                            
                            
                                저자 귀속: 원작자 정보가 원작자 URL에 포함되어 있으며 저작권은 원작자 소유입니다.
                            
                            
                                
                                
                                

                                
                                

                                우수한 개발자 콘텐츠 발견에 전념
                                (Collection and Share based on the CC Protocol.)




            
                
                    
                        

                        HDU 3647 Tetris
                
                
                    [01.27~ 01.29] Admin 페이지 만들기
                        


                    
                
            
            
                

                    
                        좋은 웹페이지 즐겨찾기

                        
                        
                            
                            
                                
                                    개발자 우수 사이트 수집
                                    
                                        
                                        개발자가 알아야 할 필수 사이트 100선 추천
                                    우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다
                                
                                
                            
                            
                        
                        


                    


                
            
            

            
                
                    관련 게시물

                            
                                


                                    


                                    

                                        
                                            Pytorch 머신러닝 모델의 성능을 극대화하는 7가지 팁!

                                        
                                        
                                        pytorch 는 페이브숙에서 개발한 딥러닝 프레임워크이기 때문에 글 내용을 상당히 신뢰할 수 있을 것 같다.
무슨 말이냐면, pytorch 를 더 쉽게 사용할 수 있도록 도와주는 도구라는 거다.
아래 이미지처럼 pytorch 코드를 더 보기 쉽고 편집하기 쉽도록 깔끔하게 정리해주는 역할을 하고, 훨씬 간단한 코드 작성을 통해 모델 학습, 테슽, 검증, 분산된 GPU/CPU 설정 등이 가능하...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            GTX1660Super GPU셋팅

                                        
                                        
                                        수업시간에 딥러닝으로 이미지 분석을 진행중인데,
딥러닝을 하려면 GPU 셋팅이 따로 필요하여 점심시간을 이용해서 진행하려 한다.
최종 시스템 환경
GPU : Geforce GTX 1660 Super 6GB
tensorflow : 2.7.0
python : 3.8.0
CUDA : 11.2.2
cuDNN : 8.1.1
제일 먼저 내 CPU에 해당하는 Compute capability를 확인한다....
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            이미지를 잘 보려면? Convolution!

                                        
                                        
                                        그리고 Subsampling 과정을 통해서 이미지의 크기를 줄이고 Local feature들에 대한 Filter 연산을 반복적으로 수행해 Global feature를 얻을 수 있도록 합니다.
보통 Convolution + Subsampling 과정을 여러번 거치게 된다면 이미지를 대표한다고 할 수 있는 Global한 특징을 가지게 됩니다.
여러개의 Feature map을 추출하고 싶다면 Co...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            [ML/DL] Train/Test/Valid Dataset

                                        
                                        
                                        모델을 학습 시킬 때 사용할 데이터는 train/test/valid(혹은 Dev) 으로 분리해서 학습에 사용된다.
이렇게 분리하는 이유와 각 데이터 셋의 용도와 데이터를 분리할 때 사용할 수 있는 모듈들을 알아보자~
한 눈에 살펴보는 특징들
표 출처 :
간단히 말해,
1. train data 는 모델을 학습할 때 쓰이는 데이터셋
2. validation data 는 학습된 모델이 잘 학습이 ...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            ML : Use cases in FINTECH

                                        
                                        
                                        앱 행동 분석을 통해 고객을 subscribing products( 대표적인 예로 youtube premium, pandora premium 등이 있습니다.
이 프로젝트의 대상은 회사의 무료 제품을 사용하는 고객입니다.
제품 자체는 업종 불문 무엇이든 상관없지만 무료, 유료 버전 둘다 있어야 합니다.
가장 중요한 프로젝트의 목표는 무료 유저를 유료 멤버로 전환하는 것입니다.
-> 이런식으로 ...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            Minimzing Churn of Subscription Product through Analysis of Financial Habit

                                        
                                        
                                        제가 작업하는 이 모델의 진가를 아직 회사가 알지 못할 수 있지만 큰 가치를 창출할 수 있다고 생각하는 모델입니다.
이는 상품이 고객에게 주는 이점을 상기시키거나, 사용자가 흥미있어 할 만한 상품을 추가하는 것일 수 있습니다.
withdrawal : 유저가 돈을 출금한 횟수
purchases : 유저가 계좌에서 소비한 횟수 (회사는 다양한 제휴 상점과 계약해 유저들에게 할인을 제공)
purc...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            Credit Card Fraud Detection

                                        
                                        
                                        오늘은 신용카드 이상 거래 탐지에 대해 확인하고 ML, DL을 활용해 문제를 해결하려 합니다.
게임과 같은 산업에서는 부정 어뷰징과 같은 이상현상들이 나타나는 것을 체크하여 유저가 더이상 부정행위를 못하도록 계정을 정지시키기도 합니다.
😒신용카드 이상 거래 탐지의 가장 큰 문제점 중 하나는 보안 코드와 유효기간이 적힌 신용카드의 15~16자리를 도용할 수 있다는 것입니다.
😎최종목표는 새로운...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            AnoGAN 코드 리뷰

                                        
                                        
                                        직관적으로 이해하기 쉬움
어려운 비지도학습 문제를 지도학습 문제로 바꿔서 푼 것이라 이해하면 쉽다고 한다.
데이터 그 자체를 Label로 활용한 것이다.
Encoder에게는 이미지를 잘 압축하는 방법을
Decoder에게는 이미지를 잘 생성해내는 방식을 배우게 하는것으로 모델은 동작한다.
AE의 뒷부분을 떼놓았다 생각한다.
이미지를 생성할 수 있는 Decoder, 다른 말로 Generator로...
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            파이썬을 사용하여 10진수를 bin, 8진수 및 16진수 형식으로 변환하는 방법은 무엇입니까?

                                        
                                        

                                    


                                
                            
                        

                            
                                


                                    


                                    

                                        
                                            로마 숫자를 정수로 또는 그 반대로 변환

                                        
                                        
                                        그 중 하나는 로마 숫자를 정수로 변환하는 함수를 만드는 것이었고 두 번째는 그 반대를 수행하는 함수를 만드는 것이었습니다.
문자만 포함합니다'I', 'V', 'X', 'L', 'C', 'D', 'M' ; 문자열이 [1, 3999] 범위의 유효한 로마 숫자임을 보장합니다.
따라서 작업은 로마 숫자를 나타내는 주어진 문자열을 해당 정수로 변환하는 것입니다.
I는 V (5)와 X (10) 앞에 ...