binary search 개요

탐색 알고리즘

  • 순차 탐색: 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인하는 방법
  • 이진 탐색: 정렬되어 있는 리스트에서 시작점, 끝점, 중간점을 이용해 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법

예시: 정렬된 10개의 데이터 중 값이 4인 원소 찾기

  • 시작점 = 0(index), 중간점 = 4(index, 소수점제거), 끝점 = 9(index)
    0 2 4 6 8 10 12 14 16 18
  • 찾고자하는 4는 중간점인 8 보다 작기 때문에 8의 왼쪽에 있는 데이터만 보면 됩니다.
    0 2 4 6 8 X X X X X
  • 시작점 = 0(index), 중간점 = 1(index, 소수점제거), 끝점 = 3(index)
    0 2 4 6 X X X X X X
  • 찾고자하는 4는 중간점인 2 보다 크기 때문에 2의 오른쪽에 있는 데이터만 보면 됩니다.
    0 2 4 6 X X X X X X
  • 시작점 = 2(index), 중간점 = 2(index, 소수점제거), 끝점 = 3(index)
    X X 4 6 X X X X X X
  • 중간점 위치에 값이 찾고자하는 4와 동일하기 때문에 탐색을 마칩니다.
    X X 4 6 X X X X X X

시간복잡도

  • 단계마다 탐색 범위를 2로 나누는 것과 동일하므로 log N에 비례합니다.
  • 탐색 범위를 절반씩 줄이기 때문에 O(log N)을 보장합니다.

재귀함수 활용

def binary_search(array, target, start, end):
	if start > end: # semantic error
    	return None
    
    mid = (start + end) // 2
    
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
    	return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 그룹으로
    elif array[mid] > target:
    	return binary_search(array, target, start, mid-1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 그룹으로
    else:
    	return binary_search(array, target, mid+1, end)

# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# array 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행결과 출력
result = binary_search(array, target, 0, n-1)

if result == None:
	print("찾고자하는 원소가 존재하지 않습니다.")
else:
	print(result + 1)

반복문 활용

def binary_search(array, target, start, end):
	
	while start <= end:
    	mid = (start + end) // 2
        
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 그룹으로
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 그룹으로
        else:
            start = mid + 1
	return None
    
# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# array 입력받기
array = list(map(int, input().split()))

# 이진 탐색 수행결과 출력
result = binary_search(array, target, 0, n-1)

if result == None:
	print("찾고자하는 원소가 존재하지 않습니다.")
else:
	print(result + 1)

파이썬 이진 탐색 라이브러리

  • bisect_left(a, x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스 반환
  • bisect_right(a, x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스 반환

from bisect import bisect_left, bisect_right

a = [1, 2, 4, 4, 8]
x = 4

print(bisect_left(a,x)) # 2
print(bisect_right(a,x)) # 4

bisect 응용

from bisect import bisect_left, bisect_right

# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(a, left_value, right_value):
	right_idx = bisect_right(a, right_value)
    left_idx = bisect_left(a, left_value)
    return right_idx - left_idx
    
a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]

# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4)) # 2
print(count_by_range(a, -1, 3)) # 6

파라메트릭 서치

  • 파라메트릭 서치란 최적화 문제를 결정문제(yes or no)로 바꾸어 해결하는 기법입니다.
  • 예를 들어 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제가 해당됩니다.
  • 일반적으로 코딩테스트에서 파라메트릭 서치 문제는 이진 탐색을 이용하여 해결할 수 있습니다.

좋은 웹페이지 즐겨찾기