데이터베이스 관리 시스템 4

TL;DR



지난 블로그 게시물에서는 데이터베이스 시스템의 ACID 속성, 동시성 및 복구에 대해 다루었습니다.

이 게시물에서는 데이터베이스의 인덱싱 및 해싱뿐만 아니라 온라인 트랜잭션 처리와 온라인 분석 처리를 다루는 시간을 할애했습니다.

참고로 OLTP와 OLAP는 데이터베이스 시스템과 ETL(선택 사항)에 대한 기본 지식이 필요합니다. 인덱싱 및 해싱 외에도 쿼리 성능을 최적화하는 방법이 있습니다.

소개



이 튜토리얼이 끝나면 이해하게 될 것입니다.


  • OLTP 대 OLAP
  • 인덱싱 대 역 인덱싱
  • 해싱

  • 핵심 개념




    OLTP

    온라인 거래 처리는 데이터에 대한 거래 중심 애플리케이션을 제공합니다. 명확히 해야 할 예는 ATM이 OLTP 기반 응용 프로그램이라는 것입니다.

    이 프로세스는 현재 데이터로 구성되며 비즈니스 작업 사용 사례가 있습니다. 또한 데이터베이스 구현을 생각할 때 읽기 및 쓰기 작업으로 구성됩니다.


    올랩

    온라인 분석 처리는 데이터 분석에 중점을 둔 소프트웨어 도구/응용 프로그램을 제공합니다. 명확한 예는 Netflix의 영화 추천 시스템입니다.

    이 프로세스는 과거 데이터로 구성되며 데이터는 비즈니스 및 의사 결정을 위한 계획/문제 해결에 사용됩니다. 주로 읽기로만 구성되며 쓰기 작업은 거의 없습니다.


    사이드 노트

    추출 변환 로드 프로세스를 이해하는 데 시간을 할애하면 시스템 아키텍처에서 OLTP와 OLAP가 무엇을 제공하는지 더 명확히 하는 데 도움이 될 수 있으므로 확실히 확인하십시오.


    인덱싱 대 역 인덱싱

    Indexing is a way to optimize the performance of a database by minimizing the number of disk accesses required when a query is processed.



    예시:

    CREATE INDEX index_name
    ON table_name (column1, column2, ...);
    

    IMPORTANT : 인덱스가 있는 테이블을 업데이트하는 것은 인덱스가 없는 테이블을 업데이트하는 것보다 시간이 더 걸립니다(인덱스도 업데이트해야 하기 때문). 따라서 자주 검색되는 열에 대해서만 인덱스를 생성하십시오.

    반전 인덱싱은 요소, 데이터 또는 개체와 같은 콘텐츠를 특정 데이터 개체 또는 문서에 매핑하는 방법입니다. (Google 검색: 역색인)

    즉, 인덱싱은 저장된 쿼리를 통해 정보 및 데이터 검색을 고도로 최적화하는 방법입니다.


    해싱

    Hashing is an efficient technique to directly search the location of desired data on the disk without using index structure.



    일반적으로 빠른 검색을 위해 모든 데이터 포인트를 검색하면 인덱스와 관련하여 속도가 느려지거나 실수로 비효율적일 수 있습니다. 해싱이 이를 해결합니다.

    결론적으로 해싱은 해시 함수를 통해 주소 지정되는 데이터 블록에 저장된 데이터를 보는 것과 관련이 있습니다. 이것은 특정 주소가 메모리 할당이 있을 위치이며 데이터 버킷으로 알려져 있기 때문에 작동합니다.

    이것으로 시리즈의 4부가 끝났고 곧 5부에서 더 많은 내용을 게시할 예정입니다.

    좋은 웹페이지 즐겨찾기