엔트로피 코딩
엔트로피는 원래 뭐였지?
정보량과 엔트로피는 정보 이론의 개념으로 어떤 일이 발생할 때 얼마나 어렵게 발생하는지를 나타내는 척도이다.
어떤 데이터를 표현하는데 필요한 최소한의 정보량은 무엇일까.A와 B 두 가지 모드만 있다면 A=0, B=1이 할당된 것을 알았다면 ABAB는 0101(bit)이며 0x5(hex)로 표현할 수 있다.
사람은 엔트로피를 토대로 더 적은 데이터로 정보를 표현하기 위해 끊임없이 모색하고 있다.
가농포 코드
한마디로 누적된 출현 확률이 그대로 드러난다.
예를 들어 다음과 같은 테스트 데이터로 고려한다(공간은 쉽게 이해할 수 있는 구분자를 위한 것이다).
- SRC = AABB ABAB ABAB CAAA
A=00, B = 01, C=10 (bin)면 2비트× 16 = 32bit
- SRC = 00000101 00010001 00010001 10000000 (bin)
빈도가 높은 것이 나오면 짧은 비트를 나눠보자는 생각이다.
그리고 인코딩을 시도해 보세요.
예를 들어 재주파수를 나타내는 A만 1비트를 사용했다!그러니까 정보량이 더 이상 줄어들면 안 된다는 거예요.
그래서'복수 비트의 기호로 더 많은 정보를 표현하자'고 생각했다.
극단적으로 말하면, "3.14"는 바로 "159265..."이다.이어'1.732'하면'0508...'이렇게 계속됩니다.
이야기는'어떤 수열을 표현하고 더욱 치밀한 표현 수단'을 향해 발전한다.
산술 부호
데이터의 출현 빈도에 따라 0~1 사이의 구간을 구분하다.
다음 데이터가 반복되면 그 동네도 다시 쪼개지고...
한 소수로 여러 개의 데이터 열을 표시할 수 있는 방법.
범위 인코딩
소수 연산을 위한 인코딩.산술 인코딩에서 0~1 구간 내에 있으면dynamic보다 몇 배나 많은 것을 동시에 처리합니다.아르바이트 단위로 출력을 입력할 수 있다고 쓰여 있는데, 음...어쨌든 보류하겠습니다.
Asymmetric numberal 시스템으로 이야기 계속
<다음 예고>https://arxiv.org/pdf/1311.2540.pdf를 천천히 읽고 좀 더 자세히 읽어주세요!
Reference
이 문제에 관하여(엔트로피 코딩), 우리는 이곳에서 더 많은 자료를 발견하고 링크를 클릭하여 보았다 https://qiita.com/hon_no_mushi/items/bb15ec5dbd09d55266f5텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.
우수한 개발자 콘텐츠 발견에 전념 (Collection and Share based on the CC Protocol.)