허프만 - 코드 알고리즘

4225 단어 algorithms
허프만 알고리즘을 구현하는 것은 초보자에게는 어려울 수 있지만 가장 눈에 띄는 알고리즘 중 하나이며 적절한 지식이 있어야 합니다. 그래서 그것을 구현하기 위해 간단한 알고리즘을 공유해야한다고 생각했습니다.
그것을 배우면 힙, 트리 및 데이터 압축 알고리즘에 대한 지식을 얻는 데 도움이 됩니다.
다음은 스크래치 형태로 구현하는 간단한 방법입니다.


import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.util.ArrayList;
import java.util.BitSet;
import java.util.Comparator;
import java.util.HashMap;


public class HEncoder {
    private HashMap<Character, String> encoder = new HashMap<>();
    private HashMap<String, Character> decoder = new HashMap<>();

    private static class Node{
        Character data;
        int freq;
        Node left;
        Node right;
        private static final NodeComparator Ctor = new NodeComparator();

        private static class NodeComparator implements Comparator<Node>{
            @Override
            public int compare(Node o1, Node o2) {
                // TODO Auto-generated method stub
                return o2.freq - o1.freq;
            }
        }
    }

    // 1. freq map
    // 2. prepare the heap from keyset
    // 3. prepare tree - remove two, merge, add it back
    // 4. traverse
    public HEncoder(String feeder){
        // 1. freq map
        HashMap<Character, Integer> fm = new HashMap<>();
        for(int i = 0; i < feeder.length(); i++){
            char ch = feeder.charAt(i);

            if(fm.containsKey(ch)){
                fm.put(ch, fm.get(ch) + 1);
            } else {
                fm.put(ch, 1);
            }
        }

        // 2. create the heap
        PriorityQueue<Node> heap = new PriorityQueue<>(Node.Ctor);
        ArrayList<Character> keys = new ArrayList<>(fm.keySet());
        for(Character key: keys){
            Node node = new Node();
            node.data = key;
            node.freq = fm.get(key);

            heap.add(node);
        }

        // 3. create the binary tree - remove two, merge, put it back till size is 1
        while(heap.size() != 1){
            Node one = heap.removeHP();
            Node two = heap.removeHP();

            Node merged = new Node();
            merged.freq = one.freq + two.freq;
            merged.left = one;
            merged.right = two;

            heap.add(merged);
        }

        // 4. traverse the tree
        Node finalNode = heap.removeHP();
        traverse(finalNode, "");
    }

    private void traverse(Node node, String osf) {
        // work
        if(node.left == null && node.right == null){
            encoder.put(node.data, osf);
            decoder.put(osf, node.data);
            return;
        }

        traverse(node.left, osf + "0");
        traverse(node.right, osf + "1");
    }

    public String compress(String str) throws Exception {
        String rv = "";

        for(int i = 0; i < str.length(); i++){
            rv += encoder.get(str.charAt(i));
        }

        byte[] barr = null;

        if(rv.length() % 8 == 0){
            barr = new byte[rv.length() / 8];
        } else {
            barr = new byte[rv.length() / 8 + 1];
        }

        int counter = 0;
        for(int i = 0; i < rv.length(); ){
            barr[counter] = (byte)Integer.parseInt(rv.substring(i, Math.min(i + 8, rv.length())), 2);
            counter++;
            i = i + 8;
        }

        Path path = Paths.get("E:\\1.obj");
        Files.write(path, barr);

        return rv;
    }

    public String decompress(String str) throws Exception{
        Path path = Paths.get("E:\\1.obj");
        byte[] arr = Files.readAllBytes(path);

        for(int i = 0; i < arr.length; i++){
            str += String.format("%8s", Integer.toBinaryString(arr[i] & 0xFF)).replace(' ', '0');
        }

        String rv = "";

        String code = "";
        for(int i = 0; i < str.length(); i++){
            code += str.charAt(i);

            if(decoder.containsKey(code)){
                rv += decoder.get(code);
                code = "";
            }
        }

        return rv;
    }
}

좋은 웹페이지 즐겨찾기