ISO-8859-1,Latin-1 서유럽 코드 소개 및 응용

3355 단어 ISO-8859-1Latin-1
이 인 코딩 들 은 일찍이 일부 응용 프로그램 에서 자주 보 았 는데,아마도 많은 친구 들 도 보 았 을 것 이다.이 인 코딩 들 은!

이 그림 에서 우 리 는 이러한 인 코딩 응용 이 매우 광범 위 하 다 는 것 을 볼 수 있 습 니 다.그러면 iso-8859-1 문자 집합 이 도대체 어떤 문자 집합 인지,그 문자 들 이 있 는 지 함께 봅 시다!왜,그것 의 응용 이 이렇게 광범 위 할 수 있 습 니까?
컴퓨터 에서 첫 번 째 문자 집합 이 유행 하 는데 ascii 코드 이 고 0-127 의 128 문자 입 니 다.모든 문 자 는 안에 대응 하 는 번호 가 있 는데 각각 0-127 이다.바 이 너 리 로 표시 하면 딱 7 자리 다.이 문자 집합 은 초기 에 영어 문자 가 충분 하 다 는 것 을 나타 낸다.그 후에 컴퓨터 가 보급 되면 서 점점 더 많은 국가(유럽)에서 컴퓨터 를 응용 하기 시 작 했 는데 그들 은 7 자리,모두 128 자 를 발견 했다.그들 이 자주 사용 하 는 문 자 를 묘사 할 수 없습니다.그래서 ascii 문자 집합 을 호 환 할 생각 에 확장 ASCII 문자 집합 을 지정 하 였 습 니 다.최대 0-255,256 글자.그 중에서 0-127 128 문자 와 위치 인 코딩 은 ascii 코드 를 완전히 호 환 합 니 다.128-255 위 치 를 확 장 했 을 뿐 새 문자 로 편 입 했 습 니 다!

이 문자 집합 은 ascii 문자 집합 을 완전히 호 환 하고 하나의 바이트 로 안의 모든 문자 위 치 를 표시 할 수 있 습 니 다.확장 Ascii 코드 라 고도 합 니 다!이것 도 첫 번 째 iso-8859-1 문자 집합 입 니 다.라틴어-1 인 코딩(서유럽 인 코딩)이 라 고도 부 르 는데 나중에 iso-8859-2...-15 문자 집합 이 속속 나 왔 다.모두 ascii 사 이 즈 를 완전히 호 환 합 니 다.
몇 가지 개념 을 말 해 보 세 요.문자 집합 이 무엇 입 니까?문자 인 코딩 이 무엇 입 니까?
1.문자 집합 은 지정 한 문자 로 구 성 된 집합 을 나타 낸다!ascii 문자 집합,128 글자 가 들 어 있 습 니 다.
2.문자 인 코딩,모든 문자 집중 문자,고정 번호 가 있 습 니 다.이 문자 가 문자 집중 에 있 는 인 코딩 이 라 고도 합 니 다!예 를 들 어 ascii 문자 집중,a 문자 인 코딩 은 97 입 니 다.
같은 문자,여러 문자 에 집중 되 나 요?같은 문자 가 다른 문자 에 집중 되 어 있 는 것 과 같 나 요?
위의 예 에서 볼 수 있 듯 이 ascii 문자 집합,iso-8859-1 문자 집합 은 128 글자 가 같 습 니 다.항상 같은 문자 로 각 문자 집중 에 나타 날 수 있 습 니 다.그러나 모든 문자 집합 은 문자 번호 방식 이 다 를 수 있 기 때문에 같은 문자 가 서로 다른 문자 에 집중 되면 인 코딩 결과 가 다 를 수 있 습 니 다.물론 똑 같은 것 도 있 습 니 다!ascii 의 모든 문자 인 코딩 처럼 iso-8859-1 문자 가 집중 되 어 있 습 니 다.
문자 집합,문자 인 코딩 개념 을 분명히 하 다.우 리 는 아직 파악 해 야 할 몇 가지 가 있다.바로,컴퓨터 는 어떻게 문 자 를 저장 하고 표시 합 니까?
하나의 파일 에는 많은 기호 로 구성 되 어 있 습 니 다.각양각색 입 니 다!실제 컴퓨터 는 저장 할 때 이 문자 에 대응 하 는 문자 인 코딩 값 만 기록 합 니 다.디스크 에 저장 하거나 네트워크 에 전송 하 십시오!표시 하려 면 해당 문자 집중 을 통 해 문자 인 코딩 값 을 표시 합 니 다.그리고 컴퓨터 에서 통용 되 는 문자 집합 에 대응 하 는 문자 인 코딩 으로 변환 할 수 있 습 니 다.컴퓨터 의 모든 문자 모양,그림 은 글꼴 에 있 습 니 다.그리고 유 니 버 설 문자 집합 문자 인 코딩 을 통 해 해당 하 는 문자 와 글꼴 모양 을 찾 아 표시 합 니 다!

컴퓨터 에 문 자 를 저장 하고 전송 하 는 것 은 모두 이 문자 가 있 는 문자 집중 인 코딩 값 입 니 다.
자,중간 에 우 리 는 문자 개념 에 대해 많은 논술 과 설명 을 했 습 니 다!다음은 이 페이지 의 테마 iso-8859-1 문자 집합 을 계속 하 겠 습 니 다.그것 은 왜 이렇게 광범 위 하 게 응용 할 수 있 습 니까?
우 리 는 단일 바이트 가 최대 256 자 를 표시 할 수 있다 는 것 을 알 고 있 습 니 다.실제로 많은 문자(현재 유 니 코드 는 몇 십 만 문자)를 여러 바이트 로 저장 해 야 합 니 다!컴퓨터 가 저장 하고 전송 하 는 것 은 모두 바이트 단위 입 니 다!따라서 단일 바이트:iso-8859-1 은 저 장 된 최소 단위 입 니 다.그래서 몇 개의 바이트 로 구 성 된 문자 든 단일 바이트 로 하나씩 저장 하고 전송 합 니 다!원래 의 값 을 바 꾸 지 않 고 값 을 잘 저장 할 수 있 습 니 다!컴퓨터 가 어 지 럽 게 표시 되 었 을 때 잘못된 문자 집중 에서 해당 하 는 문자 인 코딩 문 자 를 찾 습 니 다!항상 인 코딩 은 문자 집합 을 선택 합 니 다.디 스 플레이 선택 문자 집합 과 일치 하지 않 아서 생 긴 것 입 니 다!
파일 을 복사 하고 전송 하 는 데 문자 인 코딩 문제 가 발생 하지 않 습 니 다.문제 가 생 겼 을 때 문 자 를 표시 하거나 문 자 를 저장 할 때 문제 가 발생 합 니 다!자,여기 서 말 하 는 것 은 iso-8859-1 입 니 다.사실은 문자 인 코딩 에 대한 상식 입 니 다!이러한 것들 을 이해 하면 iso-8859-1 의 특징 에 대한 이해 가 더욱 쉬 워 질 것 입 니 다!
예전 에 친구 가 저 에 게 my sql 은 중국 어 를 저장 하 는 것 이 라 고 물 었 을 수도 있 습 니 다.왜 저 는 문자 집합 이 Latin-1 이 라 고 선 택 했 습 니까?사실은 그렇지 않 습 니 다.그것 은 단지 어떤 바이트 도 받 아서 단일 바이트 에 따라 하나씩 저장 할 것 입 니 다.그리고 읽 을 때 도 바이트 마다 읽 습 니 다.저장 내용 을 변경 하지 않 았 고 인 코딩 변환 도 하지 않 았 습 니 다!이것 은,가장 안전 한 것 이다!자,여기까지 입 니 다.여러분 의 교 류 를 환영 합 니 다!

좋은 웹페이지 즐겨찾기