Java에서 문자열을 중국어나 영어로 판단하는 도구 클래스 공유

직접 코드:



import java.util.regex.Matcher;

import java.util.regex.Pattern;
/**

 * 

 * <p>

 * ClassName ShowChineseInUnicodeBlock

 * </p>

 * <p>

 * Description  

 * </p>

 * 

 * @author wangxu [email protected]

 *         <p>

 *         Date 2014-9-16  06:45:35

 *         </p>

 * @version V1.0

 * 

 */

public class ShowChineseInUnicodeBlock {

 public static void main(String[] args) {

  String str = " ，！？（）：；“”、。";

  char[] charArray = str.toCharArray();

  for (int i = 0; i < charArray.length; i++) {

   isChinese(charArray[i]);

  }

  String chinese = " god damn";

  System.out.println(isContainChinese(chinese));

  String english = "dfafdabac";

  System.out.println(isEnglish(english));

 }
 /**

  * 

  * <p>

  * Title: isChinese

  * </p>

  * <p>

  * Description:  

  * </p>

  * 

  * @param c

  * 

  */

 public static void isChinese(char c) {

  Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);

  if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS) {

   System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS");

  } else if (ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS) {

   System.out.println(c + "--CJK_COMPATIBILITY_IDEOGRAPHS");

  } else if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A) {

   // CJK Unified Ideographs Extension WikipediaUnicode 

   // CJK Unified Ideographs Extension A  A ;  A

   // CJK Unified Ideographs Extension B  B

   System.out.println(c + "--CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A");

  } else if (ub == Character.UnicodeBlock.GENERAL_PUNCTUATION) {//  

   System.out.println(c + "--GENERAL_PUNCTUATION");
  } else if (ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION) {

   System.out.println(c + "--CJK_SYMBOLS_AND_PUNCTUATION");
  } else if (ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {

   System.out.println(c + "--HALFWIDTH_AND_FULLWIDTH_FORMS");
  }

 }
 public static boolean isEnglish(String charaString) {

  return charaString.matches("^[a-zA-Z]*");

 }
 public static boolean isContainChinese(String str) {//  

  String regEx = "[\\u4E00-\\u9FA5]+";

  Pattern p = Pattern.compile(regEx);

  Matcher m = p.matcher(str);

  if (m.find()) {

   return true;

  } else {

   return false;

  }

 }

}

이 내용에 흥미가 있습니까?

현재 기사가 여러분의 문제를 해결하지 못하는 경우 AI 엔진은 머신러닝 분석(스마트 모델이 방금 만들어져 부정확한 경우가 있을 수 있음)을 통해 가장 유사한 기사를 추천합니다:

JPA + QueryDSL 계층형 댓글, 대댓글 구현(2)

이번엔 전편에 이어서 계층형 댓글, 대댓글을 다시 리팩토링해볼 예정이다. 이전 게시글에서는 계층형 댓글, 대댓글을 구현은 되었지만 N+1 문제가 있었다. 이번에는 그 N+1 문제를 해결해 볼 것이다. 위의 로직은 이...

텍스트를 자유롭게 공유하거나 복사할 수 있습니다.하지만 이 문서의 URL은 참조 URL로 남겨 두십시오.

CC BY-SA 2.5, CC BY-SA 3.0 및 CC BY-SA 4.0에 따라 라이센스가 부여됩니다.

좋은 웹페이지 즐겨찾기

개발자 우수 사이트 수집

개발자가 알아야 할 필수 사이트 100선 추천 우리는 당신을 위해 100개의 자주 사용하는 개발자 학습 사이트를 정리했습니다