[python]신규 아이디 추천

2021 KAKAO BLIND RECRUITMENT>신규 아이디 추천

[문제 설명]
카카오에 입사한 신입 개발자 네오는 "카카오계정개발팀"에 배치되어, 카카오 서비스에 가입하는 유저들의 아이디를 생성하는 업무를 담당하게 되었습니다. "네오"에게 주어진 첫 업무는 새로 가입하는 유저들이 카카오 아이디 규칙에 맞지 않는 아이디를 입력했을 때, 입력된 아이디와 유사하면서 규칙에 맞는 아이디를 추천해주는 프로그램을 개발하는 것입니다.

다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

예를 들어, new_id 값이 "...!@BaT#*..y.abcdefghijklm" 라면, 위 7단계를 거치고 나면 new_id는 아래와 같이 변경됩니다.

1단계) 대문자 'B'와 'T'가 소문자 'b'와 't'로 바뀌었습니다.
"...!@BaT#..y.abcdefghijklm" → "...!@bat#..y.abcdefghijklm"

2단계) '!', '@', '#', '' 문자가 제거되었습니다.
"...!@bat#
..y.abcdefghijklm" → "...bat..y.abcdefghijklm"

3단계) '...'와 '..' 가 '.'로 바뀌었습니다.
"...bat..y.abcdefghijklm" → ".bat.y.abcdefghijklm"

4단계) 아이디의 처음에 위치한 '.'가 제거되었습니다.
".bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

5단계) 아이디가 빈 문자열이 아니므로 변화가 없습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghijklm"

6단계) 아이디의 길이가 16자 이상이므로, 처음 15자를 제외한 나머지 문자들이 제거되었습니다.
"bat.y.abcdefghijklm" → "bat.y.abcdefghi"

7단계) 아이디의 길이가 2자 이하가 아니므로 변화가 없습니다.
"bat.y.abcdefghi" → "bat.y.abcdefghi"

따라서 신규 유저가 입력한 new_id가 "...!@BaT#*..y.abcdefghijklm"일 때, 네오의 프로그램이 추천하는 새로운 아이디는 "bat.y.abcdefghi" 입니다.

[문제]
신규 유저가 입력한 아이디를 나타내는 new_id가 매개변수로 주어질 때, "네오"가 설계한 7단계의 처리 과정을 거친 후의 추천 아이디를 return 하도록 solution 함수를 완성해 주세요.

[제한사항]

  • new_id는 길이 1 이상 1,000 이하인 문자열입니다.
  • new_id는 알파벳 대문자, 알파벳 소문자, 숫자, 특수문자로 구성되어 있습니다.
  • newid에 나타날 수 있는 특수문자는 -.~!@#$%^&*()=+[{]}:?,<>/ 로 한정됩니다.

[입출력 예]

나의 풀이

생각해보기!

# 1
    new_id = new_id.lower()

1단계) 모든 대문자를 대응되는 소문자로 치환한다.

  • .lower() 함수를 사용해 모든 대문자를 소문자로 치환했다.
# 2
    str_ = 'abcdefghijklmnopqrstuvwxyz0123456789-_.'
    new_id = ''.join(c for c in new_id if c in str_)

2단계) 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거한다.

  • 제외하지 않을 문자를 str에 직접 입력하고 .join() 함수로 str에 포함되는 문자열만 합쳤다.
    (정규 표현식을 지원하는 re 모듈을 사용하지 않고 풀고 싶어서 일일이 입력했다. 아래에 다른 사람의 풀이 또한 추가했으니 re 모듈 풀이법도 알아두자!)
# 3
    while new_id.count('..') >= 1:
        new_id = new_id.replace('..','.')

3단계) 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환한다.

  • while 반복문을 활용했다. 여기서 많은 시간을 소요했는데 while문에 대한 이해가 부족했다.
    • while 반복문은 조건문이 참인 경우 내부의 수행 부분을 진행하고, 조건문이 거짓일 경우 while문을 빠져나간다.
    • new_id에서 '..' 개수를 세고 1개 이상 존재할 때 replace함수를 이용해 마침표('.') 하나로 변경해주었다.
# 4
    new_id = new_id.strip('.')

4단계) 마침표(.)가 처음이나 끝에 위치한다면 제거한다.

  • strip()을 이용해 문자열에서 특정 문자를 제거했다.
    • strip('특정 문자') : 문자열의 왼쪽과 오른쪽에서 특정 문자를 제거
    • lstrip('특정 문자') : 문자열의 왼쪽에서 특정 문자를 제거
    • rstrip('특정 문자') : 문자열의 오른쪽에서 특정 문자를 제거
  • 특정 문자를 지정하지 않으면 공백을 제거
# 5
    if len(new_id) == 0:
    	new_id = 'a'

5단계) 빈 문자열이라면, new_id에 "a"를 대입한다.

  • len() 함수로 new_id의 길이를 확인하여 문자열의 길이가 0일 경우 'a'를 지정해준다.
# 6
    elif len(new_id)>= 16:
        new_id = new_id[:15]
        if new_id[14]== '.':
            new_id = new_id.rstrip('.')

6단계) 길이가 16자 이상이면, new_id의 첫 15개 문자를 제외한 나머지 문자들을 모두 제거한다.
(※ 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거)

  • 위의 if문에 이어서 elif(else if)로 수행문을 작성했다.
  • new_id의 첫 15개 문자까지 슬라이싱했다.
  • 그 중 마지막 문자가 마침표(.)인 경우 rstrip()으로 오른쪽 끝의 마침표를 제거했다.
# 7
    if len(new_id) <= 2:
        while len(new_id) < 3:
            new_id = new_id + new_id[-1]

7단계) 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙인다.

  • while문으로 2자 이하인 문자열의 길이가 3이 될 때까지 마지막 문자를 붙여주었다. 문자열은 + 기호로 간단하게 합칠 수 있다.
  • 여기서 elif가 아닌 if로 #5,#6과 나누어 코드를 작성하였다. #6에서 길이 2자 이하로 아이디가 출력될 경우, elif로 조건문을 작성할 시 조건문을 빠져나와 #7의 규칙을 적용할 수 없게된다. 이와 같은 실수로 첫 코드 실행에서 입출력 예 #3 의 결과가 'aaa'가 아닌 'a'로 오답이 나왔다.

전체 코드는 다음과 같다.

def solution(new_id):

    # 1
    new_id = new_id.lower()
    
    # 2
    str_ = 'abcdefghijklmnopqrstuvwxyz0123456789-_.'
    new_id = ''.join(c for c in new_id if c in str_)
    
    # 3
    while new_id.count('..') >= 1:
        new_id = new_id.replace('..','.')
        
    # 4
    new_id = new_id.strip('.')
    
    # 5
    if len(new_id) == 0:
        new_id = 'a'
        
    # 6
    elif len(new_id)>= 16:
        new_id = new_id[:15]
        if new_id[14]== '.':
            new_id = new_id.rstrip('.')
            
    # 7
    if len(new_id) <= 2:
        while len(new_id) < 3:
            new_id = new_id + new_id[-1]
            
    answer = new_id
    
    return answer

고민보다는 모르는 함수가 많아서 찾아보느라 시간이 오래 걸렸던 문제.. 공부할 내용이 너무 많다....

다른 사람의 풀이 #1

import re

def solution(new_id):
    st = new_id
    st = st.lower() #1
    st = re.sub('[^a-z0-9\-_.]', '', st) #2
    st = re.sub('\.+', '.', st) #3
    st = re.sub('^[.]|[.]$', '', st) #4
    st = 'a' if len(st) == 0 else st[:15] #5
    st = re.sub('^[.]|[.]$', '', st) #6
    st = st if len(st) > 2 else st + "".join([st[-1] for i in range(3-len(st))]) #7
    return st

참고하세요!

  • re.sub( '찾을패턴' , '찾은 패턴을 변경할 내용' , '원본' )
  • ^ : 맨 앞에 사용될 경우, 해당 문자 패턴이 아닌 것과 매칭 #2
  • 마침표(.)가 한번 이상 반복된 부분을 '.'로 교체 #3
  • '.'으로 시작하거나 '.'으로 끝나는 부분을 공백으로 교체 #6

다른 사람의 풀이 #2

def solution(new_id):
    answer = ''
    # 1
    new_id = new_id.lower()
    # 2
    for c in new_id:
        if c.isalpha() or c.isdigit() or c in ['-', '_', '.']:
            answer += c
    # 3
    while '..' in answer:
        answer = answer.replace('..', '.')
    # 4
    if answer[0] == '.':
        answer = answer[1:] if len(answer) > 1 else '.'
    if answer[-1] == '.':
        answer = answer[:-1]
    # 5
    if answer == '':
        answer = 'a'
    # 6
    if len(answer) > 15:
        answer = answer[:15]
        if answer[-1] == '.':
            answer = answer[:-1]
    # 7
    while len(answer) < 3:
        answer += answer[-1]
    return answer

참고하세요!

  • isalpha : 알파벳인지 확인하기 #2
  • isdigit : 숫자인지 확인하기 #2
  • 문자열 구성 하나하나(c)가 조건을 만족하는지 확인하고 출력 #2

다른 사람의 풀이 #3

from re import sub

def solution(new_id):
    new_id = new_id.lower() #1
    new_id = sub("[^a-z0-9-_.]", "", new_id) #2
    new_id = sub("\.+", ".", new_id) #3
    new_id = sub("(^\.|\.$)", "", new_id) #4
    new_id = new_id if new_id else "a" #5
    new_id = sub("\.$", "", new_id[:15]) #6
    new_id = new_id if len(new_id) > 3 else new_id + new_id[-1] * (3 - len(new_id)) #7
    return new_id

참고하세요!

  • new_id가 없으면 a를 대입 #5

좋은 웹페이지 즐겨찾기