코딩테스트 준비

2021 카카오 블라인드 코딩 테스트 (신규 아이디 추천) with python

Grey Kang 2021. 3. 16. 20:09
반응형
  • 문제 설명

다음은 카카오 아이디의 규칙입니다.

  • 아이디의 길이는 3자 이상 15자 이하여야 합니다.
  • 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
  • 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.

"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,

 

1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다. 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다. 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다. 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다. 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다. 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다. 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.

 

  • 문제 풀이

이 문제는 파이썬의 정규 표현식을 사용하면 매우 간단하게 끝낼 수 있는 문제이다

하지만 이를 모른다면,

import re
def solution(new_id):
    # 대문자를 소문자로 치환
    new_id=new_id.lower()
    phase_2=['-','_','.']

    # 알파벳 소문자, 숫자, 빼기, 밑줄, 마침표를 제거
    for i,id in enumerate(new_id):
        if id.isdigit()==True or id in phase_2 or ord('a')<=ord(id)<=ord('z'): # 숫자,뺴기 밑줄 마침표
            continue
        new_id=new_id.replace(id,"") # 이외의 문자들을 제거한다
        # new_id=new_id.replace("..",".") # ..은 .으로 대체한다
    # new_id=new_id.replace("..",".") # 혹시 모를 상황 대비
    new_id=re.sub('\.{2,}','.',new_id) # .이 두 번 이상 반복되는 것을 . 하나로 대체
    new_id=new_id.strip(".") # 문자열 양 끝에 있는 . 제거

    # 문자열이 공백일 때
    if new_id=="":
        new_id="a"
    # 문자열 길이가 16보다 클 때
    if len(new_id)>=16:
        new_id=new_id[:15]
    # 문자열 길이 자르고 나서 앞뒤로 .을 제거해준다
    new_id=new_id.strip(".")
    if len(new_id)<=2:
        while True:
            if len(new_id)==3:
                break
            new_id+=new_id[-1]

    return new_id

 

이와 같이 효율적이지 못하게 풀 수 밖에 없다

 

이를 파이썬의 정규표현식을 활용하여 풀어 보면, 아래와 같이 매우 간단하게 나오는 것을 알 수 있다

import re 
def solution(new_id): 
    answer = '' 
    answer = new_id.lower() 
    answer = re.sub('[^a-z0-9\-\_\.]', '', answer) 
    answer = re.sub('\.{2,}', '.', answer) 
    answer = re.sub('^\.|\.$', '', answer) 
    answer = 'a' if answer == '' else answer 
    answer = answer[:15] if len(answer) > 15 else answer 
    answer = re.sub('\.$', '', answer) 
    while True: 
        if len(answer) > 2: 
            break 
    answer = answer + answer [-1] 
    return answer
  • 정규 표현식 부분 정리
answer = re.sub('[^a-z0-9\-\_\.]', '', answer)

re.sub를 활용하여 알파벳은 a-z, 숫자는 0-9,-,_,.은 특수문자이다

따라서 \를 붙여 패턴을 만들고 제거가 아닌 남기는 것이므로 ^를 사용해준다

 

answer = re.sub('\.{2,}', '.', answer)

마침표가 2번 이상 연속된 부분을 하나의 마침표로 치환하기 위해 

{n,m} -n번 이상 m번 이하 반복 옵션을 활용

 

answer = re.sub('^\.|\.$', '', answer)

처음과 끝에 존재하는 마침표를 제거하기 위해

시작을 나타내는 ^와 마지막을 나타내는 &를 활용

처음과 마지막을 동시에 표현하기 위해 or을 나타내는 |를 활용

 

answer = re.sub('\.$', '', answer)

마지막에 존재하는 .을 제거해주기 위해 $를 사용

 

반응형