2021 카카오 블라인드 코딩 테스트 (신규 아이디 추천) with python
- 문제 설명
다음은 카카오 아이디의 규칙입니다.
- 아이디의 길이는 3자 이상 15자 이하여야 합니다.
- 아이디는 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.) 문자만 사용할 수 있습니다.
- 단, 마침표(.)는 처음과 끝에 사용할 수 없으며 또한 연속으로 사용할 수 없습니다.
"네오"는 다음과 같이 7단계의 순차적인 처리 과정을 통해 신규 유저가 입력한 아이디가 카카오 아이디 규칙에 맞는 지 검사하고 규칙에 맞지 않은 경우 규칙에 맞는 새로운 아이디를 추천해 주려고 합니다.
신규 유저가 입력한 아이디가 new_id 라고 한다면,
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다. 2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다. 3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다. 4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다. 5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다. 6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다. 만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다. 7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
- 문제 풀이
이 문제는 파이썬의 정규 표현식을 사용하면 매우 간단하게 끝낼 수 있는 문제이다
하지만 이를 모른다면,
import re
def solution(new_id):
# 대문자를 소문자로 치환
new_id=new_id.lower()
phase_2=['-','_','.']
# 알파벳 소문자, 숫자, 빼기, 밑줄, 마침표를 제거
for i,id in enumerate(new_id):
if id.isdigit()==True or id in phase_2 or ord('a')<=ord(id)<=ord('z'): # 숫자,뺴기 밑줄 마침표
continue
new_id=new_id.replace(id,"") # 이외의 문자들을 제거한다
# new_id=new_id.replace("..",".") # ..은 .으로 대체한다
# new_id=new_id.replace("..",".") # 혹시 모를 상황 대비
new_id=re.sub('\.{2,}','.',new_id) # .이 두 번 이상 반복되는 것을 . 하나로 대체
new_id=new_id.strip(".") # 문자열 양 끝에 있는 . 제거
# 문자열이 공백일 때
if new_id=="":
new_id="a"
# 문자열 길이가 16보다 클 때
if len(new_id)>=16:
new_id=new_id[:15]
# 문자열 길이 자르고 나서 앞뒤로 .을 제거해준다
new_id=new_id.strip(".")
if len(new_id)<=2:
while True:
if len(new_id)==3:
break
new_id+=new_id[-1]
return new_id
이와 같이 효율적이지 못하게 풀 수 밖에 없다
이를 파이썬의 정규표현식을 활용하여 풀어 보면, 아래와 같이 매우 간단하게 나오는 것을 알 수 있다
import re
def solution(new_id):
answer = ''
answer = new_id.lower()
answer = re.sub('[^a-z0-9\-\_\.]', '', answer)
answer = re.sub('\.{2,}', '.', answer)
answer = re.sub('^\.|\.$', '', answer)
answer = 'a' if answer == '' else answer
answer = answer[:15] if len(answer) > 15 else answer
answer = re.sub('\.$', '', answer)
while True:
if len(answer) > 2:
break
answer = answer + answer [-1]
return answer
- 정규 표현식 부분 정리
answer = re.sub('[^a-z0-9\-\_\.]', '', answer)
re.sub를 활용하여 알파벳은 a-z, 숫자는 0-9,-,_,.은 특수문자이다
따라서 \를 붙여 패턴을 만들고 제거가 아닌 남기는 것이므로 ^를 사용해준다
answer = re.sub('\.{2,}', '.', answer)
마침표가 2번 이상 연속된 부분을 하나의 마침표로 치환하기 위해
{n,m} -n번 이상 m번 이하 반복 옵션을 활용
answer = re.sub('^\.|\.$', '', answer)
처음과 끝에 존재하는 마침표를 제거하기 위해
시작을 나타내는 ^와 마지막을 나타내는 &를 활용
처음과 마지막을 동시에 표현하기 위해 or을 나타내는 |를 활용
answer = re.sub('\.$', '', answer)
마지막에 존재하는 .을 제거해주기 위해 $를 사용