코딩테스트 고득점 kit, 해시 - 전화번호 목록
문제설명
전화번호부에 적힌 전화번호 중, 한 번호가 다른 번호의 접두어인 경우가 있는지 확인하려 합니다.
전화번호가 다음과 같을 경우, 구조대 전화번호는 영석이의 전화번호의 접두사입니다.
- 구조대 : 119
- 박준영 : 97 674 223
- 지영석 : 11 9552 4421
전화번호부에 적힌 전화번호를 담은 배열 phone_book 이 solution 함수의 매개변수로 주어질 때, 어떤 번호가 다른 번호의 접두어인 경우가 있으면 false를 그렇지 않으면 true를 return 하도록 solution 함수를 작성해주세요.
제한 사항
- phone_book의 길이는 1 이상 1,000,000 이하입니다.
- 각 전화번호의 길이는 1 이상 20 이하입니다.
- 같은 전화번호가 중복해서 들어있지 않습니다.
입출력 예
입출력 예 설명
예제 #1 앞에서 설명한 예와 같습니다.
예제 #2 한 번호가 다른 번호의 접두사인 경우가 없으므로, 답은 true입니다.
예제 #3 첫 번째 전화번호, “12”가 두 번째 전화번호 “123”의 접두사입니다. 따라서 답은 false입니다.
이 문제의 key포인트
-> phone_book의 길이는 1 이상 1,000,000 이하입니다.
입력범위가 크기 때문에 효율성을 고려하여 알고리즘을 작성해야 한다.
자료구조 및 알고리즘: 해시
풀이
첫번째 풀이 (정확성: O, 효율성: TC 두 개 시간초과)
def solution(phone_book):
phone_book.sort(key=len)
lenth = len(phone_book)
for i in range(lenth) :
# startswith
for j in range(lenth):
if j == i:
continue
if phone_book[i] in phone_book[j]:
if phone_book[j].startswith(phone_book[i]):
return False
answer = True
return answer
특정 문자열로 시작하는지 확인하기 위해 startswith()를 사용하였다.
모든 문자열을 탐색하기 위해 이중 for문을 사용하였다.
※ phone_book의 길이가 최대 1,000,000이므로 이중 for문을 돌면 시간복잡도가 O(n^2)이 되므로 최악의 경우 1,000,000 X 1,000,000 = 1,000,000,000,000 번의 연산을 하므로 1초에 1억번의 연산을 한다고 생각하면 최악의 경우 10000초가 걸리는 알고리즘이다. 따라서 효율적이지 못한 알고리즘이 된다.
두번째 풀이 (정확성: O, 효율성: O)
def solution(phone_book):
phone_book.sort(key=len)
phone_book.sort()
lenth = len(phone_book)
for i in range(lenth - 1) :
if phone_book[i+1].startswith(phone_book[i]):
return False
return True
어떤식으로 만들어야할 지 몰라서 질문하기에서 얻은 tip!
이 문제에서 for 문을 두 번 사용하면 dictionary 자료형을 사용해도 효율성을 통과하기 어렵습니다.
이 때, for 문을 한 번만 사용하기 위해서는 phone_number 리스트의 정렬이 필요합니다.
phonenumber 리스트를 값과 길이 두 가지 기준으로 정렬 하면, 반복문을 돌며 phonenumber[index] 가 phone_number[index+1]의 접두어 인지만 확인해주면 효율성 통과가 가능합니다.
phone_book을 문자열 길이로 먼저 정렬한 뒤 value값을 기준으로 정렬하면 for문을 한번만 돌리면서 그 다음 인덱스의 값이 현재 값으로 시작되는지만 확인하면 된다. 1, 2/ 2, 3/ 3, 4/ 이런식으로 탐색해가면 빠르게 탐색할 수 있다.