소셜 앱을 하나 만들고 있는데요, 연락처와 관련된 작업이 많습니다.
핸드폰에 있는 연락처를 받아와서 성과 이름을 추출하고, 유저가 마지막단계에 직접 추출 결과를 확인하면서 잘못된 부분 정정하는 식으로 만들려고 합니다.
그런데 문제는 성과 이름을 추출하는 방법인데요
아시다시피 핸드폰 연락처 데이터는 성, 이름, 경칭, 중간이름, 호칭, 닉네임, 휴대폰번호, 이메일 ...... 이런식으로 필드가 다 구분되어 있습니다.
근데 문제는 사람들이 이렇게 구분된 필드에 딱딱 정확하게 그 데이터만 넣는게 아니라서 문제가 발생하는데요.
당장 저만해도, 제 연락처에는 성 이름이 ( 슬래쉬 / 가 필드 구분자입니다)
홍/길동
처럼 성 이름이 필드에 맞게 구분 되어있는것과
/홍길동
처럼 그냥 이름 필드에 성 이름을 같이 넣어놓은게 섞여있고요