DB에서 전체 주소 중 "XX동" 만 뽑아내는 알고리즘

gagurl의 이미지

고객테이블에서 주소 부분 중
전체 주소 중 "XX동" 만 뽑아내는 알고리즘이 있을까요?

예를 들어, 이런 주소가 있다면
' 서울시 강남구 서초동 123-11 4층 '
저는 여기서 서초동만 뽑아내고 싶습니다.

'동'으로 해서 뽑아내려 했지만,

이런 경우
'서울시 동대문구 신설동 123-12'
라고 한다면 정확하게 동만 뽑아 낼수가 없습니다.

어떻게 하면 전체 주소중 동부분만 뽑아낼까요?

꼭 답변주세요. 감사합니다.

neogeo의 이미지

몇가지 방법이 있겠습니다만 저장이 어떻게 되어있는지 전혀 알 수 없으므로,

1. 우체국 DB를 다운로드 받습니다 -> 동 이름이 모두 나열된 부분을 주시합니다. ( 동이름이 다른 컬럼으로 나눠진 DB를 꼭 받으세요. )
이제 각 우체국 DB에서 동이름을 뽑아서 사용자 주소에 match 시켜보고 일치하는게 있다면 뽑아줍니다.
-> 굉장히 느리지만 실존하는 동이름 기준이므로 아주 정확하게 뽑힐 수 있습니다. 단 사용자가 입력을 엉터리로 하거나 띄어쓰기를 남발했으면 -ㅅ-;; 할 수 없죠.

2. XX동으로 동이름이 끝난다는 가정하에 "%동 %" 으로 검색합니다. 이경우 동 대문구 라고 입력한 사용자나 아파트 이름에 동 이라는 글자와 띄어쓰기가
들어간경우 제법 문제가 되겠지요.

3. 우체국 DB에 한컬럼으로 주소가 몰아진 주소록 DB 가 있습니다. 자세히 보시면 동 이름은 꼭 3번째나 4번째 '단어'에 위치하게 되지요.
이를 이용하여 3,4,5번째 쯤 들어간 단어를 동으로 끝나는 경우로 잡아서 뽑으시면 어느정도 정확하면서 빠른 결과를 얻을 수 있겠지요

결국 사용자가 입력한 주소필드의 정확성이 문제인데 이때문에 대부분 웹폼은 사용자 주소를 꼭 우편번호 검색해서 강제로 앞자리를 고정시키곤 하죠.
잘 생각해보시면 좋은 방법이 떠오르실 겁니다. 상황을 먼저 잘 판단해보세요 :)

Neogeo - Future is Now.

Neogeo - Future is Now.

snowall의 이미지

고객 테이블에 우편번호를 받았다면 그냥 그 우편번호에 해당하는 동 이름을 찾으면 될 것 같습니다.

그게 없어서 이걸 만드시는 거라면...쓸데없는 도움말이 되겠군요....
--------------------------
snowall의 블로그입니다.
http://snowall.tistory.com

피할 수 있을때 즐겨라! http://melotopia.net/b

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.