초성체 제거 정규표현식을 구현해보려고 합니다.

center의 이미지

우선은 아주 간단하게다음과 같이 정규표현식을 구현해 봤습니다.
보시다시피 ㅋ,ㅎ에 해당하는 초성체만 제거하는 프로그램입니다.
(밑에 스크린샷을 첨부하였습니다.)

만약 초성 전체 ㄱ~ㅎ를 저런식으로 패턴매칭을 시킨다음에
예외 문자열로 "ㄱ- " <-- ㄱ에 - 로 구성된 문자열입니다.
이것은 자동치환을 방지할려면 어떻게 해야 할까요?

즉 정규식은 다음과 같이 설정하고
([ㄱ*])
여기에서 "ㄱ-" 이 문자열에 대해서 는 '예외상황'으로 간주
치환하지 않고 그대로 "ㄱ- "이렇게 출력하는 방법을 알고
싶습니다.

지금 생각하고 있는 꽁수로는
1) 치환하기전 먼저 "ㄱ-"를 검색해서 특수 문자열(F1)로 치환시킨후

2)위의 정규식대로 초성체를 박멸정규식을 돌려 초성체를 없앤후

3) 예외상황으로 분류된 "ㄱ-" 을 F1 -> "ㄱ-"로 다시금
바꿔주는 방법정도 생각하고 있습니다.
헌데 이것도 예외상황이 1개면 괜찮을듯 한데..예외상황이
여러개가 되면 처리가 복잡해질지도 모르겠군요..

이에따른 조언좀 부탁드리겠습니다.

File attachments: 
첨부파일 크기
Image icon chosung1.jpg155.8 KB
Image icon chosung2.jpg146.5 KB
송효진의 이미지

callback 함수 써야 할것 같네요.
잡는 정규식은 pcre 로 /[ㄱ-ㅎ]+/u 이렇게 하면 쉽고요.

저 EmEditor 윈도용 맞나요? :shock:

center의 이미지

송효진 wrote:
callback 함수 써야 할것 같네요.

잡는 정규식은 pcre 로 /[ㄱ-ㅎ]+/u 이렇게 하면 쉽고요.

저 EmEditor 윈도용 맞나요? :shock:

아아..아직 그정도 깊이까지는 정규표현식에 대해서 잘
모르겠는데..그정도까지나 가야 하는군요...^^;

아참 저 화면은 윈도우용 EmEditor 맞습니다.
윈도XP에 StyleXP테마라는 프로그램사용중
AQUA테마라는걸 입혀서 MacOS틱하게 보이는것이라지요.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.