작은 REGULAR EXPRESSION 라이브 러리를 구현하고 싶은데요.

puaxx의 이미지

작은 REGULAR EXPRESSION 라이브 러리를 구현하고 싶은데요.

혹시 관련 자료 찾을수 있는데 없을까요? 핵심 개념이 정리된...

아니면 이것도 표준이 있나요?

gnu regex 나 pcre 라이브 러리는 너무 커가지고 분석하기도 머리아프구....

작은거 구현된거 어디 없을지..

juneaftn의 이미지

DDJ 99년 4월호인가를 보세요.

브라이언 커니건이랑 랍 파이크가 간단한(30여줄) REE를 구현한 기사가 있습니다.

lifthrasiir의 이미지

juneaftn wrote:
DDJ 99년 4월호인가를 보세요.

브라이언 커니건이랑 랍 파이크가 간단한(30여줄) REE를 구현한 기사가 있습니다.

웹에는 http://www.ddj.com/documents/s=904/ddj9904a/에 있습니다. 등록해야 볼 수 있군요. (Basic Membership으로 가입하면 공짜로 6개월동안 사용할 수 있는 모양입니다)

- 토끼군

marten의 이미지

regular expression 처리 엔진을 만든 적이 있습니다.
RE처리는 크게 DFA, NFA 방식이 있습니다.
그렇기 때문에 DFA, NFA 등의 automata에 익숙해져야 합니다.

저는 알고리즘이 깔끔한 DFA 방식으로 구현했는데,
Aho가 쓴 컴파일러 책에서 관련된 이론적 지식을 얻으면 되고,
실제 코딩은 GNU grep을 참고하시면 됩니다.

오라일리에서 나온 regular expression 책도 도움이 많이 됩니다.

익명 사용자의 이미지

Kernighan과 Pike의 책 "The Practice of Programming"에도 간략한 구현이 나옵니다. 아마도 DDJ의 기사와 비슷하겠죠.

puaxx의 이미지

marten wrote:
regular expression 처리 엔진을 만든 적이 있습니다.
RE처리는 크게 DFA, NFA 방식이 있습니다.
그렇기 때문에 DFA, NFA 등의 automata에 익숙해져야 합니다.

저는 알고리즘이 깔끔한 DFA 방식으로 구현했는데,
Aho가 쓴 컴파일러 책에서 관련된 이론적 지식을 얻으면 되고,
실제 코딩은 GNU grep을 참고하시면 됩니다.

오라일리에서 나온 regular expression 책도 도움이 많이 됩니다.

지금 아주 기초적인 수준의 regular expression 데모를 만들었는데요...커....이게 DFA,NFA에 부합하는지는 알수가 없네요 --;;

지금 지원하는 심볼은 고작 두개 . 하고 * 이거네요...
아직도 처리해야될 정규표현식 심볼들이 많네요 --;;; 복잡합니다..머리속이...

가능하다면 정보를 공유하고 싶네요 ㅜㅜ

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.