[정규식 질문] 'Text1''Text2''' 에서 Text1''Text2'' 를 추출하고 싶습니다.

sitan81의 이미지

정규식을 써서

'Text1''Text2''' 에서 Text1''Text2'' 를 추출하고 싶습니다.

'(['{2}]*)

'([^']*)
등을 시도해 보았으나 중간에 있는 '' ( 작은 따옴표 2개 입니다. ) 을 포함시키지 못하네요

'' 은 항상 연속으로 표시됩니다.

고수님들의 조언 부탁드립니다.

감사합니다.

dontdieych의 이미지

➜ ~ cat test
'Text1''Text2'''
➜ ~ sed -rn "s/'(.*)'/\1/p" test
Text1''Text2''

원하시는 건 이게 아닌 것 같은데 어떤 조건을 만족해야 하는지 확실히 짐작이 안되네요.

sitan81의 이미지

질문의 설명이 너무 부족하였네요

'Text1''Text2''', 'Text3', 'Text4''Text5'''

와 같이 있을때

group 1
Text1''Text2''

group 2
Text3

group 3
Text4''Text5''

와같이 추출하고자 합니다.

dontdieych의 이미지

콤마로 구분해서 먼저 나누시고 그 다음에 다시 따옴표를 제거 하는 쪽으로 생각해 보세요.

csv 형식으로 된 자료 같은데 기존에 있는 유틸리티나 라이브러리를 사용하시는 것이 좋겠습니다.

sitan81의 이미지

답변 감사드립니다!

질문이 정말 모자란 부분이 많았네요

답변 해주셔서 감사드립니다!

klyx의 이미지

규칙을 모르겠네요. 그냥 맨앞이랑 맨뒤의 '를 하나씩 떼어내면 되는건가요?

jick의 이미지

'(([^']|'')*)' ?

sitan81의 이미지

'Text1''Text,2''', 'Text3', 'Text,,4''Text5'''

와 같이 있을때

Match 1
1. Text1''Text,2''
2. ''
Match 2
1. Text3
2. 3
Match 3
1. Text,,4''Text5''
2. ''

와 같이 정확히 추출되네요!!

답변은 물론이거니와 정규식 이해에 많은 도움이 되었습니다.

정말정말 감사드립니다!!

sitan81의 이미지

정규식 마지막에

작성해주신 정규식마지막에
'(([^']|'')*)' ?

'[공백]?

처럼 끝내셨는데

'(([^']|'')*)'
로만 작성해도 완벽히 추출이 이루어 지는것을 확인했습니다.

공백 + ? 로 끝내신 다른 이유가 있는지 궁금합니다.

감사합니다.

jick의 이미지

아 그건 그냥 물음표였어요. "원하시는 게 이건가요?" 하는...

sitan81의 이미지

착각했군요
답변 감사드립니다!

dontdieych의 이미지

물음표의 원래 의미 같은데요.

"이걸로 되지 않을까요?"

sitan81의 이미지

저만 눈치 못챘네요.. ㅎㅎ

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.