txt 파일에서 특정 패턴을 가진 숫자를 추출하는 방법

choroot의 이미지

UNIX시스템에서 VI편집기로 프로그램을 하고 있습니다.

프로그램을 돌린 결과는 txt파일로 나오며, 다양한 정보를 담고 있습니다.

그 중 제가 원하는 정보는 1234E-10 과 같은 패턴을 가지고 있습니다.

이 정보의 윗줄과 아랫줄 그리고 오른쪽에는 필요없는 정보들이 있어서,

제가 원하는 값 1234E-10만을 얻기 위해서는 지루한 편집 작업을 해야합니다.

이러한 작업을 편리하게 하기 위해서는 어떤 언어의 어떤 기능을 이용하면 편할까요?

이웅희의 이미지

python으로 파일 읽어서
한줄씩 받아서 find로 찾으면 되겠네요

samsee의 이미지

정규표현식과 한 줄의 명령(sed 혹은 egrep 등)으로 원하시는 작업을 하실 수 있을 겁니다.
아래는 kldp 에 있는 sed awk 입문서 입니다.
sed와awk
대략 아래처럼 하면 됩니다. 쉘에서..

sed -n '/1234E-10/p' 파일명

이렇게 하시면 1234E-10이 들어있는 줄만 나옵니다.

오른쪽에 있는 걸 지우시려면. 백 레퍼런스를 사용하는게 편할 것 같습니다.
자세한건 정규표현식과 백 레퍼런스를 찾아보세요 :)

조금이라도 도움이 되셨길.

embesys의 이미지

전제1. 첫번째로 1234E-10 과 같은 패턴이라 함은 4557E-8 5000E-12 같은 값만 필요하단 말로 들립니다.
전제2. 그리고 구한 값들은 모두 첫번째 열에 있고 그 뒤에 있는 값들을 무시하고 싶다라고 가정합니다.

위의 제 전제가 맞다고 하시면 아래 스크립트를 사용하시면 간단하게 출력됩니다.

$ cat 123.txt ; 파일 123.txt의 내용이 아래와 같음
hello
1234E-10 hi everyone
3000E-10 welcom to my home
bye

$ grep ^[1-9][0-9][0-9][0-9]E- 123.txt | awk '{print $1}'
1234E-10
3000E-10

- A wise man builds his house on the rock

- A wise man builds his house on the rock

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.