[완료]리스트내에 가변노드 알고리즘에 대해..조언좀

billiken의 이미지

데이타 변환 프로그램을 하고 있는데 기존에는 데이타 폼이 일정하게 되어있는 것이라 무리가 없었는데
이번엔 데이타가 가변이 됩니다..
어떤 방법으로 데이타를 가공을 해야할것인지 많이 헤메고 있습니다..

데이타 포맷은
입력
==========================================
LIST_NAME - NODE_위치 - 위치에 따라 object 가 포함되는 데이타
------------------------------------------
LIST1 - NODE1_xy1
[공백..]NODE2_xy2
[공백..]NODE3_xy3
[공백..]object_xy1

LIST2 - NODE1_xy1
[공백..]NODE2_xy2
[공백..]object_xy1

LIST3 - NODE1_xy1
[공백..]NODE2_xy2
[공백..]NODE3_xy3
[공백..]NODE4_xy4
[공백..]NODE5_xy5
[공백..]object_xy1
[공백..]object_xy2
[공백..]object_xy5
------------------------------------------
변환데이타포맷
------------------------------------------
LIST1
NODE1_xy1 object_xy1
NODE2_xy2
NODE3_xy3
LIST2
NODE1_xy1 object_xy1
NODE2_xy2
LIST3
NODE1_xy1 object_xy1
NODE2_xy2 object_xy2
NODE3_xy3
NODE4_xy4
NODE5_xy5 object_xy5
------------------------------------------
변환데이타 포맷으로 변경을 하려고 합니다..
NODE가 가변데이타라 1개 이상이고 object 는 없을수도 있습니다..
생각날때마다 고민하고 있는데 몇달째 진전이 없네요..

어떤방법으로 노드정리를 하면 좋을까요..아이디어나 조언 부탁드립니다..

raymundo의 이미지

그러니까... 결국 텍스트 데이타를 읽어서 다른 형태로 출력하고 싶으신 거잖아요, 리스트나 가변노드 이런 건 데이타가 나타내는 의미이니까 사실 중요한 게 아니고...

한 단락(하나의 리스트에 해당하는)씩 읽고 처리하는 형태로 짜 보았습니다.

리스트,노드,오브젝트의 이름들이 본문처럼 단순하진 않을 것 같아서 따로 앞쪽에 패턴을 변수로 만들어뒀으니까, 거기만 적절히 고치시면 웬만하면 될 것 같습니다.

#!/usr/bin/env perl
use strict;
use warnings;
 
# 정규식 패턴
# (\w+) 부분이 위치에 매치
my $pat_list = qr/LIST\d+/;
my $pat_node = qr/NODE\d+_(\w+)/;
my $pat_object = qr/object_(\w+)/;
 
my ( $list_name, @node_list, %node_to_loc, %loc_to_object) = ( '' );
while ( my $line = <> ) {
    chomp $line;
 
    if ( $line =~ /^($pat_list) - ($pat_node)/ ) {
        print_current_list();       # 새 리스트가 시작될 때마다 그 전까지 읽은 부분을 출력
        $list_name = $1;
        @node_list = ( $2 );
        %node_to_loc = ( $2 => $3 );
        %loc_to_object = ();
    }
    elsif ( $line =~ /^\s+($pat_node)/ ) {
        push @node_list, $1;
        $node_to_loc{$1} = $2;
    }
    elsif ( $line =~ /^\s+($pat_object)/ ) {
        $loc_to_object{$2} = $1;
    }
}
print_current_list();
 
sub print_current_list {
    return if $list_name eq '';
 
    print $list_name, "\n";
    foreach my $node ( @node_list ) {
        print $node;
 
        if ( exists $loc_to_object{ $node_to_loc{$node} } ) {
            print " ", $loc_to_object{ $node_to_loc{$node} };
        }
 
        print "\n";
    }
}

$ ./conv.pl input.txt
LIST1
NODE1_xy1 object_xy1
NODE2_xy2
NODE3_xy3
LIST2
NODE1_xy1 object_xy1
NODE2_xy2
LIST3
NODE1_xy1 object_xy1
NODE2_xy2 object_xy2
NODE3_xy3
NODE4_xy4
NODE5_xy5 object_xy5

좋은 하루 되세요!

billiken의 이미지

이방법은 생각을 못하고 그냥 전체를 읽으면서 한번에 만들생각만 하고 있었네요..
이렇게 되면 LIST 마다 읽어서 정리를 하여 그것을 모아놓으면 편리하겟네요..

역시 다양한 방법으로 접근을 해야 하는데..
기존에 하던방법대로 무작정 풀려고만 했더니 계속 헤매고있었네요..

많이 답답했었는데 다른 눈을 띄워주셔서
감사합니다..

즐거운 하루 되시고..행복하세요..

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.