Question> Pasing....

maidland의 이미지

안녕하세요.. 오랜만에 들른 초보 리눅이 입니다..

다름이 아니라.. 파싱에 대한 질문입니다..

strtok함수를 사용해 임의로 지정해준 것대로 자기가 원하는 대로 짜를수 있는데요..

문제는 텍스트 파일안에 있는 내용을 파싱하려는데요..

정리하자면, text파일을 읽어와서 그 안의 내용을 자기가 원하는 대로 파싱해서..

구조체로 지정해준 변수와 비교할려는게 목표입니다...

그냥 파싱과 비교까진 해결하였지만 파일로 읽어와서 그 안의 내용을 파싱하는게..

잘안돼더군요...

#include <string.h> 
int main()
{
	size_t n;
	char *tr;

	// 토큰으로 분리할 문자  
	char string[] = "hello\tyundream\thohoho,ok";

	// 토큰 \t 와 , 를 설정하였다. 
	// strtok 로 구분시 \t와 , 로 구분할것이다. 
	char seps[] = "\t,";

	// llo 를 되돌려줄것이다. 
	tr = memchr("hello", 'l', 10);
	printf("%s\n", tr);

	// lohz 에서 loh 는 hello 에 있는 초기 문자열이므로
	// 3을 돌려주게 될것이다. 
	n = strspn("lohz", "hello");
	printf("%d\n", n);

	// kklkd 에서 kk 까지가 hello 에 없는 초기 문자열이름
	// 이므로 2를 돌려주게 될것이다. 
	n = strcspn("kklkd", "hello");
	printf("%d\n", n);

	// kkndel 에서 'e' 가 "hello" 의 문자들중 가장먼저 
	// 일치가 되므로 'e' 가발견된 포인트를 되돌려주므로
	// el 을 넘겨줄것이다. 
	tr = strpbrk("kkndel", "hello");
	printf("%s\n", tr);

	// llo 를 돌려준다.
	tr = strchr("hello", 'l');
	printf("%s\n", tr);

	// 뒤에서 부터 일치되는 문자를 찾게됨으로 
	// lo 를 돌려주게 된다. 
	tr = strrchr("hello", 'l');
	printf("%s\n", tr);

	// llo 를 되돌려준다.
	tr = strstr("hello", "ll");
	printf("%s\n", tr);

	// 토큰 '\t'와 ','로 구분하므로 
	// "yundream" "hohoho" "ok" 3개의 
	// 문자열을 되돌려줄것이다. 
	tr = strtok(string, seps);
	while (tr != NULL)
	{
		printf("%s\n", tr);
		tr = strtok(NULL, seps);
	}

}

이것이 파싱에 대한 기본 방식입니다.. 파일 오픈해서 파싱을 할 수 있게끔..

많은 조언 부탁드립니다...

mach의 이미지

*참고*
파싱이라고 하기에는 좀 묘하군요. 적어도 토큰들간의 문법적 관계(순서)등을 고려하는 부분이 들어가야 파싱이라 할 수 있습니다.
이 경우에는 패턴검색이라는 말이 더 어울리는듯 합니다.

lex를 사용해보심은 어떨지? 아니면 간단한 토큰생성기를 짜보시던가요.

------------------ P.S. --------------
지식은 오픈해서 검증받아야 산지식이된다고 동네 아저씨가 그러더라.

maidland의 이미지

답변에 감사드립니다..

이건 그냥 예를 들어 본것일 뿐입니다 :wink:

제가 짜고자 하는건 IDS의 정책부분.. 즉 룰부분입니다...

룰부분을 텍스트로 미리 지정해놓고 불러와서 파싱해서 패킷 캡쳐한 것과

비교하는것이죠...

여튼 감사드립니다^^

:roll:

>> http://ragnarok.co.kr <<

라그온+ㅁ+ 댄서는 아직 죽지 않았다!!
=-=-=-=-=-=-=-=-=-=-=-

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.