문자열 해석 함수를 만들었는데 특정상황에 오류납니다.

DarKMinD의 이미지

일단 파일은 cpp형식입니다.
소스는

#include <string>
#include <iostream>

#include <stdio.h>
#include <stdlib.h>

#define BUFSIZE			5120
#define NAMESIZE		51

struct _parseData{
	int  type;
	char name[NAMESIZE];
	char color[7];
	char value[BUFSIZE];
}parseData;

// 함수
int strcpos(char fchr, const char *gchr);
int parseString(const char *data);

using namespace std;

// ---------------------------------------------- start
int main(void)
{
	int i;
	int len;
	int sult;

	string str;
	
	for(i = 0; i < 10; i++) {
		sult = 0;
		str = "N{000080}1{0}41{현제 채팅 클라의 최신 버전은 1.4.2입니다.}N{000080}1{0}41{http://iiasuraii.byus.net/file/Client.exe}N{000080}1{0}50{위의 주소에서 최신 버전을 다운 받으실 수 있습니다.}L{000000}3{eee}1{0}O{FF00FF}3{eee}39{eee님이 접속을 종료 하셨습니다. (PID 6)}";
		len = str.length();
//		cout << i << " ";
		do {
			sult += parseString(str.c_str()+sult);
//			cout << sult << " ";
//			fflush(stdout);
		} while(sult < len);
//		cout << endl;
	}

	return 0;
}

// ---------------------------------------------- 메세지 분석
int parseString(const char *data)
{
	int poslen;
	int result;
	int offset = 0;
	char sbuffer[7];

	// 메세지 형식
	parseData.type = *data;

	// 색상 추출
	offset += 2;
	strncpy(parseData.color, data+offset, 6);

	// 이름 길이
	offset += 7;
	poslen = strcpos('{', data+offset);
	strncpy(sbuffer, data+offset, poslen);
	sscanf(sbuffer, "%d", &result);

	// 이름 추출
	offset += poslen + 1;
	strncpy(parseData.name, data+offset, result);
	parseData.name[result] = '\0';

	// 본문 길이
	offset += result + 1;
	poslen = strcpos('{', data+offset);
	strncpy(sbuffer, data+offset, poslen);
	sscanf(sbuffer, "%d", &result);

	// 분문 추출
	offset += poslen + 1;
	strncpy(parseData.value, data+offset, result);
	parseData.value[result] = '\0';
	offset += result + 1;

	return offset;
}

// ---------------------------------------------- strpos
int strcpos(char fchr, const char *gchr)
{
	int i;
	int len = strlen(gchr);

	for(i = 0; i < len; i++) {
		if(*(gchr+i) == fchr) {
			return i;
		}
	}
	return -1;
}

위와 같습니다.
체팅 서버가 심심하면 종료되어 c에서 cpp로 처음부터 다시짜는중 문자열 해석 부분을 테스트 하는데 오류가 뜨더군요.
왜 그런가 알아보려고 주석처리된 cout, fflush부분을 추가해서 실행하니 오류가 않뜹니다.
컴파일러는 볼란드의 커멘드라인 컴파일러로 컴파일 해봤으며 리눅스의 g++도 마찬가지입니다.

오류가 날 이유가 왜 있는지 모르겠습니다 ;;
컴파일러 자체의 버그인가요? 볼란드의 커멘드라인 컴파일러나 리눅스의 g++나 마찬가지로 오류가뜨는거 보니..
컴파일러 자체의 문제는 아닐듯하고.. 코드에 이상이 있는건지 알려 주시면 감사하겠습니다 ;;

아. 그리고 저 위의 소스중 cpp의 iostream과 string로 충분히 가능한데 c문법으로 처리된것이 있으면 알려주시면 감사하겠습니다.
요즘 cpp의 라이브러리에 관심이 생겼지만 아직까진 미숙하여서요 ;;
특히나 문자열처리할떼 string로 변수 선언하면 포인터나 배열신경 않써도 되는것이 맘에 들더군요 ;;

아무튼 이 이상한 소스가 왜 주석을 지우면 잘 되고 주석달린곳에 다시 주석을 달면 오류가 나는지 알려주시면 감사하겠습니다.

lifthrasiir의 이미지

이런 종류의 문자열 파싱에는 sscanf가 왔따입니다. 아래 코드는 리눅스 상에서 g++로 테스트한 코드입니다.

#include <stdio.h>
#include <string.h>

// 문자열을 파싱해서 주어진 인자들에 파싱된 결과를 집어 넣고 다음 문자열의 시작점을 반환한다. (에러나 문자열의 끝이면 NULL 반환)
char *parseString(char *data, char& type, int& color, char *name, char *text) {
    int length, offset;

    // 이름 부분 직전까지 파싱한다. {까지 정확하게 파싱되면 offset에 그 다음 글자가 어느 위치에 있는 지 저장된다.
    offset = -1;
    if(sscanf(data, "%c{%06x}%d{%n", &type, &color, &length, &offset) < 3 || offset < 0) {
        return NULL;
    }

    // 지정된 길이만큼 문자열에서 name을 복사한다.
    *name = 0;
    strncat(name, data + offset, length);
    data += offset + length;

    // text 직전까지 파싱한다.
    offset = -1;
    if(sscanf(data, "}%d{%n", &length, &offset) < 1 || offset < 0) {
        return NULL;
    }

    // 지정된 길이만큼 문자열에서 text을 복사한다.
    *text = 0;
    strncat(text, data + offset, length);
    data += offset + length;

    // 각 부분의 마지막은 }로 끝나므로 }로 끝나지 않으면 오류 발생.
    if(*data++ != '}') {
        return NULL;
    }

    // 오류가 발생하지 않았으면 나머지 문자열을 반환한다.
    return data;
}

int main(void) {
    int color;
    char type, name[300], text[300];

    char str[] = "N{000080}1{0}41{현제 채팅 클라의 최신 버전은 1.4.2입니다.}N{000080}1{0}41{http://iiasuraii.byus.net/file/Client.exe}N{000080}1{0}50{위의 주소에서 최신 버전을 다운 받으실 수 있습니다.}L{000000}3{eee}1{0}O{FF00FF}3{eee}39{eee님이 접속을 종료 하셨습니다. (PID 6)}";
    char *ptr = str;

    while(ptr = parseString(ptr, type, color, name, text)) {
        printf("type: %c / color: %06X / name: %s / text: %s\n", type, color, name, text);
    }
    return 0;
}

- 토끼군

doldori의 이미지

fflush()는 C의 출력 스트림에 쓰는 것이지 cout에 쓰는 것이 아닙니다.
cout의 버퍼를 강제로 비우려면 cout << flush 를 쓰십시오.

_parseData 구조체의 멤버도 배열이 아니라 string으로 바꿔도 되겠습니다.
BUFSIZE가 5120이나 되니 손해보는 장사는 아닐 것입니다.

이 작업에는 Boost.Tokenizer가 딱이로군요. char_separator의 예제를 보시면
도움이 될 겁니다.

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.