글자추출관련질문입니다.

ky1031의 이미지

안녕하세요 저는 프로그램 초자 입니다 ^^;

다름이 아니라 한글과영어와숫자와특수문자가섞여있는 Stream을 받았을때
한글은 한글대로,영어는 영어대로, 숫자는 숫자대로, 특수 문자는 특수 문자대로 분리 해서 따로 저장 하고 싶습니다.
사용 언어는 C++ 인데요
어떻게 해야할지 막막하네요 ㅠㅠ

도와주세요
고수님들께 부탁 드립니다.

kang1의 이미지

영문코드 한글코드 특수문자 코드를 구분하여 다른 변수에 넣으면 되지 않을까요?

---

대한민국

JuEUS-U의 이미지

입력에 따라 다르겠지만 말이죠....
ASCII면 골치 아파지는거고, unicode면 그냥 범위로 잡아주면 됩니다.

hwiorb의 이미지

아스키라면 바이트 하나씩 읽어서, 8번째 비트에 값이 있다면, 아스키 값이 아니니,
일단, 한글이구요. 1바이트를 더 읽어서 한글로 저장합니다.
물론 8번째 비트에 값이 없으면, 그건, 아스키 문자이므로, 문자들을 함수를 사용해서
만드시면 됩니다. 잘찾아보시면, 문자에 따라 알파벳, 특수문자, 숫자 구분해주는
함수가 있습니다. 그걸로 판단해서 저장하시면 되겠네요.

nil.

cococo의 이미지

이거 저도 잘 몰라서 물어보는건데요.

예를들어 "1가" 라는 문자열이 있으면,
이게 3바이트인지 4바이트인지는 해당 문자열의 처음부터 봐야 되지 않나요?
그러니까... 문자열이 통채로 있다면(= 스트림 데이터의 처음 시작을 알 수 있다면 / 보관하고 있다면) 처음부터 계산해서 그게 1바이트짜리 문자인지 아닌지 알 수 있지만, 중간부터 보면 알 수 없지 않는가.... 하는게 제 한계였습니다만.

혹시

[ 아스키라면 바이트 하나씩 읽어서, 8번째 비트에 값이 있다면, 아스키 값이 아니니,
일단, 한글이구요. 1바이트를 더 읽어서 한글로 저장합니다.
물론 8번째 비트에 값이 없으면, 그건, 아스키 문자이므로, 문자들을 함수를 사용해서
만드시면 됩니다. 잘찾아보시면, 문자에 따라 알파벳, 특수문자, 숫자 구분해주는
함수가 있습니다. 그걸로 판단해서 저장하시면 되겠네요.]

로 위의 문제도 해결 가능한 건가요?

행복은 희생없이는 얻을 수 없는 것인가?
시대는 불행없이는 넘을 수 없는 것인가?

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.