스레드가 나을까요 for loop이 나을까요?

daniel00의 이미지

매번 좋은 정보들을 얻어가기만 했는데 이번에도 역시나 도움을 구해봅니다.

제가 요즘 C#으로 네트워크 서버 프로그램을 작성중에 있습니다.
서버는 PC이며, 클라이언트는 계측기이고 약20대 정도가 하나의 PC에 연결되어 있습니다.
각 계측기는 100채널의 측정데이터를 송신합니다.
각 계측기는 약 1K bytes 정도의 데이터를 20ms 주기로 PC에 송신합니다.

C#으로 작성한 소켓서버에서는 계측기별 데이터를 처리하는 별도의 스레드 20개가 돌면서 데이터를 처리합니다.
데이터 처리는 계측기별 데이터 모니터링 그리드에 출력하는 일을 하거나 CSV로 쌓거나 하는 일들을 수행합니다.
서버프로그램의 데이터처리 플로우를 요약하면 다음과 같습니다.

-소켓을 통해 계측기가 송신하는 데이터를 수신
-계측기의 개수만큼 스레드가 동작
-수신한데이터를 각 스레드의 큐에 저장
- 각 스레드는 계측기별 큐를 읽어서 데이터 처리

근데...
계측기를 2~3개 까지 연결할때는 별 문제가 없었는데 7~8개를 연결하니 소켓데이터를 수신하여 저장하는 큐가 밀려서 쌓이기 시작하는 현상이 발생하고 있습니다. 이때 CPU 점유율이 거의 90퍼센트에 다다르고 있습니다.
스레드 컨텍스트 스위칭때문에 발생하는 건지 아니면 데이터처리 컨셉자체에 문제가 있는건지 잘 해결이 되지 않고 있습니다.

계측기별로 스레드를 20개 만들지말고, 그냥 루프에서 20(계측기수)*100(채널수) 만큼 처리하는게 나을까요?
이런류의 데이터처리를 자주하는데 늘 주먹구구식으로 처리해온것 같아서 여러분들께 조언을 구해봅니다.
읽어주셔서 감사합니다.

jick의 이미지

쓰레드 하나 하나는 데이터를 읽어서 처리하고 다음 데이터가 있을 때까지 sleep하는 거 맞죠? 괜히 무한루프 같은 거 돌면서 "계속 읽을 데이터가 있나 확인"하는 거 아니죠?

일단 그렇다는 가정 하에... 계측기가 20개라고 해도 초당 1MB면 요즘 PC로 처리하기에 무리가 없어야 할 것 같은데... CPU profiler 같은 거 돌려서 정확히 코드의 어느 부분이 시간을 잡아먹나 확인해 보세요. "왜 느린지"를 파악 못한 상태에서 프로그램 구조를 바꿔 봤자 눈가리고 총쏘는 격입니다.

라스코니의 이미지

쓰레드 10 ~ 20개는 많아 보이지 않습니다. 처리 과정에서 과도한 루프를 돌거나 하는 것이 있다면 그런 현상이 발생할 수도 있습니다. 아니면 데이터 처리에 진짜로 많은 프로세싱 파워를 요구하는 걸 수도 있구요.

그리고 언뜻 보기에 계측기별로 쓰레드를 만들 필요는 없어 보입니다. 한 쓰레드에서 수신하고 다른 쓰레드에서 그 데이터를 받아 모든 계측기 데이터를 처리하면 될 것으로 보입니다.

계측기 X 채널수 해서 총 2000 채널을 관리해야 하는 것인가 보네요. 2000 루프라면 그 각각 연산의 부하에 따라서 하나의 CPU 코어가 감당하기엔 좀 버거운 작업일 수도 있습니다. 그렇다면 차라리 쓰레드 묶음으로 만들고 CPU Affinity 를 사용하여 CPU core 별로 일을 분산시키는 것이 좋을 수도 있습니다(계측기 1 ~ 5번 CPU0에 할당 등).

먼저 perf (linux)와 같은 프로파일러 기능을 사용해서 어떤 함수에서 대부분의 시간이 소요되는지 확인하시는 것이 중요합니다.

라스코니의 이미지

제가 착각을 한게 있네요. 20대의 계측기가 모두 한 PC에 데이터를 전송하는 경우이네요.
여러가지 방법이 있겠지만 저는 보통 이렇게 합니다.

각 계측기마다 thread 생성

각 쓰레드 {
  open socket;
 
  while (1) {
      delay 1 ms; // 거진 필요없지만 만약을 위해서. 나중에 없이도 잘 돌아가면 제거
      read socket data, non-blocking;
      버퍼에 저장 put_buffer();
 
      충분한 데이터가 모였는가? get_buffer_length()
      아니면 continue;
 
      충분한 데이터가 모였는가? get_buffer_data(N count);
  }
 
}

non-blocking 상태에서 read(socket) 함수를 실행하는 오버헤드는 매우 작습니다. 따라서 각 채널당 연산 부하만 크지 않다면 문제가 없을 것으로 보이고 CPU affinity로 CPU 코어에 일을 분산해 준다면 더 좋겠죠.

문제는 buffer 유틸리티 기능이 매우 좋아야 하는데.... put, get, get_length 기능이 성능이 좋으면서도 효율적으로 작성된 것이 있어야 합니다. 오픈 소스 잘 뒤져 보세요. 이런 구조로 100 Mbps도 처리할 수 있으니 구조적인 걱정은 안하셔도 됩니다.

daniel00의 이미지

친철하고 상세하게 조언해주셔서 감사합니다.
조언중에 궁금한게 있는데요, delay는 안주면 cpu 점유율이 많이 올라가지 않을까요? 잘 돌아가면 제가라고 하셔서요...
그리고, non-blocking로 처리하시 특별한 이유가 있으신지요? blocking일 경우 데이터가 발생할때까지 스레드를 멈추어 주어서 cpu효율에 더 도움이 되지 않을까 하는 생각이 들어서요.
여튼 여러가지로 네트워크는 어려운것 같습니다^^
읽어주셔서 감사합니다

라스코니의 이미지

delay를 주게 되면 자동으로 OS 커널이 다른 쓰레드에 CPU를 할당하기 때문에 보통 halt 현상을 방지하기 위해서 넣곤 합니다. 하지만 유저 레벨 쓰레드는 스케줄러에서 자동으로 관리해 주기 때문에 굳이 delay를 넣지 않아도 되는 경우가 있습니다.

저는 non-block()이 관리하기가 편하더라구요. delay() + read(non-blocking) 조합이면 매끄럽게 돌릴수 있습니다.

한가지 추가로,

만약 채널 데이터 처리가 많이 걸린다면,

채널 데이터 접수 쓰레드 (20개) + 채널 데이터 쓰레드 (1 ~ 4개) 구성도 좋습니다. 문제는 자유롭게 데이터를 넣고 뺄수 있는 버퍼 유틸리티가 있어야 합니다.

daniel00의 이미지

버퍼 유틸리티를 꼭 찾아봐야겠네요. delay도 다시 한번 테스트 해보겠습니다.
감사합니다!^^

익명입니다의 이미지

댓글 달기

Filtered HTML

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

BBCode

  • 텍스트에 BBCode 태그를 사용할 수 있습니다. URL은 자동으로 링크 됩니다.
  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param>
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.

Textile

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • You can use Textile markup to format text.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Markdown

  • 다음 태그를 이용하여 소스 코드 구문 강조를 할 수 있습니다: <code>, <blockcode>, <apache>, <applescript>, <autoconf>, <awk>, <bash>, <c>, <cpp>, <css>, <diff>, <drupal5>, <drupal6>, <gdb>, <html>, <html5>, <java>, <javascript>, <ldif>, <lua>, <make>, <mysql>, <perl>, <perl6>, <php>, <pgsql>, <proftpd>, <python>, <reg>, <spec>, <ruby>. 지원하는 태그 형식: <foo>, [foo].
  • Quick Tips:
    • Two or more spaces at a line's end = Line break
    • Double returns = Paragraph
    • *Single asterisks* or _single underscores_ = Emphasis
    • **Double** or __double__ = Strong
    • This is [a link](http://the.link.example.com "The optional title text")
    For complete details on the Markdown syntax, see the Markdown documentation and Markdown Extra documentation for tables, footnotes, and more.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 사용할 수 있는 HTML 태그: <p><div><span><br><a><em><strong><del><ins><b><i><u><s><pre><code><cite><blockquote><ul><ol><li><dl><dt><dd><table><tr><td><th><thead><tbody><h1><h2><h3><h4><h5><h6><img><embed><object><param><hr>

Plain text

  • HTML 태그를 사용할 수 없습니다.
  • web 주소와/이메일 주소를 클릭할 수 있는 링크로 자동으로 바꿉니다.
  • 줄과 단락은 자동으로 분리됩니다.
댓글 첨부 파일
이 댓글에 이미지나 파일을 업로드 합니다.
파일 크기는 8 MB보다 작아야 합니다.
허용할 파일 형식: txt pdf doc xls gif jpg jpeg mp3 png rar zip.
CAPTCHA
이것은 자동으로 스팸을 올리는 것을 막기 위해서 제공됩니다.