Here's a quick test to see if a file or string contains text or is binary. The difference between text and binary is ill-defined, so this duplicates the definition used by Perl's -T flag, which is:
The first block or so of the file is examined for odd characters such as strange control codes or characters with the high bit set. If too many strange characters (>30%) are found, it's a -B file, otherwise it's a -T file. Also, any file containing null in the first block is considered a binary file.
512 바이트의 샘플블럭을 잡아서 ASCII 코드 범위 32-127과
\n, \r, \t, \b를 제외한 코드가 있으면 바이너리로 취급합니다.
안시코드 넣으려고 "^V + [" 이런 터미널 제어문자를 넣은 것도 바이너리로 취급되는 단점이 있습니다. :(
유니코드에서도 문제가 있을 수도...
그러고 보니... 제가 언급한 ethereal에는(win32용도 있고 X용도 있습니다) TCP연결 추적기능이 있으니 패킷 캡처를 죽 해 놓으셨다면 해당 TCP연결만 따로 뽑아서 어떤 전송이 되었는지 살펴볼 수 있습니다. 알려진 프로토콜(HTTP, FTP등등)이라면 바로 내용을 알 수 있을 겁니다.
HTTP 문서를 보시면,그냥 글 남길떄는 보통 폼의
HTTP 문서를 보시면,
그냥 글 남길떄는 보통 폼의 내용을 application/x-www-form-urlencoded 로 인코딩해서 보내고
파일첨부일 경우 multipart/form-data 형식으로 보냅니다. form값들을 boundary로 구분하면서 파일의 경우는 바이너리로 전송합니다.
흘러다니는 패킷만 보고서는 유추하기는 쉽지 않을 것 같은데요..
뭉테기로 다니는 것도 아닐꺼고..
첨부한 그림처럼 파일을 전송할때는, 파일크기가 mtu보다 크면 한패킷에
첨부한 그림처럼 파일을 전송할때는, 파일크기가 mtu보다 크면 한패킷에 다 못보내고 분할하게됩니다.
그림을 보시면 이해가 빠를듯...
^^;;
어떤 플그림?
그림의 웹세션 캡쳐하신거...
어떤 플그림 사용하신 건가요?
윈도우즈용인듯 싶은데...
직접 만드신 건가요?
개념없는 초딩들은 좋은 말로 할때 DC나 웃대가서 놀아라. 응?
[quote="박영선"]첨부한 그림처럼 파일을 전송할때는, 파일크기가 m
단순한 텍스트라도 MSS보다 큰 텍스트를 입력하면 분할을 합니다. 파일이 전송되는지를 구분하기 위해 패킷이 잘리는가를 확인해서 처리하는건 무리입니다.
Re: 어떤 플그림?
패킷 캡처 & 분석 프로그램같네요.
저거랑 같은건 아니지만 win32용 winpcap+ethereal을 쓰시면 동일한 결과를 얻을 수 있습니다.
--
익스펙토 페트로눔
[quote="progcom"][quote="박영선"]첨부한 그림처럼 파
예.. 맞습니다... 텍스트도 1500이 넘으리란 생각을 미처 못했습니다..ㅡㅡ;;
아... 그리고 mtu가 아니고 mss가 맞네요...
앞으로 글올릴때는 좀 더 신중히 올려야겠네요.
^^;;
Driftnet 이라는 프로그램을 받아 설치해 보세요. 네트웍 상에 돌아
Driftnet 이라는 프로그램을 받아 설치해 보세요. 네트웍 상에 돌아다니는 패킷들을 분석해서 그림인 경우에 받아서 보여주는 빅 브라더 스러운 감시도구입니다. ^_^
=-=-=-=-=-=-=-=-=
http://youlsa.com
패킷으로 분할되는 네트워크 환경에서는 골치 아픈 처리가 더 필요하겠지만,
패킷으로 분할되는 네트워크 환경에서는 골치 아픈 처리가 더 필요하겠지만,
순수하게 데이터 스트림에 대해서만 본다면,
파이썬으로 짜여진 아래 팁이 참고가 될 수 있을 것 같습니다.
http://aspn.activestate.com/ASPN/Cookbook/Python/Recipe/173220
512 바이트의 샘플블럭을 잡아서 ASCII 코드 범위 32-127과
\n, \r, \t, \b를 제외한 코드가 있으면 바이너리로 취급합니다.
안시코드 넣으려고 "^V + [" 이런 터미널 제어문자를 넣은 것도 바이너리로 취급되는 단점이 있습니다. :(
유니코드에서도 문제가 있을 수도...
이론적으로 완벽하지는 않지만 확률적인 타당성이 있다는데,
실전에서는 어떨지 모르겠네요.
----
http://nohmad.tumblr.com/
그러고 보니... 제가 언급한 ethereal에는(win32용도 있고 X
그러고 보니... 제가 언급한 ethereal에는(win32용도 있고 X용도 있습니다) TCP연결 추적기능이 있으니 패킷 캡처를 죽 해 놓으셨다면 해당 TCP연결만 따로 뽑아서 어떤 전송이 되었는지 살펴볼 수 있습니다. 알려진 프로토콜(HTTP, FTP등등)이라면 바로 내용을 알 수 있을 겁니다.
--
익스펙토 페트로눔
댓글 달기