조립PC와 compaq workstation kernel compile 비교

x2nine의 이미지

회사와 집에 각가의 PC가 있습니다.
회사는 compqa AP200 ( PIII-750,256MB,10GB(IDE)) BX
집은 조립(PIII1.1GA(Celeron),256MB,9GB(SCSI160)) - Supermiro P3SST인가 기억이.. 암튼 내장 SCSI160 DUAL입니다. 815Chip set
둘다 Redhat 9.0 으로 squid 설정 때문에 이것 저것 같은 프로그램을 똑같이 해서 Test중입니다.
토일요일 이틀간 kernel compile작업을 햇습니다.
근데 참 놀라운 결과가 나왔습니다.
얼핏 보기에 조립이 빠를것 같았는데.... compaq 이 더 빠르더군요.. 아주 많이... cache는 둘다 256kb 인데... 쩝!
내부 bus나 기판 설계의 차이인지는 몰라도 클럭의 (300Mhz)차이가 무색할 정도로 차이가 났습니다.
집에서는 10~15분 회사는 5분... 너무 차이나죠..
물론 같은 항목을 체크하고 같은 상황이구요..
다른것도 비교해봐야 알지만 현재로는 클럭이 높은 조립보다는 compaq ap200 workstation이 훨씬빠른 결과를 보여줬습니다.
다른것도 해보고 잼나는 결과 나오면 또 쓰죠...

hurryon의 이미지

조립 피씨의 CPU 때문일거 같습니다. 커널 컴파일과 같은 경우에는 수치연산이 당연히 많이 들어 가 있을거 같군요.

셀러론와 펜티엄의 차이는 부동수점을 계산하는 유닛의 유무라고 알고 있습니다만...

:-)

redbaron의 이미지

hurryon wrote:
조립 피씨의 CPU 때문일거 같습니다. 커널 컴파일과 같은 경우에는 수치연산이 당연히 많이 들어 가 있을거 같군요.

셀러론와 펜티엄의 차이는 부동수점을 계산하는 유닛의 유무라고 알고 있습니다만...

:-)


캐쉬의 차이 아닌가요?(쿨럭)
logout의 이미지

시피유 캐쉬 때문에 그런 게 아닐까요? 정확한 기억은 안나지만 펜3는 256kb 캐쉬, 그리고 셀러론은 128kb (64kb일수도) 로 알고 있습니다. 어쨌든 흥미로운 결과이군요.

"I conduct to live,
I live to compose."
--- Gustav Mahler

chocoheim의 이미지

Cel 투알라틴 1.1A 부터 1.4 까지는
셀러론 주제에(?) 독특하게도 L2 가 256kb 입니다.
덕분에 꾸준히 저가형으로 잘 팔리는 제품이었습니다
(지금은 via694 보드가 거의 단종되다시피해서... 잘 모르겠네요.)
요즘 나오는 1.7부터는 계속 128kb 이죠..

p3 750 이면 l2 가 256kb 일껍니다..

p.s. 조립형보다 완성형이 더 안정감이 있고, 성능이 좋은듯 합니다.
옛날 프리자리오 노트북(p3 700)이 왠만한 데탑 보다 빠르게 느껴졌거든요..

그런데..저정도로 심하게 차이나는 건...?_?

WaitplzplzWait

mycluster의 이미지

위에분 말대로 둘다 캐쉬는 256KB이고, Celeron Tualatin은 말만 셀러론이지, PIII 256KB와 다를게 없읍니다.
컴파일차이를 보고싶으시면 IO 속도를 체크해보십시오.
둘다
# hdparm -t /dev/hda
# hdparm -t /dev/sda

뭐 이런식으로 해보십시오, 생각보다 IDE하드가 안느립니다. 요즘 나오는 UDMA100 IDE는 10KRPM SCSI 보다 IO속도가 빠르니까요....

아참 그러고 요즘 나오는 P4 코어의 셀러론은 캐쉬가 128KB가 아니라 8KB 입니다. 확인해보세요... 똑같은 클럭의 P4에 비해서 한 30% 느립니다.

--------------------------------
윈도위의 리눅스 윈도위의 윈도우 리눅스위의 익스플로러

ydongyol의 이미지

시스템 버스가 p3는 133MHz이고
셀러론은 100MHz라서 아닐까요?

--
Linux강국 KOREA
http://ydongyol.tistory.com/

chocoheim의 이미지

MyCluster wrote:
아참 그러고 요즘 나오는 P4 코어의 셀러론은 캐쉬가 128KB가 아니라 8KB 입니다. 확인해보세요... 똑같은 클럭의 P4에 비해서 한 30% 느립니다.

음? 지금 L2 캐쉬만 말하는것 아니였나요?
p4(노스우드)의 L2 는 보통 512kb 입니다. 셀은 128kb 이구요
L1 cache는 둘다 8kb 입니다...

그리고 시스템 버스는 750, 1.1A 둘다 100이네요.

WaitplzplzWait

fibonacci의 이미지

커널컴파일이니 양쪽이 옵션체크가 판이하게 틀릴것입니다.
제 짐작에, 컴팩쪽 하드웨어는 체크해 줄 것이 많이 없었고,
조립쪽 하드웨어는 체크해줄것이 많았던 것이 아닐까요?
컴파일할 모듈수의 차이로 커널 컴파일 시간이 차이가 나니까요.

예를 들면, 한쪽은 IDE를 쓰지 않아도 CDROM이나 여타의 이유로 양쪽다 IDE지원은 체크가 되어있을 것이며 집의 것은 SCSI를 사용하니, SCSI체크도 더불어 되어 있을거구... 집의 PC는 취향상 이것저것 하드웨어를 덕지덕지 붙일 것이니, 그것에 따른 모듈도 컴파일 해야 할거구.. 회사건 기껏해야 이더넷장치만 컴파일하면 땡일테니, 생각보다 커널설정이 간단할 것입니다.

여하튼 제 생각은 그런 이유인것 같습니다.

No Pain, No Gain.

x2nine의 이미지

/dev/hda:
Timing buffered disk reads: 64 MB in 2.63 seconds = 24.33 MB/sec

라고 나오네요..
참고로 HDD는 ap200에 있는게 아닌 그냥 있던 10GB Maxtor 입니다.
원래 있던건 Windows2000으로 Test하던거라서...

그리고 위에 어떤분이 체크 항목이 틀리다고 했는데... 객관성을 위해 모두 같은 항목을 체크 했습니다. 둘 다 필요없어도 합집합으로 설정했습니다. ^^

No pain! No Gain!
It's tricky~

dormael의 이미지

커널 컴파일이라면 역시 CPU에 상당히 의존적일것 같은데요.

셀러론과 피3의 차이가 큰거 같은데. 제가 알기론 셀러론에도 부동소수점 연산 유닛은 있는걸로 알고 있고 캐시 크기도 같은데...

그냥 씨퓨의 연산 능력 차이가 아닐까 싶네요.

일반적으로 SCSI와 IDE의 차이는 커널 컴파일에서는 크게 나타나진 않을것 같네요. ^^

-- Signature --
青い空大好き。
蒼井ソラもっと好き。
파란 하늘 너무 좋아.
아오이 소라 더좋아.

kslee80의 이미지

일단, 커널 컴파일만이 아니라 모든 컴파일 속도는
CPU 에 90% 이상 의존하죠..

P3-750 과 Celeron 1.1A ..
P3-750 : 256K L2 Cache, 100MHz FSB
Cel-1.1 : 256K L2 Cache, 100MHz FSB
(L1 은 정확한 수치를 모르는고로..안썼습니다만, 같다고 알고 있습니다.)

하지만...외형적인 수치와는 틀리게...
P3-750 이 더 빠르다면....그건 다른 요인 때문이라고 봅니다..

완제품이기 때문에 틀릴수 있다고는 보지 않습니다..
제아무리 완제품이라고 해서...버스를 더 빠른 다른걸 쓴다던가 하는짓은
하질 못하니깐요....표준이 너무나 오래전부터 확립되어 있었기에..
그런 방식으로는 다른 기기와의 비호환을 불러올 뿐입니다..

제 생각에...
의심되는것은 L2 Cache 의 레이턴시와 Way 수 입니다..
예전부터 셀러론 모델에는 L2 Cache 에 레이턴시를 걸어서..
성능이 동급 P3 에 비해서 느리다는 소리가 있었습니다...
사실인지 아닌지는 모르겠지만요..-.-;;

fibonacci의 이미지

1.1G셀러론은 두가지가 있는것으로 압니다(둘다 울나라에 들어왔는지는 모르지만).
0.18 micron공정에서 생산된것과 0.13 micron공정에서 생산된 것입니다.
흔히 말하는 튜알라틴 셀러론(256k L2 cache)은 0.13micron 공정에서 만들어 진 것입니다.
0.18micron 공정에서 만든 셀러론은 128kb L2 cache 입니다.
dmesg로 L2 cache 직접 확인해 보세요. 가장 확실합니다.

---------------------------------------------------------
컥.. 학교섭의 Xeon 700은 L2 cache가 1024k네요.. 역시 Xeon.

No Pain, No Gain.

chocoheim의 이미지

fibonacci wrote:
1.1G셀러론은 두가지가 있는것으로 압니다(둘다 울나라에 들어왔는지는 모르지만).
0.18 micron공정에서 생산된것과 0.13 micron공정에서 생산된 것입니다.
흔히 말하는 튜알라틴 셀러론(256k L2 cache)은 0.13micron 공정에서 만들어 진 것입니다.
0.18micron 공정에서 만든 셀러론은 128kb L2 cache 입니다.
dmesg로 L2 cache 직접 확인해 보세요. 가장 확실합니다.

---------------------------------------------------------
컥.. 학교섭의 Xeon 700은 L2 cache가 1024k네요.. 역시 Xeon.

http://www.intel.com/products/desktop/processors/celeron/detail.htm#oneoneghz

0.18에서 나온놈이 cel 1.1 이고,
0.13은 cel 1.1A 입니다. :-)

WaitplzplzWait

redbaron의 이미지

chocoheim wrote:
fibonacci wrote:
1.1G셀러론은 두가지가 있는것으로 압니다(둘다 울나라에 들어왔는지는 모르지만).
0.18 micron공정에서 생산된것과 0.13 micron공정에서 생산된 것입니다.
흔히 말하는 튜알라틴 셀러론(256k L2 cache)은 0.13micron 공정에서 만들어 진 것입니다.
0.18micron 공정에서 만든 셀러론은 128kb L2 cache 입니다.
dmesg로 L2 cache 직접 확인해 보세요. 가장 확실합니다.

---------------------------------------------------------
컥.. 학교섭의 Xeon 700은 L2 cache가 1024k네요.. 역시 Xeon.

http://www.intel.com/products/desktop/processors/celeron/detail.htm#oneoneghz

0.18에서 나온놈이 cel 1.1 이고,
0.13은 cel 1.1A 입니다. :-)

인텔에서 좀더 검색해보시면 0.13 공정에서 나온 녀석들은 t1A 니 뭐니 하는 그런 스테핑이 붙어 있습니다. 소위 말하는 그 전설의 "튜얼라틴"코어 CPU들 이죠.

두분이서 같은 말을 계속 하시길레..ㅡ_ㅡㅋ

(1G넘는 머신이라도..있었으면 ㅋ)

fibonacci의 이미지

1.1과 1.1A의 차이..
알겠습니다.

No Pain, No Gain.

fibonacci의 이미지

농담인데,

컴파일러가 셀러론한테는 무리한 일을 안시킬려고 해서
시간이 오래걸리는것이 아닐까요?

-,.-;

No Pain, No Gain.

kwanghui96의 이미지

밖에 나타나는 캐쉬의 크기는 같겠지만..

내부적으로 (앞에서 어느 분꼐서 언급하셨듯이) assosiative way 수와

캐쉬 속도가 차이가 나는 걸로 알고 있습니다.

그럼..

서지훈의 이미지

hurryon wrote:
조립 피씨의 CPU 때문일거 같습니다. 커널 컴파일과 같은 경우에는 수치연산이 당연히 많이 들어 가 있을거 같군요.

셀러론와 펜티엄의 차이는 부동수점을 계산하는 유닛의 유무라고 알고 있습니다만...

:-)


부동소숫점 유닛의 유무는...
486SX Vs. 486DX 의 차이겠죠^^
celeron은 저도 cache의 차이로 알고 있습니다...^^

<어떠한 역경에도 굴하지 않는 '하양 지훈'>

#include <com.h> <C2H5OH.h> <woman.h>
do { if (com) hacking(); if (money) drinking(); if (women) loving(); } while (1);

kirrie의 이미지

fibonacci wrote:
농담인데,

컴파일러가 셀러론한테는 무리한 일을 안시킬려고 해서
시간이 오래걸리는것이 아닐까요?

-,.-;

컴파일러가 그렇게 감성적이라는 편견을 버리세요욧!!! (농담입니다. ^^;;)

그러나 저러나 셀러론은 저가정책이라는 것 외에는 볼게 없는 CPU인 것 같습니다. 전 사무실에 제 뒷편에서 근무하던 프로그래머는 "내가 다시는 셀러론을 쓰느니 전자계산기를 쓰겠다!" 라는 일갈과 함께 회사를 옮겼습니다. (물론 다른 이유때문이지만. ^^;;)
저도 지금 셀러론을 쓰고 있는데 확실히 좀 느린 감이 있습니다.

--->
데비안 & 우분투로 대동단결!

realian의 이미지

셀러론이..
seller('s) loan 이라는 얘기도 있더군요. :D

..........No Sig.........|
-------------------+

jachin의 이미지

P3에 대해 예전에 설계도를 분석해 본적이 있는데요... (프로세서에 대해 공부하다가... ^^;;;)

셀러론과 펜티엄의 연산기는 확연히 차이가 나더라구요. -_-a

컴파일에는 대역폭 넓은 연산이 많이 필요하기도 하고...

캐쉬도 많이 필요로 하기도 하니까... (Hit Ratio가 높다는 것만 해도 대단한 거니까요...)

그리고 메인보드 칩셋에 따라 다를 수도 있습니다.

제가 가지고 있던 443GX 보드에 P3 850x2 하고, 6A815EPD(Acorp) P3 1G x2 하고 서로 연산을 해봤는데, 850이 조금 더 빠르더군요. -_-;;;

(아니.. 어쩌면 850의 캐쉬가 512KB(슬롯형이라서..)라서 일지도 모르겠네요... -_-;;;)

GoodWolf의 이미지

AP200이라면.. I820 아닌가요?
..
RDRAM을쓰는....
..
그 영향도 있을꺼 같네요. ^^;
..
아. 그리고. 튜알셀 캐쉬가.. 4-way아닌가요?..
..
펜3 는 8-way고...
..
음...

No pains! No gains!

jachin의 이미지

헛. -_- 오래전 글인데 다시 등장하게 되었군요.

나중에 제가 동급 성능 메이져 브랜드 컴퓨터와 조립 PC로 한 번 해보도록 하겠습니다.

하지만, Compaq 장비를 간과하기 어려운 점은 Linux 용으로 나오는 Driver를 잘 운용하면 몇몇 귀찮은 관리를 시스템 상으로 자동적으로 해준다는 것입니다. (깔기도 조금 어렵지만요. ^^;;) 학과 서버에 Compaq 드라이버를 깔려고 시도하다가, 중간에 포기했었는데, 깔고 나니까 메인보드에 내장되어있던 다른 기능들도 살아나더군요. (비록 학과단위의 서버에서는 큰 필요는 없었지만 말이죠.)