글
네할렘의 성능이 실망적? 아니다!
About 컴퓨터/News
2008. 8. 21. 01:53
최근 한 포럼을 통해 네할렘의 성능이 대략적으로 공개가 되었습니다...
그 벤치마크 내역들을 보면 네할렘의 성능이 기대보다 낮다고 그러더군요..
하지만 그 벤치내역들을 보면 네할렘이 성능이 좀 실망적으로 나온 부분은 게임벤치뿐이고
나머지 성능에서는 괴물같은 성능을 보여주는데 말입니다.
그럼 유출(?)된 네할렘의 벤치마크를 한번 분석해볼까 합니다.
TEST한 시스템 정보입니다. 보시면 네할렘 시스템은 DDR3 1066을 쓰고있고 요크필드
시스템은 DDR3-1600입니다. 뭔가 언벨런스한 구성입니다. 페놈 시스템은 DDR2를 쓰고있고
뭔가 통일을 시켰어야 하는데 그렇지 않아 약간 공평하지는 않군요.. 하지만 메모리 때문에
엄청난 차이가 나는게 아니니 넘어갑니다.
산드라 메모리 대역폭 벤치인데요.. 네할렘에서 도입된 트리플채널과 QPI덕택에 대역폭은
거의 안드로메다급으로 앞섭니다. FSB로 서버 4-way시스템에서 병목현상이 심해 성능하락
이 심했던 이전 구조에 비해 확실하게 개선됐습니다. AMD가 데탑에서 부진해도 서버시장에서 인텔과 비등하게 대항할 수 있던 이유도 하이퍼트랜스포트의 이점으로 메모리 대역폭에서
월등히 우위에 있었기 때문에 대형 컴퓨팅 시스템에서는 AMD의 채택률이 높을 수 밖에 없었죠.. 하지만 이제는 그런걱정이 없어지겠군요
Pov-Ray 렌더링 프로그램에서의 성능입니다. 네할렘은 넷버스트에서 도입했던 SMT기술을
도입했습니다. 그래서 한코어당 2쓰레드를 처리할 수 있고 쿼드코어니깐 총 8쓰레드를
처리할 수 있는것이죠.. 이러한 멀티쓰레드 기반의 프로그램에서는 네할렘의 성능향상이
확실하게 좋습니다. 작업하시는 분들에게는 최고의 머신이 될듯합니다.
사이언스마크에서의 메모리 레이턴시 입니다. 전 이벤치에서 약간 의구심이 드는것이
보통 AMD의 메모리 레이턴시가 인텔 시스템보다 낮은데 이 벤치에선 월등히 높게나온것이
좀 의문스럽네요...
보통 Super-Pi라는 프로그램으로 파이계산 벤치마크를 했지만 여기선 Pifast라는 프로그램으로 벤치마크를 했군요.. 3.2Ghz의 QX9770과 비슷하게 하는군요..
참고하자면 Super-Pi로 테스트할시 2.93Ghz의 네할렘은 펜린코어 3.5Ghz와 비슷한
속도를 보여줍니다.
WAV 인코딩 벤치인데.. 요크필드보다 약간 떨어지네요...
멀티쓰레딩 환경에선 역시 SMT의 효과로 성능향상이 있습니다.
압축프로그램도 CPU의 영향을 많이 받는데 winrar 테스트에서는 꽤 높은 성능향상이 있네요
제가 좀 의심가는 벤치입니다만.....
왜 의심가는지 자료를 올려보겠습니다.
기글하드웨어(http://gigglehd.com)에서 뉴스를 보다가 인텔이 IDF에서 공개한 시네벤치R10에서의 렌더링 성능을 보여줬는데 그 곳에서의 결과는 45800점이 나왔습니다. 하지만
이 벤치자료에선 16445점이죠.. 뭔가 이상합니다.
HEXUS(위의 벤치자료를 공개한 곳)벤치보다 대략 3배나 높은 점수인데요..
시스템에따라 어느정도 차이가 있을 수 있겠지만 3배정도의 차이는 확실히 먼가 잘못테스트
한거라고 봐집니다. 차이가 있다면 IDF에서 테스트한 네할렘 모델은 3.2Ghz이고 HEXUS에서 벤치한 모델은 2.93Ghz이지만 대략 200Mhz차이로 3배차이가 나는건 말도안되는 일이고
인텔이 IDF에서 먼가 치팅으로 돌릴리는 없겠고요..
웃긴건 QX9770의 점수는 그런대로 비슷하게 나왔다는겁니다. IDF나 HEXUS나
여튼 네할렘은 궁금증을 많이 유발시키는군요
그리고 가장 이슈가 된 게임벤치
수치를 보시면 네할렘의 성능이 이전세대인 코어2 세대보다 떨어집니다..
AMD 시스템보다도 더 떨어지는군요..
지금 현재 이때문에 네할렘의 평가절하가 많이 됩니다. 이렇게 네할렘의 성능이 떨어지는
이유는 3D게임의 성능은 CPU의 정수연산이 많이 담당하게 됩니다. 예전에는 실수연산이
상당부분을 차지했지만 GPU의 발전으로 인해서 실수연산은 이제 CPU가 할일은 거의 없어졌습니다. GPU의 실수연산은 CPU의 최소 몇십배 이상이니깐요..
허나 이 정수연산에 대한 향상은 네할렘에선 그렇게 향상을 안시켰다고 합니다.
정수연산 다음으로 많은 부분을 차지하는것이 캐쉬의 영향인데요.. 아시다시피 네할렘의 L2
캐쉬의 용량은 각코어당 256KB씩해서 총 1MB정도.. 그리고 L3캐쉬를 8MB를 4코어가 공유를 합니다. 이전 세대인 코어2는 거대 L2캐쉬를 각코어가 공유하던것과는 차이가 크죠..
그리고 코어2세대의 L2캐쉬 적중률은 상당히 높은편이었습니다. 특히나 인텔 CPU아키텍쳐
구조상 캐쉬 영향력을 많이 받습니다.
위 그림은 코어2 세대의 캐쉬차이가 3D게임의 프레임에 미치는 영향을 벤치마크 한겁니다.
그림에 보시다시피 상당한 차이가 발생하는걸 볼 수 있습니다.
특히 네할렘은 L2캐쉬가 각 코어당 256KB.. 즉 쉽게 1MB밖에 안됩니다. 현 코어2쿼드의 12MB에 비하면 턱없이 작죠.. 대신 8MB의 대용량 L3캐쉬를 공유하는데 L3캐쉬는 L2캐쉬보다 레이턴시가 느리기 때문에 성능이 떨어질 수 밖에 없습니다.
이렇게 캐쉬의 영향력을 많이 받는 게임에서 정수연산은 비등한데 캐쉬가 작으니 성능이
코어2세대보다 떨어지게 되는것이죠.. 허나 이게 모든것에 적용되진 않습니다. 아직
퀘이크워즈라는 게임에 국한되어있고 다양한 게임을 돌려봐야 하는것이니까요..
우선 인텔도 게임에 대한 성능향상은 그렇게 기대하지 말라고 하니깐 게임 프레임이 중요하신 분들은 그냥 코어2세대의 CPU를 사서 오버해서 쓰시는게 나을듯 합니다.
근데 이 게임벤치때문에 네할렘이 기대에 못미친다라는 글은 좀 어이가 없습니다.
예를 들어 10개분야에서 9개분야는 확실한 성능향상이 있는데 1개분야에서 성능하락이 있다고 구리다고 말하기는 좀 그렇죠.. 물론 게임이 일반적인 사용환경에선 많은 비중을 차지하고 있지만 아직 여러 게임벤치 결과도 나온것도 아닌데 섣부른 판단이 아닐까 생각합니다.
현재 게임은 멀티코어, 쓰레드를 활용하는 분야로 발전하고 있습니다.
현재 게임에서는 네할렘이 코어2세대보다 떨어진다고 해도 앞으로 출시될 게임들은 멀티코어, 쓰레드를 많이 활용하기 때문에 네할렘이 게임에서 떨어진다는 말은 점점 없어질것 같습니다. 아직 최적화도 많이 안된놈이라 숙성이 필요하죠 ㅋㅋ
현재 게임만 제외하곤 전 우선 완전 만족합니다. 특히 인코딩을 자주 하는 저로서는
네할렘의 성능이 기대이상으로 좋네요.. 거기다 SSE4.2라는 새로운 명령어도 활성화 된다면
정말 발전 가능성이 많다고 봅니다. 인텔 말로는 10월달정도에 출시할거라는 말이 나오는데
전 12월달쯤 한번 갈아타보려고 합니다.
그럼 지금까지 읽어주셔서 감사합니다.
그 벤치마크 내역들을 보면 네할렘의 성능이 기대보다 낮다고 그러더군요..
하지만 그 벤치내역들을 보면 네할렘이 성능이 좀 실망적으로 나온 부분은 게임벤치뿐이고
나머지 성능에서는 괴물같은 성능을 보여주는데 말입니다.
그럼 유출(?)된 네할렘의 벤치마크를 한번 분석해볼까 합니다.
TEST한 시스템 정보입니다. 보시면 네할렘 시스템은 DDR3 1066을 쓰고있고 요크필드
시스템은 DDR3-1600입니다. 뭔가 언벨런스한 구성입니다. 페놈 시스템은 DDR2를 쓰고있고
뭔가 통일을 시켰어야 하는데 그렇지 않아 약간 공평하지는 않군요.. 하지만 메모리 때문에
엄청난 차이가 나는게 아니니 넘어갑니다.
산드라 메모리 대역폭 벤치인데요.. 네할렘에서 도입된 트리플채널과 QPI덕택에 대역폭은
거의 안드로메다급으로 앞섭니다. FSB로 서버 4-way시스템에서 병목현상이 심해 성능하락
이 심했던 이전 구조에 비해 확실하게 개선됐습니다. AMD가 데탑에서 부진해도 서버시장에서 인텔과 비등하게 대항할 수 있던 이유도 하이퍼트랜스포트의 이점으로 메모리 대역폭에서
월등히 우위에 있었기 때문에 대형 컴퓨팅 시스템에서는 AMD의 채택률이 높을 수 밖에 없었죠.. 하지만 이제는 그런걱정이 없어지겠군요
Pov-Ray 렌더링 프로그램에서의 성능입니다. 네할렘은 넷버스트에서 도입했던 SMT기술을
도입했습니다. 그래서 한코어당 2쓰레드를 처리할 수 있고 쿼드코어니깐 총 8쓰레드를
처리할 수 있는것이죠.. 이러한 멀티쓰레드 기반의 프로그램에서는 네할렘의 성능향상이
확실하게 좋습니다. 작업하시는 분들에게는 최고의 머신이 될듯합니다.
사이언스마크에서의 메모리 레이턴시 입니다. 전 이벤치에서 약간 의구심이 드는것이
보통 AMD의 메모리 레이턴시가 인텔 시스템보다 낮은데 이 벤치에선 월등히 높게나온것이
좀 의문스럽네요...
보통 Super-Pi라는 프로그램으로 파이계산 벤치마크를 했지만 여기선 Pifast라는 프로그램으로 벤치마크를 했군요.. 3.2Ghz의 QX9770과 비슷하게 하는군요..
참고하자면 Super-Pi로 테스트할시 2.93Ghz의 네할렘은 펜린코어 3.5Ghz와 비슷한
속도를 보여줍니다.
WAV 인코딩 벤치인데.. 요크필드보다 약간 떨어지네요...
멀티쓰레딩 환경에선 역시 SMT의 효과로 성능향상이 있습니다.
압축프로그램도 CPU의 영향을 많이 받는데 winrar 테스트에서는 꽤 높은 성능향상이 있네요
제가 좀 의심가는 벤치입니다만.....
왜 의심가는지 자료를 올려보겠습니다.
기글하드웨어(http://gigglehd.com)에서 뉴스를 보다가 인텔이 IDF에서 공개한 시네벤치R10에서의 렌더링 성능을 보여줬는데 그 곳에서의 결과는 45800점이 나왔습니다. 하지만
이 벤치자료에선 16445점이죠.. 뭔가 이상합니다.
HEXUS(위의 벤치자료를 공개한 곳)벤치보다 대략 3배나 높은 점수인데요..
시스템에따라 어느정도 차이가 있을 수 있겠지만 3배정도의 차이는 확실히 먼가 잘못테스트
한거라고 봐집니다. 차이가 있다면 IDF에서 테스트한 네할렘 모델은 3.2Ghz이고 HEXUS에서 벤치한 모델은 2.93Ghz이지만 대략 200Mhz차이로 3배차이가 나는건 말도안되는 일이고
인텔이 IDF에서 먼가 치팅으로 돌릴리는 없겠고요..
웃긴건 QX9770의 점수는 그런대로 비슷하게 나왔다는겁니다. IDF나 HEXUS나
여튼 네할렘은 궁금증을 많이 유발시키는군요
그리고 가장 이슈가 된 게임벤치
수치를 보시면 네할렘의 성능이 이전세대인 코어2 세대보다 떨어집니다..
AMD 시스템보다도 더 떨어지는군요..
지금 현재 이때문에 네할렘의 평가절하가 많이 됩니다. 이렇게 네할렘의 성능이 떨어지는
이유는 3D게임의 성능은 CPU의 정수연산이 많이 담당하게 됩니다. 예전에는 실수연산이
상당부분을 차지했지만 GPU의 발전으로 인해서 실수연산은 이제 CPU가 할일은 거의 없어졌습니다. GPU의 실수연산은 CPU의 최소 몇십배 이상이니깐요..
허나 이 정수연산에 대한 향상은 네할렘에선 그렇게 향상을 안시켰다고 합니다.
정수연산 다음으로 많은 부분을 차지하는것이 캐쉬의 영향인데요.. 아시다시피 네할렘의 L2
캐쉬의 용량은 각코어당 256KB씩해서 총 1MB정도.. 그리고 L3캐쉬를 8MB를 4코어가 공유를 합니다. 이전 세대인 코어2는 거대 L2캐쉬를 각코어가 공유하던것과는 차이가 크죠..
그리고 코어2세대의 L2캐쉬 적중률은 상당히 높은편이었습니다. 특히나 인텔 CPU아키텍쳐
구조상 캐쉬 영향력을 많이 받습니다.
위 그림은 코어2 세대의 캐쉬차이가 3D게임의 프레임에 미치는 영향을 벤치마크 한겁니다.
그림에 보시다시피 상당한 차이가 발생하는걸 볼 수 있습니다.
특히 네할렘은 L2캐쉬가 각 코어당 256KB.. 즉 쉽게 1MB밖에 안됩니다. 현 코어2쿼드의 12MB에 비하면 턱없이 작죠.. 대신 8MB의 대용량 L3캐쉬를 공유하는데 L3캐쉬는 L2캐쉬보다 레이턴시가 느리기 때문에 성능이 떨어질 수 밖에 없습니다.
이렇게 캐쉬의 영향력을 많이 받는 게임에서 정수연산은 비등한데 캐쉬가 작으니 성능이
코어2세대보다 떨어지게 되는것이죠.. 허나 이게 모든것에 적용되진 않습니다. 아직
퀘이크워즈라는 게임에 국한되어있고 다양한 게임을 돌려봐야 하는것이니까요..
우선 인텔도 게임에 대한 성능향상은 그렇게 기대하지 말라고 하니깐 게임 프레임이 중요하신 분들은 그냥 코어2세대의 CPU를 사서 오버해서 쓰시는게 나을듯 합니다.
근데 이 게임벤치때문에 네할렘이 기대에 못미친다라는 글은 좀 어이가 없습니다.
예를 들어 10개분야에서 9개분야는 확실한 성능향상이 있는데 1개분야에서 성능하락이 있다고 구리다고 말하기는 좀 그렇죠.. 물론 게임이 일반적인 사용환경에선 많은 비중을 차지하고 있지만 아직 여러 게임벤치 결과도 나온것도 아닌데 섣부른 판단이 아닐까 생각합니다.
현재 게임은 멀티코어, 쓰레드를 활용하는 분야로 발전하고 있습니다.
현재 게임에서는 네할렘이 코어2세대보다 떨어진다고 해도 앞으로 출시될 게임들은 멀티코어, 쓰레드를 많이 활용하기 때문에 네할렘이 게임에서 떨어진다는 말은 점점 없어질것 같습니다. 아직 최적화도 많이 안된놈이라 숙성이 필요하죠 ㅋㅋ
현재 게임만 제외하곤 전 우선 완전 만족합니다. 특히 인코딩을 자주 하는 저로서는
네할렘의 성능이 기대이상으로 좋네요.. 거기다 SSE4.2라는 새로운 명령어도 활성화 된다면
정말 발전 가능성이 많다고 봅니다. 인텔 말로는 10월달정도에 출시할거라는 말이 나오는데
전 12월달쯤 한번 갈아타보려고 합니다.
그럼 지금까지 읽어주셔서 감사합니다.
'About 컴퓨터 > News' 카테고리의 다른 글
린필드 가격이 서서히 뜨고있네요 (0) | 2009.08.06 |
---|---|
네할렘 가격 공개 (2) | 2008.07.15 |
4870X2 R700 벤치마크 (0) | 2008.07.14 |
네할렘 성능의 베일을 벗다 Q9450과의 비교 (0) | 2008.06.06 |
인텔, 아톰(Atom) 브랜드 정식 런칭!! (1) | 2008.03.03 |
인텔 CPU가격인하 내역 (1) | 2008.02.23 |
인텔 네할렘 & 테일러버그 사진 (0) | 2008.02.23 |
인텔의 45nm쿼드코어 Q9300 용산에 물량이 풀리다 (0) | 2008.02.22 |
MS 자동 업데이트는 옳은 일인가? (0) | 2008.02.22 |
MSI의 1600FSB 지원 메인보드 리스트 (0) | 2008.02.22 |