lunedì 12 settembre 2011

AMD Opteron vs Intel Xeon


Intel e AMD battagliano nel mercato server. Il nuovo Woodcrest di Intel è in grado di riprendersi il trono perduto? Abbiamo confrontato due server per rispondere a questa domanda.

Xeon Woodcrest Vs. Opteron
Negli anni passati Intel e AMD si sono battute fieramente per superarsi l'un l'altra e guadagnare quote di mercato, attraverso l'introduzione costante di processori sempre più veloci. Questa competizione si è riflessa in una veloce innovazione e in prezzi costantemente in ribasso.
Oggi diamo uno sguardo ai processori di queste due aziende sviluppati per il mercato server. Intel schiera la gamma Xeon, mentre AMD ha chiamato la sua offerta con il nome Opteron. Gli AMD Opteron hanno goduto della leadership prestazionale nel mercato server negli anni passati, grazie a un'architettura superiore, capace di restituire prestazioni migliori e consumi ridotti (prestazioni per watt più elevate). Imparando dagli errori e realizzando che il design attuale non poteva competere con i forti Opteron, Intel ha introdotto una nuova e completa gamma di soluzioni Xeon, basata sull'architettura Core 2.
Processori
Intel Xeon "Dempsey"
La soluzione dual core Xeon di Intel, nome in codice Dempsey, è stata presentata nel maggio 2006 sotto il model number 5000. Come tutti gli Xeon, si tratta di una CPU desktop con capacità di multiprocesso simmetrico (SMP). In questo caso, la CPU è la stessa (Presler) del Pentium Extreme Edition (EE), la quale è di norma una revisione finale del dual core Pentium D (Netburst) con due core Cedar Mill basati sul processo produttivo a 65 nm.
Lo Xeon Dempsey presenta delle frequenze di lavoro che vanno dai 2.67 ai 3.73 GHz con un model number speculare che spazia tra 5030 e 5080. Con Dempsey, Intel ha introdotto la piattaforma Bensley (chipset serie 5000) basata sul Socket 771 (conosciuto anche come Socket J). I processori Xeon Dempsey, Woodcrest e presto Clovertown (quad-core) faranno tutti uso di questa piattaforma. Per i nostri test abbiamo deciso di utilizzare il top di gamma Xeon 5080, con frequenza a 3.73 GHz, 1066 MHz di bus e 2 MB di cache L2 per core (4 MB in totale).
Intel Xeon "Woodcrest"
"Woodcrest" è il nome in codice del nuovo processore dual core server/workstation. È stato introdotto nel giugno 2006 - a un mese di distanza dall'introduzione dello Xeon Dempsey - ed è basato sull'architettura Core 2. Secondo Intel questo design aumenta le prestazioni dell'80%, riducendo nel contempo i consumi del 20% rispetto ai precedenti Xeon NetBurst.
I Xeon Woodcrest hanno una frequenza di clock che va da 1.6 a 3.0 GHz con un corrispettivo numerico da 5110 a 5160. Come lo Xeon Dempsey, Woodcrest fa uso della nuova piattaforma Bensley e Socket 771. Per un'analisi più approfondita sulla serie Xeon 5100 date uno sguardo al nostro articolo suWoodcrest. Per i nostri test abbiamo scelto il modello più veloce disponibile, lo Xeon 5160; questo processore ha una frequenza di 3.0 GHz, 1333 MHz di bus e 4 MB di cache L2 condivisa.
AMD Opteron " Italy "
L'Opteron è la risposta di AMD all'Intel Xeon. Il primo processore "multi core" Opteron è stato presentato nel maggio 2005 e da quel momento si è imposto nel mercato server.
Per il nostro confronto abbiamo scelto la serie Opteron 200, nome in codice "Italy". La CPU alloggia su un socket 940 pin progettato specificatamente per piattaforme server, che accetta solo memorie ECC registered. La serie 200 è basata su un'architettura a 90 nm e spazia tra 1.8 e 2.6 GHz, con model number speculari da 265 a 285. Per questo test abbiamo utillizzato il top di gamma 285, che lavora a 2.6 GHz e integra 1 MB di cache L2 per core (2 MB in totale).
Interfaccia di memoria
Il nostro sistema di test Intel è equipaggiato con quattro moduli di memoria da 1 GB DDR2-667 FB-DIMM. Il throughput teorico per questa configurazione è di 21.4 GB/s per un Woodcrest con FSB da 1333 MHz e 17.4 GB/s per i processori Dempsey con FSB a 1066MHz.
Il sistema AMD può contare su quattro moduli DDR-400 da 1 GB, con un throughput pari a 2x 6.4 GB/s a causa del controller di memoria integrato nella CPU. La prossima generazione Opteron basata su piattaforma AM2 farà uso di DDR2-800, che teoricamente raddoppieranno il throughput.
Gli Opteron con controller di memoria integrato (IMC) hanno latenze migliori, mentre le soluzioni Intel utilizzano una grande cache L2 da 4 MB condivisa che riduce notevolmente la latenza d'accesso. Dire quale di questi due metodi sia il migliore è un azzardo. Il vantaggio dell'approccio di Intel deriva dal fatto che mantenendo il controller di memoria nel chipset, c'è più flessibilità per quanto riguarda il tipo di memoria utilizzabile, laddove un controller di memoria integrato richiederebbe una riprogettazione della CPU. Dato che i processori Intel Xeon condividono la stessa architettura delle CPU desktop, è più efficiente avere un'architettura del core che può essere utilizzata con memorie DDR2 standard, così come moduli server FB-DIMM. Inoltre, il fatto che la cache utilizza meno energia rispetto a un controller di memoria integrato è un punto a favore in un mercato dove i consumi energetici sono un fattore molto importante. Detto questo, è assodato che l'IMC si riflette in un guadagno prestazionale, a discapito di costi e consumi.
Sistemi
Ci siamo muniti di due sistemi server 1U, uno dei quali basato su piattaforma Bensley con due Xeon 5000/5100 (Dempsey/Woodcrest) dello stesso tipo e un altro sistema AMD con due Opteron 200. Entrambi i sistemi sono stati costruiti per utilizzo in data center e possono essere espansi con Remote Management Cards.
Dato che questi sistemi sono 1U e presentano un peso limitato, integrano ventole di piccola dimensione. Per compensare la limitata dimensione, queste ventole devono ruotare molto velocemente. Con una velocità superiore a 10,000 RPM, il rumore prodotto da più ventole è estremamente forte - e se necessario, possono raggiungere velocità fino a 15,000 RPM! Il sistema AMD p dotato di un alimentatore opzionale ridondante.
I sistemi che abbiamo scelto sono i seguenti:
1. Sistema Intel:
SuperServer 6015B-T
2. Sistema AMD
A+ Server AS1020P-T
Configurazione di prova
Il sistema Intel è stato configurato come di seguito: la prima configurazione montava un paio di processori Woodcrest Xeon 5160, mentre la seconda montava un paio di processori Dempsey Xeon 5080. La ragione che ci ha spinto a creare queste due configurazioni è stata la voglia di confrontare il nuovo Woodcrest con il vecchio Dempsey.
Sistema Hardware I
Processori I2x Intel Xeon Processor (Woodcrest core)
3.0 GHz, FSB1333, 4 MB L2 Cache
Processori II2x Intel Xeon Processor (Dempsey core)
3.73 GHz, FSB 1066, 4 MB L2 Cache
PiattaformaSupermicro X7DBR-E (LGA 771)
Intel Blackford MCH Chipset, BIOS 07/07/2006
RAMHynix HYMP512F72BP8N2-Y5 (DDR2-667 FB)
4x 1 GB, CL5-5-5-11 Timings
Hard Drive del sistemaWestern Digital Raptor X WD1500ADFD
150 GB; 10,000 rpm; 16 MB Cache; SerialATA/150
Data Hard DriveWestern Digital Raptor 740AD
74 GB; 10,000 rpm; 8 MB Cache; SerialATA/150
Controller archiviazione di massaIntel ESB-2 I/O bridge
Scheda graficaOn-Board Graphics
ATI ES1000, 16 MB
Sistema Hardware II
Processori2x AMD Opteron Processor (Italy core)
2.6 GHz, FSB800, 2 MB L2 Cache
PiattaformaSupermicro H8DSP-I (Socket 940)
ServerWorks HT2000 Chipset, BIOS 06/30/2006
RAMHynix HYMD512G726CFP4N (DDR-400 ECC-Reg)
4x 1 GB, CL3-3-3-8 Timings
Hard Drive del sistemaWestern Digital Raptor X WD1500ADFD
150 GB; 10,000 RPM; 16 MB Cache; SerialATA/150
Data Hard DriveWestern Digital Raptor 740AD
74 GB; 10,000 RPM; 8 MB Cache; SerialATA/150
Controller archiviazione di massaServerWorks HT1000
Scheda graficaOn-Board Graphics
ATI Rage XL, 8 MB
Sistema software e driver
OSMicrosoft Windows Server 2003 Enterprise Edition, Service Pack 1
Driver CPU AMDVersion 1.3.2.16
Driver piattaformaIntel Chipset Installation Utility 8.1.1.1001
Driver graficiDefault Windows Graphics Driver
Benchmark e impostazioni
Video
TMPEG 3.0 ExpressVersion: 3.0.4.24 (no Audio)
182 MB VOB MPEG2-source (704x576) 16:9
DivX 6.25Version: 6.25 (4 Logical CPUs)
Definition Profile: High Definition Profile
Multipass, 3000 kbit/s
Encoding mode: Insane Quality
XviD 1.2.0Version: 1.2.0 SMP Beta
Encoding type: Twopass - Single pass
Profile @ Level: DXN HT PAL
Target size (kbytes): 570000
Audio
Lame MP3Version 3.97 Beta 2 (11-29-2005)
Audio CD "Terminator II SE", 74 min
wave to mp3
160 kbps
OGGVersion 1.1.2 (Intel P4 MOD)
Version 1.1.2 (Intel AMD MOD)
Audio CD "Terminator II SE", 74 min
wave to ogg
Quality: 5
Applicazioni
WinrarVersion 3.61 (Dual-Core)
(303 MB, 47 Files, 2 Folders)
Compression = Best
Dictionary = 4096 kB
Autodesk 3D Studio MaxVersion: 8.0
Characters "Dragon_Charater_rig"
rendering 1280x1024 Frames 1,3,5-12
CinebenchVersion 9.5
64 Bit
X CPU
Sintetici
EverestVersion 3.01.652
Cache & Memory Benchmark
SiSoftware Sandra 2007Version 2007.5.10.98
CPU Test = CPU Arithmetic / MultiMedia
Memory Test = Bandwidth Benchmark
Memory Latency Test = ns
LinpackVersion 3.0
64 Bit
SunGardAdaptiv Credit Risk
Version 3.0
Altro
Intel C++ CompilerVersion 9.1.030
Intel Fortran CompilerVersion 9.1.029
Risultati benchmark
Video
L'encoding Video comporta un'operazione intensiva di calcolo. Da questi risultati, possiamo vedere come l'Opteron 285 non riesce a tenere il passo dello Xeon 5160, prendendo un distacco del 20-30%. Questo significativo aumento prestazionale è dovuto all'unità Single Cycle SSE della microarchitettura Core 2, che appare largamente superiore nelle operazioni di media encoding. In questi benchmark l'Opteron è persino leggermente più lento rispetto allo Xeon 5080.
Audio
Nei nostri benchmark audio possiamo vedere ancora come lo Xeon 5160 stia davanti all'Opteron 285, di un margine del 30-35%; in questo benchmark, tuttavia, l'Opteron è capace di ottenere risultati migliori rispetto allo Xeon 5080. Come affermato prima, l'unità Single Cycle SSE del core 2 Duo è la ragione che permette allo Xeon 5160 di raggiungere prestazioni superiori.
Applicazioni
Nei nostri test sulle apllicazioni, possiamo constatare come l'Opteron raggiunga la seconda posizione in tutti i test, anche se i risultati sono molto vicini a quelli di uno Xeon 5080. Nel primo dei due test lo Xeon 5160 è il 16-22% più veloce rispetto all'Opteron. Nel tempo di compressione di un file con Winrar il risultato è stato deciso dall'unità Single Cycle SSE del processore Woodcrest.
Sintetici
Come potete vedere, l'Opteron è più veloce del processore Xeon nei benchmark di memoria e presenta latenze molto ridotte. Questo è una conseguenza dell'utilizzo di un controller di memoria individuale per ogni processore, così come un chipset di memoria integrato nella CPU Opteron. Le CPU Xeon, d'altra parte, figurano prestazioni integer e calcoli in virgola mobile superiori.
Linpack è una libreria software che fornisce gli strumenti necessari per permettere l'esecuzione di calcoli lineari numerici. Questa libreria software è stata utilizzata per la creazione del benchmark Linpack, il quale misura la potenza di calcolo in virgola mobile del sistema. Questo software è ottimizzato per Intel e quando risolve 22.000 insiemi di equazioni lineari utilizza oltre 3 GB di RAM, beneficiando dei quattro canali fully buffered DIMM della piattaforma Intel Bensley. La versione 3.0 utilizza inoltre 16 istruzioni introdotte con Woodcrest.
SunGard ACR è un'applicazione per servizi finanziari, che analizza un grande portfolio di client assets e genera una valutazione del rischio di credito. Questa è un'applicazione di calcolo pesante, che utilizza probabilità matematiche sophisticate sotto scenari multipli per generare un'analisi di rischio. In questo benchmark lo Xeon 5160 è stato il 22% più veloce rispetto all'Opteron.
Consumi energetici
I sistemi non sono completamente gli stessi, ma sono della stessa fascia ed è così possibile confrontarli. Come potete vedere, con l'amministrazione energetica attiva in condizioni di idle, l'Opteron e lo Xeon Woodcrest hanno un consumo simile. Sotto carico, tuttavia, il Woodcrest utilizza meno energia; questo può essere attribuito al meccanismo di micro/macro-op fusion dell'architettura Core 2, che aumenta significativamente l'efficienza di ogni core.
Lo Xeon 5160 consuma il 17% in meno di energia rispetto all'Opteron sotto carico, mentre lo Xeon 5080 consuma il 30% di energia in più. Rispetto ai consumi energetici di due processori Xeon, abbiamo visto che la nuova architettura Core 2 dello Xeon 5160 richiede il 25-35% rispetto al Pentium D (Netburst) basato su Xeon 5080. Questi risultati sembrano confermare quanto affermato da Intel, ovvero un 20% in meno sui consumi.
Conclusioni
C'è da notare come nei sistemi Intel ogni FB-DIMM consuma circa 11 W e presenta un propriodissipatore per il raffreddamento. Con oltre 40 W, le RAM consumano un importante quantitativo di energia, limitando così i benefici delle CPU Xeon Woodcrest.
La piattaforma Woodcrest si è comportata molto bene, superando le nostre aspettative iniziali. Veloce in tutti i test, ha dominato completamente i nostri benchmark. La nuova serie di Xeon 5100 aiuta Intel a rientrare in carreggiata, fornendo i processori leader nel segmento server/workstation. La vecchia serie 5000 (Dempsey), basata su architettura Netburst, è spesso il fanalino di coda e ci serve puramente come punto di riferimento per i nostri test.
Intel ha ripreso il trono nel settore server/workstation. Fra poco Intel rilascerà il quad core Clovertown con due core Woodcrest e AMD è pronta per questa minaccia con l'introduzione dell'Opteron X4, con cache L3. I server beneficeranno dei quad core rispetto agli utenti desktop, a causa della presenza limitata di applicazioni multithreaded nel settore desktop rispetto a quello server.
Alla metà del 2007 AMD dovrebbe rispondere a Intel con una linea di processori Opteron più veloci su socket F, con supporto DDR2. Se questo servirà a riprendere il trono lo vedremo, ma senza cambiamenti architetturali evidenti, Intel potrebbe mantenere lo scettto delle prestazioni per watt.
In conclusione, dobbiamo dire che entrambe le piattaforme si comportano bene, ma la serie Xeon 5100 è migliore per prestazioni e consumi.

Nessun commento:

Posta un commento