Вы находитесь на странице: 1из 8

12/03/2012

Los micros de Intel dejan atrs a AMD

La rivalidad entre Intel y AMD ha dejado de ser tan virulenta como antao, sobre todo tras la
irrupcin de la arquitectura Core de Intel contra la que es difcil competir. Los micros AMD FX e
Intel Core i7 Extreme son prueba de ello.

A la redaccin de PC Actual han llegado las nuevas plataformas de sobremesa de Intel y AMD
para el segmento ms exigente de usuarios. Por un lado, la plataforma FX de AMD con
procesador FX 8150 y la placa Asus CrossHair V, con el nuevo chipset AMD 990FX y el zcalo
AM3+. Por otro, el kit de pruebas de Intel con Core i7 3960x y una placa con chipset X79.
Tambin lleg a la redaccin la placa Asus P9X79 Pro, con el chipset Intel X79 que fue la
elegida para las pruebas.

Los dos procesadores a examen exhiben precios muy diferentes, aunque ambos son las
propuestas ms ambiciosas que tiene cada fabricante. De hecho, sobre el papel, sus
argumentos de venta pueden llevar a pensar que estn equiparados en rendimiento. Por
nmero de ncleos o por velocidad de reloj, las cifras apuntan a un empate. Por precio puede
parecer que uno es una ganga y otro un abuso... En este artculo desvelamos la verdad.

En ambos casos se complet la configuracin con el nmero mnimo de mdulos de 2 Gbytes


necesarios para llenar todos los canales de memoria (dos en la AMD y cuatro en la Intel). As,
tuvimos 4 Gbytes de RAM DDR3 1.600 en la plataforma AMD y 8 Gbytes de RAM DDR3 1600 en
la de Intel. Tambin contamos con una tarjeta grfica Zotac GTX 580, de manera que el cuello
de botella en las pruebas con ms carga grfica no estuviera en la tarjeta de vdeo.

Un objetivo, caminos distintos

Cuando se trata de comparar distintas arquitecturas de procesadores conviene centrarse en


su esencia: procesar instrucciones de los programas almacenados en la memoria del sistema
para as completar tareas cuanto ms rpido, mejor. Los programas estn escritos en
diferentes lenguajes de programacin; pero, al final, gracias a la intervencin de los
compiladores, se traducen en instrucciones de cdigo mquina sujetas a las especificaciones
x86 y x86-64.

No obstante, con la proliferacin de dispositivos mviles existen otras plataformas sobre las
que es posible programar, como las basadas en ARM, con un arquitectura diferente a la x86.

1
Los fabricantes de procesadores compatibles con el juego de instrucciones x86 tienen que
disearlos de modo que entiendan el cdigo mquina en el que estn codificados los
programas y lo procesen a la mayor velocidad como sea posible. Este cdigo consta de
instrucciones y datos (operaciones y operandos), los cuales estn tambin almacenados en la
memoria o en los registros del procesador. Todo lo que haya en los discos duros, antes de
procesarse en la CPU, tiene que llevarse a la memoria. Un procesador no ejecuta cdigo sobre
los discos duros. En el fondo, la descodificacin de las instrucciones se traduce en operaciones
lgicas que trabajan sobre elementos binarios a la velocidad marcada por el reloj del sistema, y
todo ello dentro del confinamiento de los transistores de la CPU.

As pues, vistos desde fuera, dos procesadores pueden parecer iguales, y hacen lo mismo, pero
lo harn de formas muy distintas segn cada caso. Los fabricantes de CPUs, desarrollan
arquitecturas complejas para sus familias de procesadores, que pueden diferir en detalles
como la cantidad de memoria cach o la velocidad de reloj para una gama de CPUs dada, pero
que en el fondo ser la misma para todos los modelos a nivel de ncleos (cores). Pueden ser
procesadores con ms o menos ncleos, velocidades o memorias cach, pero para una
generacin determinada y un mismo fabricante, la forma de procesar instrucciones y datos
ser esencialmente la misma.

Entre fabricantes hay diferencias mucho ms importantes, como los algoritmos de prediccin
de la secuencia de ejecucin de un programa, la organizacin de la memoria cach para que no
haya que ir a buscar una instruccin o un operando a la RAM ni a los discos duros salvo muy
contadas excepciones. La longitud de la pipeline donde se van preparando las instrucciones
para su procesamiento es otra caracterstica diferenciadora (pipelines ms largas favorecen
mayores frecuencias de reloj, pero son poco ptimas para maximizar el nmero de
instrucciones procesadas por ciclo de reloj o IPC).

2
El nivel de overclocking que se consigue con el procesador de Intel es de nada menos que un
37% sin pararse a optimizar voltajes ni memoria. Sencillamente espectacular.

Las arquitecturas de Intel

La aproximacin de Intel a la tarea de la descodificacin de instrucciones y el procesamiento


de datos pasa por Sandy Bridge. No es una arquitectura nueva, y hasta que se materialice Ivy
Bridge con nueva tecnologa de fabricacin de 22 nm y algunas modificaciones en su diseo,
no habr novedades realmente relevantes.

Lo que s ha introducido Intel en esta ocasin ha sido la plataforma de rendimiento extremo


que toma el relevo de Gulftown, basada en la tecnologa Westemere de 32 nm. Con seis
ncleos y hasta 12 hilos de ejecucin gracias a Hyper-Threading, Gulftown era el referente de
rendimiento para equipos de sobremesa orientados a entusiastas y profesionales, hasta ahora,
con la llegada de Sandy Bridge-E, 32 nm y optimizaciones propias de Sandy Bridge como Turbo
Boost 2.0, 15 Mbytes de cach L3 y juegos de instrucciones especficos para operaciones
complejas (AVX, AES, SSE 4.1 y 4.2).

La diferencia con otros procesadores Sandy Bridge es la ausencia de los grficos integrados.
Con seis ncleos compartiendo 15 Mbytes de cach y espacio para otros dos cores que en la
versin para consumo no estn operativos, no hay espacio para nada ms en la CPU. Con 22
nm s ser factible, pero no con 32 nm y ms de 2.000 millones de transistores.

3
La gestin de la potencia consumida y la energa est optimizada al mximo, de un modo tal
que el sistema sabe en todo momento cunta potencia est disipando cada ncleo y regulando
en tiempo real su velocidad y la corriente que circula por l. Se trata de un procesador donde
se sabe cul es el umbral mnimo de rendimiento, pero el mximo es dinmico y configurable.
La tecnologa Turbo Boost 2.0, por ejemplo, permite que el procesador pase de 3,3 GHz a 3,9
GHz cuando lo admite el estado termodinmico del sistema (moraleja, cuanto ms disipe tu
ventilador, mayor margen tendrs para aumentar el rendimiento).

Seis ncleos, doce hilos


La tecnologa Hyper-Threading (procesar dos hilos de ejecucin lgicos en cada ncleo fsico)
es otra de las bazas de estos procesadores. Con hasta 12 hilos de ejecucin, el ya de por s
excelente comportamiento de la arquitectura Sandy Bridge se muestra intratable.

Todo est pensado para maximizar el nmero de Instrucciones Por Ciclo de reloj (IPC) que se
procesan, as como para mantener la pipeline y las unidades de ejecucin ocupadas el mayor
tiempo posible. As como para minimizar las predicciones errneas en las unidades de
prefetch. De este modo, los accesos hacia fuera de la jerarqua de memoria cach son mnimos
y se benefician casi linealmente del aumento de la velocidad de reloj del procesador. El
overclocking es espectacular, aunque tambin el consumo de energa.

4
Las placas base modernas integran herramientas para aumentar el rendimiento de un modo
fcil y sin necesidad conocimientos tcnicos.

Cambio de Zcalo y chipset


Con Sandy Bridge-E, tambin llega un nuevo zcalo con 2.011 patillas. Las placas LGA2011
suponen otro giro radical en Intel, que actualmente tiene en el mercado zcalos LGA 1155,
LGA 1366 y LGA 2011, sin contar los usuarios con LGA 1156. Es un cambio necesario para
integrar un cuarto canal de memoria que iguale las tasas de transferencia de datos en otras
partes del sistema, as como para implementar las comunicaciones con otros subsistemas
(vdeo, por ejemplo).

El chipset que acompaa a estos procesadores LGA 2011 es tambin nuevo, el Intel X79. No
integra USB 3.0 nativo, aunque en la placa hay puertos USB 3.0 con controladoras dedicadas.

Las propuestas de AMD

Con Bulldozer, AMD afronta un cambio de arquitectura radical frente a los procesadores K10.
Ahora, a las series C, E y A de procesadores se suman los FX. A partir de la arquitectura
Bulldozer, AMD lanza procesadores Zambezi para sobremesas, as como los Valencia e
Interlagos para usos profesionales en estaciones de trabajo y centros de datos.

Cada bloque funcional Bulldozer integra dos unidades de procesamiento de enteros que
comparten una unidad de coma flotante. Los procesadores estarn construidos a partir de un
nmero diferente de estos bloques funcionales que comparten memoria cach L3. Por

5
ejemplo, el FX 8150 tiene cuatro bloques Bulldozer, con 2 Mbytes de cach L2 cada uno y
compartiendo 8 Mbytes de cach L3. No hay grficos integrados como s hay en el caso de los
AMD Llano (serie A) o los AMD Ontario y Zacate (series C y E), pero s una modularidad que
posibilita la presencia de hasta 8 ncleos. En realidad, son 8 ncleos para clculo de enteros y
cuatro para coma flotante.

Bulldozer tambin ataca aspectos como el del rendimiento dinmico con la tecnologa Turbo
Core, que hace que la velocidad de los ncleos aumente en caso de necesidad y siempre que
sea seguro para el sistema. Incluye nuevas instrucciones para procesar instrucciones y datos
complejos (AVX, SSE, XOP, AES) y un controlador de memoria compatible con mdulos hasta
1.866 MHz. Se mantiene la comunicacin mediante HT (HyperTransport), aunque se
introducen chipsets de la serie 9 (990FX, 990X y 970) para placas AM3+. Este zcalo permite
usar procesadores de generaciones anteriores en las placas pero los procesadores FX no se
podrn instalar en zcalos AM3.

EL procesador AMD FX 8150 es el primero con ocho ncleos. Y sera un buen argumento si el
rendimiento fuera correspondiente; pero en las pruebas realizadas se pudo comprobar que no
es tal. Y as se entiende que el precio de estos procesadores sea inferior a 300 e, al nivel de los
Core i5 de Intel y similar al de los AMD Thuban de seis ncleos.

Con un sistema de refrigeracin activo, es posible aplicar incrementos de velocidad notables


sobre este procesador, pero en las pruebas realizadas con el modelo FX 8150 con la placa Asus
CrossHair V Formula y el ventilador de refrigeracin por agua, usando el modo Auto Tuning de
la placa, solo se consigui subir unas decenas de megahercios la velocidad, frente a los 1.200
MHz que se aument la velocidad del Intel. De modo que la prctica de overclocking est
sujeta al uso de un equipamiento de entidad.

6
[Ver PDF: 2012_03_12_especificaciones_y_rendimiento]

Conclusiones
Los resultados de las pruebas de rendimiento y de microarquitectura son claros. Con los
mismos seis ncleos, se consigue que el nuevo procesador extremo de Intel supere con creces
al modelo Gulftown Core i7 980x. No solo a la velocidad nominal, sino tambin en potencial de
overclocking. Si buscas el mximo rendimiento, Intel ofrece la nica propuesta viable.

AMD tiene un buen producto en el FX 8150, aunque sin olvidar al Core i7 2600K. Este ltimo es
capaz de superar al FX en bastantes pruebas (aunque no se han incluido en las tablas), pero
tiene un precio superior, todo sea dicho. Frente a los Core i5, el AMD FX 8150 en general est
por encima.

Y para comparar con una plataforma mvil, pasamos los benchmarks al ultrabook ZenBook de
Asus con un Core i7 para porttiles. Es interesante destacar que para pruebas donde est
implicado un nico ncleo, el ZenBook se defiende muy bien. Vimos en las pruebas de
rendimiento cmo la tecnologa del ncleo permite ofrecer soluciones escalables con un nivel
de prestaciones casi hasta predecible a partir del nmero de ncleos y el TDP.

En los bechmarks donde interviene un nico ncleo supera incluso al AMD FX pese a trabajar a
una frecuencia menor de reloj. La arquitectura Sandy Bridge es muy eficiente y escalable, y
sirve tanto para mover un ultrabook como un sobremesa extremo. Por cierto, el Core i7 del
Asus ZenBook integra grficos Intel HD3000 que se incluyen en el TDP de 17 W y, si se
desactivasen, seran unos 6 W menos, dejando solo los ncleos CPU. El TDP del Core i7 3960x
son 130W, que al final son unos 10x comparado con el TDP del i7 2677M del ZenBook.

La batera de benchmarks sirve para detectar diferencias en el rendimiento de los


procesadores. En este caso, hemos obtenido resultados que baten rcords en todos los
apartados relativos a la CPU.

7
Conoce las pruebas realizadas por PCA Lab

En la tabla de pruebas vers que, adems de los benchmarks clsicos, hemos incluido otros
como GeekBench, SunSpider, V8 Benchmark, Linpack Java o Mars Physx. GeekBench es
multiplataforma y permite comparar mviles, tabletas, porttiles y sobremesas Apple,
Windows y Linux. Por ejemplo, GeekBench en un iPhone 4S arroja un resultado de 634 puntos
(548 para enteros, 736 en FP, 780 para memoria y 293 para stream).

SunSpider, V8 y Linpack Java tambin permiten encontrar nexos de unin entre diferentes
plataformas, aunque a cambio, no aprovechan totalmente la multitarea. SunSpider en el
mismo iPhone 4S obtiene un resultado de 2.235 ms. De este modo, se puede tener una
referencia til para poner en contexto la evolucin de los sistemas mviles.

Tambin hemos probado un ultrabook en esta ocasin. Tiene un procesador Sandy Bridge
Core i7 de dos ncleos y su anlisis nos ha demostrado que Intel ha sabido usar la misma
arquitectura en un sistema ultraporttil y en el sobremesa con ms rendimiento del momento.
Las diferencias de disipacin de potencia son notables, igual que las de rendimiento, claro est,
aunque en aplicaciones donde se use un nico ncleo no estn tan lejos.

En el equipo de AMD no se profundiz con el overclocking, pues obtuvo un incremento de


velocidad marginal en reloj del sistema, poco significativo frente al overclocking del Core i7
3960x, cuyos resultados tenis abajo; aunque no contempla todas las pruebas, es revelador el
potencial de overclocking de Sandy Bridge-E.

Вам также может понравиться