Contra tiempo, viento y marea, y como no, a última hora como buen chileno, les presentamos el lanzamiento de la segunda tarjeta de NVIDIA basada en Kepler, GK104, conocido como Geforce GTX 670. Este modelo viene a terminar de limpiar el piso con la competencia, con todo lo que pudieron pensar y hablar él. Tomen descanso, un refresco, y disfruten de este nuevo NDA/revisión nocturna en oZeros.

Update #1: 10/05, 11:30 AM. Nuevas imágenes agregadas a sesión fotográfica!

Update #2: 10/05, 23:20 PM. Agregados los gráficos de consumo y temperaturas!

Arquitectura, diseño y componentes: Todo sobre Kepler en GTX670

El 23 de marzo NVIDIA nos mostró el primer modelo de tarjeta gráfica basada en la arquitectura Kepler. Esta fue la GTX 680, una tarjeta que en su interior trae el GPU GK104, mismo GPU que el pasado 3 de mayo se duplicó para dar vida a la GTX 690 dual GPU. La nueva GTX 670, un modelo con todas las cualidades del actual diseño gráfico, así como sus nuevas tecnologías que NVIDIA ha incorporado en los modelos mayores. Como vemos el GK 104 es el denominador común en las tres tarjetas gráficas de rango alto de NVIDIA, sólo que esta vez el ya famoso núcleo viene algo recortado, pero que a su vez se traduce en un menor precio, menor consumo y por lo tanto un menor tamaño en su circuitería interna y su PCB.

Pero primero repasemos lo que es Kepler. La nueva arquitectura de NVIDIA trajo consigo algunos cambios muy importantes en su estructura en comparación con Fermi, pero al mismo tiempo, sigue teniendo mucho de Fermi.  ¿Por que decimos esto? por que ambas arquitecturas estás conformadas por CUDA cores, SMs, y GPCs, sólo que con Kepler las unidades CUDA cores crecen 3 veces en un mucho menor espacio (claro que cada CUDA core Kepler  es menos complejo que uno Fermi).

La organización de la arquitectura es básicamente una conglomeración de CUDA cores que se van agrupando en distintas jerarquias para llegar a la unidad más importante, el “SMx”, antes conocido tan solo como SM (streaming multiprocessor). De arriba hacia abajo Kepler comienza  la interfaz PCIe 3.0, la que se comunica con el motor GigaThread. Luego pasamos a las unidades GPC s (graphics processing clusters) los cuales están compuestos por 2 SMx, los que a su vez están compuestos por una unidad de motor PolyMorph 2.0, cache de instrucciones, una unidad de cache de primer nivel y 192 CUDA cores.
Actualmente la GTX 680 posee 1536 CUDA cores con 4 GPCs u 8 unidades SMx que conforman el núcleo GK 104, pero como les comentábamos la GTX 670 posee CUDA cores deshabilitados, ya sea por que no calificaron para una GTX 680 o por que simplemente se “castraron” para cubrir el nicho de mercado subsiguiente a la GTX 680. Estos CUDA cores sin uso son justamente 192, los que representan una unidad SMx menos.

 

Por otro lado, esto es algo habitual que se hace: Un chip mayor con su variante menor. Tal como AMD con sus series HD xx70 y xx60, NVIDIA desarrolla sus series x80 y x70.

Unidades que conforman un Streaming Multiprocessors (SMX)

  • 32 CUDA cores (#1)
  • 32 CUDA cores (#2)
  • 32 CUDA cores (#3)
  • 32 CUDA cores (#4)
  • 32 CUDA cores (#5)
  • 32 CUDA cores (#6)
  • 16 Load/Store Units (#1)
  • 16 Load/Store Units (#2)
  • 16 Interpolation SFUs (#1)
  • 16 Interpolation SFUs (#2)
  • 16 Special Function SFUs (#1)
  • 16 Special Function SFUs (#2)
  • 8 Texture Units (#1)
  • 8 Texture Units (#2)
  • 8 CUDA FP64 cores

 

Otro de los aspectos destacables de la GTX 670 es que mantiene el tamaño del núcleo con 294 mm2, lo que sumado a su unidad SMx deshabilitada  produce un chip menos consumidor, que se calienta menos y que necesita de menos energía para funcionar. Esto queda plasmado en el corto PCB que es sinónimo de menos elementos electrónicos que administran la energía usada por el núcleo y las memorias.

Especificaciones técnicas GTX 670

Una de las nuevas implementaciones que habíamos visto en la GTX 680  era la frecuencia turbo o “GPU Boost”, la que  pasaba de los 1006MHz a los 1056MHz. Pues bien, esta tecnología se mantiene con el modelo GTX 670 pasando desde los 915 MHz a los 980 MHz. Sin embargo, la GTX 670 mantiene mucho de su hermana mayor ya que ademas del núcleo GK 104 también posee los mismos 256 bit de interfaz, la misma cantidad de memoria de 2 GB, y también, corriendo a una frecuencia efectiva de 6008 MHz .

 


Comparativa

Tal como la GTX 680 con la GTX 580, la GTX 670 viene a reemplazar el “nivel jerárquico” de la GTX 570, y que a su vez su rendimiento se acerca a la HD 7970 de AMD. Estas tarjetas son las que comparamos en la siguiente tabla para que tengan una idea de los detalles y diferencias exactas entre las diferentes arquitecturas.

GTX 670 GTX 680 HD 7970 GTX 580 GTX 570
Fabricación 28nm 28nm 28nm 40nm 40nm
Núleo GK104 GK104 Tahiti XT GF110 GF110
CUDA cores / SP 1344 1536 2048 512 480
Frecuencias GPU 915 MHz 1006 MHz 925 MHz 772 MHz 732 MHz
GPU boost 980 MHz 1056 MHz
Frecuencias Memorias 6000 MHz 6000 MHz 5500 MHz 4008 MHz 3800 MHz
ROPs 32 32 32 48 40
Cantidad de memoria 2 GB 2 GB 3 GB 1,5 GB 1,28 GB
Interfaz de memoria (bit) 256 256 384 384 320
Ancho de banda (GB/s) 192,3 192,3 264 192,4 152
Transistores (Mill.) 3540 3540 4313 3000 3000
Tamaño (mm2) 294 294 365 520 520
TDP 180 195 225 244 219
MSRP ($) 399 499 479

 

Con el apartado técnico y toda la materia repasada, nos vamos de lleno al review y todo lo que ustedes esperan…

NVIDIA GTX 670: Frente a las cámara

Por nuestras manos han pasado bestias del lejano mundo, algo así como “semi kraken” de todo tipo. Modelos gigantescos, llenos de disipación y heatpipes, ultra largos, más allá de los confines que establece el Extended ATX, incluso. Pero ahora no. La NVIDIA GTX 670 llegó humildemente en su caja negra de NVIDIA, sobria y sin bombos ni platillos. Lo mejor de todo fue cuando la revisamos y nos encontramos con esta adorable tarjeta.

Tal parece que NVIDIA quiere resaltar más sus tarjetas en el interior del gabinete al agregar su nuevo logotipo con un verde fuerte encima del sobrio negro mate.

Por el frente de la tarjeta tenemos un pequeño isotipo de la firma verde junto al blower que ocupa todo el espacio agregado a la tarjeta (el que está fuera del PCB).

Por el reverso tenemos la vista que todos esperábamos. Un PCB muy corto, casi como una tarjeta de gama media baja, con este agregado de la disipación que la hace ver como una tarjeta normal en su rango.

Arriba, la tarjeta referencial NVIDIA GTX 680, abajo, la nueva NVIDIA Geforce GTX 670.

Ahora que miramos bien las fotos llegamos a pensar que NVIDIA quiso mantener el tamaño grande de la tarjeta para dar la sensación que estamos frente a una tarjeta del segmento alto.

Acá vemos claramente que la diferencia no es más de 2 centímetros, por fuera.

Una última toma para las hermanas de sangre Kepler: NVIDIA GTX 680 y NVIDIA Geforce GTX 670, ambas referenciales.

A pesar del tamaño igual tendremos que usar dos conectores PCI Express de 6 pines. Recuerden que el TDP es básicamente 1/8 menor al de la GTX 680 por lo que su consumo debería andar en los mismos niveles.

Las conexiones comunes en una tarjeta de gama media-alta se han mantenido: Una salidad DVI-D y otra DVI-I para monitores, el infaltable HDMI y el que de a poco se ve cada vez más “DisplayPort”. 4 conexiones conformando a la GTX 670 con la posibilidad de montar una configuración multi-monitor, o más conocida como NVIDIA Surround. Además, vemos dos puertos SLI para montar una configuración de hasta 4 tarjetas gráficas en formato 4-Way SLI.

Sorprende que, por un lado, la circutería de las fases de poder se encuentre al otro extremo de lo que estamos acostumbrado, y además, que sea tan reducida en componentes (incluso se nota claramente que muchas de estas resistencias y capacitores se dejaron de lado en vez de llenar o completar la tarjeta).

El núcleo GK104 en todo su esplendor. Cabe destacar, pensando en voz alta, que por lo que vemos en el diseño de esta tarjeta se llega a sentir que “le faltan muchas cosas” (componentes eléctricos, memorias, etc), por lo que no sería raro ver en un futuro no muy lejano un modelo GTX675 que complete todos los espacios vacios de la tarjeta.

La disipación no es nada más que esto (además de un ventilador tipo blower). Muy liviano, justo en el centro y pensamos que “cumple” con lo que debe hacer, más que eso difícil.

Plataforma y entorno de pruebas

Para no dejar dudas en las pruebas recurrimos a nuestro procesador más poderoso del laboratorio, el Intel Core i7-3930K y sus 12 cabezas pensantes. Además, recurrimos a la ayuda de todos los demás reviews de tarjetas gráficas a modo comparativo y para que apreciemos el avance de la arquitectura en cada generación.

Plataforma Sandy Bridge-E

Procesador Intel Core i7-3930K
Placa madre ASUS X79 Rampage IV Extreme
Memorias Corsair Vengeance 4×4 GB
Fuente de poder Corsair AX1200w Professional Series
Tarjeta gráfica NVIDIA Geforce GTX670
Almacenamiento Kingston SSD 96GB
Refrigeración Corsair H100
Ventiladores
Software
Pruebas sintéticas Futuremark 3DMark 2006
Futuremark 3DMark Vantage
Futuremark 3DMark 11
Unigine Heaven HWBot Edition
Pruebas reales Metro 2033 – Ranger Pack Benchmark
Lost Planet 2 Benchmark
Alien vs Predator benchmark
Resident Evil 5
Stalker Call of Pripyat Benchmark Tool
Crysis 2
Sistema operativo y
controladores
Microsoft Windows 7 Profesional 64 bit
GTX 670 -> 301.35 Beta
GTX 680 y GTX 580 -> 301.10 WHQL
Sapphire HD 7970 -> Catalyst 12.4 

.
Metodología de pruebas

Las pruebas serán corridas, en esta ocasión, con el sistema por defecto (entre CPU, memorias y GTX 670). Con esto nos referimos a que el procesador estará tal cual se comporta al armar el PC, con su Turbo Boost activo y sus sistemas de ahorro también. Las memorias se dejarán a 1600 MHz con latencias 9-9-9-24, y para la NVIDIA GTX 670, la dejaremos con su configuración de fábrica que corresponde a 915 MHz en el GPU y 6008 MHz efectivos GDDR5 para las memorias.

Las pruebas se correrán un mínimo de tres veces con la finalidad de evitar corridas erróneas, falsas u otras con mucha suerte. Luego se procede a formar el promedio entre los resultados más estables y finalmente se agregan a cada gráfico.

Para esta ocasión agregamos uno de los juegos más populares, demandantes y exigentes al día de hoy. Ustedes ya deben saber de cual hablamos 😛 Battlefield 3 en su escena característica del nivel “Swordbreaker” (segunda escena), en la cual se ha grabado un timedemo propio de 120 segundos, la que comienza justo al cruzar la puerta hacia el garage, antes de que le disparen a nuestro compañero de armas. Bueno, las palabras muchas veces sobran, por lo que unas imágenes en Full HD te podrán explicar de mejor manera como rinde esta tarjeta.

La importancia de los FPS

Tanto se habla de la cantidad de FPS (o frames per second, cuadros por segundo) y pocas veces uno se detiene a explicar de la mejor manera posible los valores ideales en cada caso. Acá tenemos 3 diferencias importantes para cada nivel de FPS.

30 FPS

Se supone que una persona normal, común y sin problemas visuales ve por lo general a 30 FPS, osea, ve 30 cuadros por segundo. Si llevamos esto a los juegos quiere decir que si tenemos, por lo menos, 30 FPS veremos un juego fluído y jugable. Bajo este rango tendremos los típicos escenarios donde el juego se convierte en una presentación en Power Point, y al fin de cuentas “molesta”.

60 FPS

Un jugador algo más entrenado, acostumbrado y, si se puede decir, más vicioso en el tema, reconocerá automáticamente cuando un juego está funcionando a más de 30 FPS. De hecho, en la mayoría de los títulos este valor es claramente notable: El juego se mueve mucho más suave, agradable a la vista y, dependiendo del motor de juego, hasta más rápida es la sensación.

120 FPS

La llegada de los monitores de 120 Hz y 3D ha puesto a prueba nuevamente al mercado. Básicamente los 120 FPS te aseguran un mínimo de 60 FPS al momento de jugar algo en 3D (recordemos que este sistema se basa en dos imágenes, una parte de los 120 cuadros por segundo para cada ojo). Entonces, si buscas tener una experiencia completa en 3D, los 120 FPS son tu número de lotería.

Consumo

La optimización en el diseño de Kepler ha generado tarjetas con un consumo menor a las tope de línea antiguas de NVIDIA y también de la actual de AMD, además, el nivel de consumo bajo 100% de carga se acerca bastante a lo que sería la gama media alta de la línea Fermi, con la GTX 560 Ti. A vuelvo de águila diríamos que el consumo de la GTX 670 con la GTX 560 Ti es prácticamente el mismo, pero la propuesta actual de NVIDIA tendría entre un 60 a 80% mayor rendimiento.

Temperaturas

Los ánimos de NVIDIA por reducir costos y componentes en la GTX 670 se reflejan en un alto nivel de temperatura para el núcleo GK104. Lo pensamos desde que desarmamos la tarjeta, el disipador que viene de fábrica es bastante escualidad para el nivel de tarjeta (y a lo que estamos acostumbrados). No hay que olvidar, tampoco, que los gráficos se ven perjudiciales para los modelos GTX 680 y GTX 670 debido a que todas las demás tarjetas tienen sus propios sistemas exóticos de disipación, no referenciales, cosa que le vendría como anillo al dedo al modelo que revisamos hoy.

Pruebas sintéticas

Ya todo comenzó. No hay vuelta atrás. El duelo de titanes ha comenzado y la NVIDIA GTX 670 tendrá que mostrar todo lo suyo. Las pruebas de Futuremark y Unigine harán lo necesario por mostrar de lo que realmente está hecha la tarjeta.

3DMark 2006

Paliza total. La GTX 670 sigue la senda de su hermana mayor y derechamente se echa todo los puntajes al bolsillo. Se convierte automáticamente en la segunda mejor tarjeta del mercado single-GPU para esta prueba.

3DMark Vantage

Si pensábamos que lo anterior había sido cosa de principiantes 3DMark Vantage dice lo contrario, y acá nuevamente la GTX 670 se toma el segundo puesto de las prueba, claramente que bajo el ala de su hermana GTX 680.

3DMark 11

Esto no es broma. Por un precio, consumo y espacio menor, la GTX 670 barre con los registros obtenidos con la HD 7970. Nada que hacer contra la GTX 670 en los test de Futuremark.

Unigine Heaven – HWbot Edition

Unigine mantiene los resultados aunque acorta la brecha entre ellos. Hasta ahora la cosa es simple: Lo mejor en single-GPU lo tiene NVIDIA con su GTX 680 y GTX 670 para benchmarks.

Pruebas en juegos DX 10 y DX 9

Pasamos a las pruebas reales para salir un poco de estos fríos resultados sintéticos. Acá tenemos un puñado de juegos que todavía hacen uso del API DirectX 10 y que producen algo de daño en las tarjetas actuales.

El festival de matanza de Zombies organizados sigue la linealidad vista anteriormente, y poco a poco comienza a preocuparnos ya que sinceramente se ve que la mejor tarjeta de AMD no tiene mucho que hacer frente a la GTX 670.

Stalker: Call of Prypiat

Otro resultado similar en FPS. Números bastante altos y manteniendo el podio entre estos tres grandes: GTX 680 > GTX 670 > HD 7970. Lo curioso de esto, es que sabiendo que la GTX 670 cuesta un quinto menos que la GTX 680, sus diferencias podrían ser imperceptibles al ojo de cualquier mortal.

Metro 2033 – DX10

Metro 2033 aún se defiende ante estos monstruos gráficos. Para todos los casos, la diferencia entre los resultados se puede entender como margen de error, aunque, por poco más de un cuadro por segundo, finalmente la HD 7970 se lleva la delantera.

Pruebas en juegos DX 11

En DirectX 11 las cosas cambian un poco… Bastante mejor dicho. Los juegos se renuevan con un apartado gráfico más completo y complejo: Teselación por montones, sistemas de luces y sombras nuevos, humo volumétrico y un largo etcétera. Veamos como se comporta la NVIDIA GTX 670 y las demás exponentes.

Alien vs Predator

Por fin un respiro para AMD y su HD 7970, destacando incluso por sobre la GTX 680. Por otro lado, las exponentes de Kepler quedan por debajo de la mejor tarjeta Fermi, GTX 580, tomando un giro totalmente distinto en esta prueba.

Lost Planet 2

Pero el canto de la victoria no duró mucho para AMD, ya que en Lost Planet 2 hasta la GTX 580 sobrepasa a la mejor opción de AMD. Algo que no nos habíamos fijado, y que acaba de entrar en escena, es de la GTX 580, que estuvo dormida mucho rato bajo los mejores resultados que consigue la GTX 680.

Metro 2033 DX11

Definitivamente las bellezas basadas en Kepler no son muy amigas del exigente Metro 2033 usando API DirectX 11. La AMD HD 7970 vuelve a tomar la delantera junto con la NVIDIA GTX 580, dejando detrás al dúo dinámico de los verdes.

Battlefield 3 al máximo versus NVIDIA GTX 670

Se demoró en llegar, pero, finalmente, el título más destacado hoy por hoy llega a la batería de oZeros junto a un timedemo de la segunda misión, titulada “Swordbreaker”. En ella, nuestro equipo entra de lleno al enfrentamiento justo después de que uno de sus camaradas recibe el ataque certero de un francotirador.

Explosiones, balas por todas partes, mucho polvo, humo y uso de inteligencia artificial por montones se dan en esta escena, así como para “conocer” el juego. Bajo este concepto grabamos un demo de 120 segundos con FRAPS, el que al final de cuentas nos entrega un reporte con los FPS mínimos, promedios y máximos (para el gráfico), además, el siguiente video contiene la misma etapa desde su comienzo hasta que “extrañamente” quedamos de baja en combate. Grabado con cámara en mano, FPS activos en la esquina superior izquiera y una pequeña edición para resumir todo en números finales. Disfruten 😀 !

La comparativa frente a su hermana mayor, GTX 680, y la mejor solución de AMD con la HD 7970, queda de la siguiente forma:

La HD 7970 se defiende de manera digna quedando en un segundo puesto, pero por muy poco bajo la GTX 680. Menos de 1 FPS de diferencia promedio lo hace quedar como margen de error para este caso. Por otro lado, la GTX 670 se resiente un poco más en el rendimiento, pero alcanza a sobrepasar el límite mental de los 60 FPS.

Conclusiones

La NVIDIA GTX 670 nos dejó un trago más dulce que cualquier jarabe o almíbar de los dioses. Su presentación y diseño es tan austero que sorprende con tan buenos números y resultados, repartidos entre benchmarks y juegos reales.

Llega a ser increíble que una tarjeta de 100 dólares menos que la mejor actual, GTX 680, se le acerque al nivel de pisar los talones al quedar atrás por un par de FPS.

A final de cuentas tenemos 3 cosas claras con esta tarjeta: Primero, la GTX 670 supera claramente a la antigua GTX 580 (que actualmente está unos +20 dólares más cara), además, la GTX 670 gana en 8 de 12 pruebas a la HD 7970, que actualmente es la mejor tarjeta single GPU de AMD (y obviamente está más cara aún), y finalmente, la NVIDIA GTX 670 está por debajo de la GTX 680 (como debería ser obviamente), pero su diferencia en el precio no es proporcional al rendimiento que demuestran ambas tarjetas. La GTX 670 es más efectiva en su relación rendimiento versus costo, por lo que vendría como anillo al dedo para quienes gozan de hacer compras justas en vez de comprar lo mejor de lo mejor “porque me da lo mismo que sea 100.000 pesos más cara, aunque entregue 5 FPS más”.

Por otro lado, el disipador de la tarjeta pudo ser más grande y aprovechar todo el espacio agregado al PCB, ya que la temperatura que se genera es bastante alta como para estar algo tranquilos (en verano se podría disparar aún más), solo queda esperar a los fabricantes con sus diseños exóticos de refrigeración para elegir entre alguna opción más eficiente.

A pesar de encontrar raro que un pequeño PCB sea alimentado por dos cables PCI Express, está acorde al rendimiento entregado e incluso es más bajo de lo que muchos podrían imaginar. La arquitectura se encuentra en su mejor momento y felicitamos al desarrollo de NVIDIA por generar una tarjetas más bien revolucionaria en sus características.

Finalmente, debemos ponernos de pie y aplaudir el gran rendimiento visto el día de hoy con la NVIDIA GTX 670: Un rendimiento que está casi a la par de la GTX 680, dejando atrás a la pasada NVIDIA GTX 580 e incluso superando a la mejor opción de ATI, la HD7970. Es un gran logro merecedor, como no, del premio a lo mejor de lo mejor en piezas para PC, el premio al máximo rendimiento, además de llevar el título a la “Elección del Editor” por su desempeño y rendimiento versus consumo y costos.

“Elección del Editor” y Premio al Máximo Rendimiento

Los invitamos a seguir al tanto de esta pequeña maravilla, ya que iremos actualizando esta revisión con mas detalles y datos sobre tópicos que dejamos fuera debido al corto tiempo que tuvimos para generar esta revisión. No nos podemos despedir sin antes agradecer a Fernando Urquizo, Representante de NVIDIA en Chile, por facilitarnos esta muestra y varias otras para revisión y benchmarking extremo. Sin su ayuda no habríamos podido generar contenido de primer nivel, a la fecha y con muestras exclusivas, muchas gracias!.