Composants

Test de la plateforme Halo d’Intel : Haswell-E, X99 Express et DDR4

22/10/2014
Image1[1]

Petits rappels

news110310_17[1]

Intel a introduit son premier processeur hexa core en 2010 avec le Core i7 980X Extreme Edition en LGA 1366 (en photo à droite). Ce processeur de la famille « Gulftown » dérivait globalement des Lyndfield introduits en 2009. L’évolution a ensuite continué avec en 2011 les Sandy Bridge-E LGA 2011 dérivés des Sandy Bridge lancés plus tôt la même année, puis les Ivy Bridge-E toujours au format LGA 2011 en 2013 descendants des Ivy Bridge de 2012. A présent, Intel commercialise ses Haswell-E reposant sur l’architecture Haswell de 2013. Les versions « E », c’est-à-dire les porte-étendards, arrivent plus tardivement en raison de leur complexité notamment la présence de plus de cores, de caches plus gros et de contrôleurs PCI-Express plus complets… Pour les Sandy Bridge-E et Ivy-Bridge-E, Intel s’était limité à six cœurs comme sur le Gulftown mais Haswell-E introduit un premier modèle à huit cores.

Haswell-E en LGA 2011-v3

Outre le régulateur de tension intégré au processeur, l’architecture Haswell-E reprend les évolutions apportées par Haswell à savoir :

  • Les nouveaux jeux d’instructions AVX2, FMA3 et TSX
  • L’ajout de 2 ports d’exécution (8 au total) et d’un scheduler adapté
  • Des taux de transferts doublés pour le cache L1

a

L’iGPU passe bien entendu à la trappe afin de libérer de la place pour les cores, le cache nettement plus conséquent et le contrôleur PCI-Express plus complet. Le fleuron de la gamme, le Core i7-5960X octo core, embarque ainsi pas moins de 20 Mo de cache et totalise 2,6 milliards de transistors. Gravé en 22 nm, son die occupe une surface de 355,5 mm² ! Les autres processeurs de la gamme sont un peu plus modestes en raison de la présence de « seulement » six cores. Les Haswell-E se démarquent de leurs cousins Haswell par la présence de 40 lignes PCI-Express 3.0 au lieu de 16 (NDLR : le Core i7 5820K est limité à 28 lignes). Ces nombreuses liaisons PCI-Express sont bien entendu utiles pour la prise en charge des configurations en SLI ou CrossFire X à plus de deux cartes graphiques.

Image6
La plus grande avancée de cette plateforme Halo est bien entendu la présence d’un nouveau contrôleur mémoire destiné à prendre en charge la DDR4. Il s’agit d’un contrôleur à 4 canaux 64 bits capable de piloter officiellement de la DDR4-2133 offrant jusqu’à 68,3 Go/s de bande passante. Mais les modules de DDR4 plus rapide sont également supportés (jusqu’à la DDR4-2666 voire 3000).
La nouvelle plateforme est qualifiée de LGA 2011-v3 pour bien se différencier des versions précédentes qui utilisaient de la DDR3. En effet, la DDR4 utilise un format différent et les banques de mémoire sont adaptées. Enfin, la présence d’un VRM dans le processeur rend également la compatibilité avec les anciens supports LGA 2011 caduque.

La DDR4

Impossible de s’intéresser aux derniers processeurs d’Intel sans se pencher sur la DDR4. Les processeurs demandent toujours plus de bande passante mais il n’est pas possible d’augmenter facilement la fréquence des puces de mémoire. Il faut donc utiliser une astuce afin de préserver des fréquences de l’ordre de 100 à 266 Mhz pour les puces de DRAM. Il est bien entendu possible d’atteindre des fréquences bien plus élevées (jusqu’à 650 MHz pour la GDDR5) mais les coûts explosent…

bLe passage de la DDR à la DDR2 et de la DDR2 à la DDR3 s’est fait en doublant le nombre de cellules adressées en parallèle. Pour le DDR4, l’approche est différente. Cette fois, ce sont deux banques comparables à celles de la DDR3 qui sont adressées en parallèle (bank grouping) et un buffer supplémentaire fait son apparition. Les « astuces » utilisées pour accroitre le débit ont une contrepartie : l’augmentation de la latence. En effet, il faut s’assurer de la synchronisation et de la répartition des différentes données à lire ou à écrire, ce qui a un coût au niveau des cycles. Toutefois, la latence exprimée en cycles dépend de la fréquence : plus la fréquence monte, plus la latence – cette fois en ms – diminue. La DDR4 démarrant grosso modo là où les fréquences de la DDR3 culminent, le plein potentiel n’est pas encore obtenu.

cPerformances mises à part, la DDR4 demande une tension de fonctionnement de seulement 1,2 volt contre 1,5 volt pour le DDR3. Une tension plus faible va de pair avec une consommation réduite et bien entendu une réduction de la chaleur dissipée. La DDR4 contribuera donc à réduire la consommation des systèmes.

X99 Express / DHX99 PCH

Image2Les processeurs Intel ont besoin d’un chip compagnon (le PCH) pour assurer les I/O. Par rapport au bon vieux X79 Express, le X99 Express apporte à la plateforme haut de gamme d’Intel le support natif de l’USB 3.0. Le nouveau « chipset »gère ainsi 6 ports USB 3.0 et 8 ports USB 2.0. Il offre également 6 ports SATA 6 Gbps natifs pris en charge par les drivers IRST et 4 autres ports SATA complémentaires via un contrôleur additionnel. Le TDP du PCH DHX99 produit en 32 nm est de 6,5 Watts contre 7,8 Watts pour son prédécesseur gravé en 65 nm. Assez curieusement, Intel se contente toujours d’une liaison DMI 2.0 4X qui n’offre une bande passante que de 2 Go/s dans chaque sens. Avec des SSD capables de débiter chacun plus de 500 Mo/s et des SSD M.2 à 10 Gbps, cette connexion entre le X99 Express et le processeur Haswell-E pourrait à terme constituer un goulot. Enfin, un PCH comme le DHX99 est un composant assez onéreux : 74 $ contre moins de 50 $ pour un Z77 ou un Z87 plus commun.

Configuration de test

haswell-ePour cet essai, nous avons reçu un Intel Core i7-5930K cadencé à 3,5 GHz mais capable d’atteindre 3,7 GHz quand 2 cœurs sont actifs et 3,6 GHz dans tous les autres cas. Ce processeur n’a « que » six cœurs contrairement au Core i7-5960X (3,0 GHz) mais ses fréquences sont plus élevées. Par rapport au Core i7-5820K (le « petit » modèle de la gamme) limité à 28 lignes, le Core i7-5930K comporte 40 lignes PCI-Express 3.0. Affiché à 583 $, le Core i7-5930K est nettement plus abordable que le Core i7-5960K et ses 999 $. Il est par contre nettement plus cher que le Core i7-5820K, très abordable pour un hexa core, avec seulement 389 $.
Intel ayant arrêté la production de cartes mères, nous avons contacté différents constructeurs et MSI nous a rapidement fourni une carte mère LGA 2011-v3 : la X99S Mpower. Cette carte mère haut de gamme repose bien entendu sur un X99 Express dont toutes les possibilités sont exploitées (10 ports SATA 6 Gbps). La qualité de fabrication est au rendez-vous tant au niveau hardware que « software » avec un UEFI particulièrement soigné (comparable à celui de notre MSI Z77A-GD65). Le hardware est certifié « Military Class 4 » avec des capacités et des bobines de très haute qualité. Tous les connecteurs sont d’excellente facture et l’insertion comme le retrait des modules de mémoire et des cartes PCI-Express se fait aisément malgré un verrouillage ferme. La carte offre un système de Debug LED qui affiche les phases de POST afin de faciliter l’identification d’un problème de démarrage via un code hexadécimal. Parmi les points notables, on peut épingler la présence d’un port M.2 Turbo 32 Gbps. La X99S Mpower dispose de deux BIOS avec une LED témoin de couleur différente selon le BIOS actif. OC Genie activable via un bouton directement sur la carte mère overclocke automatiquement le système. Des boutons + et – permettent d’agir directement sur la fréquence de base du système. Enfin, les boutons power et reset ainsi qu’un interrupteur forçant le passage au BIOS sont présents. Niveau logiciel, MSI Command Center permet de faire depuis Windows tout ce qui peut se faire dans le BIOS/UEFI. Petit détail sympathique, le manuel comporte de nombreux codes QR donnant accès directement à des tutoriels vidéo ou des informations complémentaires. Enfin, outre le bundle de câbles, la carte est accompagnée d’une feuille de certification avec les scores atteints dans différents tests notés manuellement (tout comme la configuration matérielle et logicielle utilisée pour l’essai).

Image3
Image4Crucial nous a fourni 4 x 4 Go de DDR4-2400 16-16-16-39 1,2 volt qui devraient rapidement constituer un standard pour ce genre de mémoire. Notons que les timings ne sont pas spécialement agressifs, de la DDR4-2666 en 15-17-17-35 1,2 volt est déjà disponible. Pour atteindre de plus hautes fréquences (DDR4-2800) et/ou des timings plus agressifs (15-15-15-35), une tension de 1,35 volt est généralement de mise. Si la longueur reste inchangée avec 5 ¼ pouces (133,35 mm), les modules de DDR4 comptent 288 contacts contre 240 pour le DDR3. Une encoche assure à la fois un positionnement unique et l’incompatibilité physique avec des banques autres que celles prévues pour le DDR4.
Image5Côté refroidissement, Intel nous ayant fourni un processeur seul, nous avons opté pour un Dark Rock 3 capable d’encaisser un TDP de 190 Watts (celui de notre Core i7-5730K est de 140 Watts). Outre ses capacités de dissipation, ce HSF est compatible directement avec tous les supports actuels et son ventilateur est d’une grande discrétion. Comme toujours chez bequiet!, la qualité est au rendez-vous.
Notre machine de référence est toujours un Core i7-3770K à 3,5 GHz (Turbo à 3,9 GHz 1 et 2 cores, 3,8 GHz 3 cores et 3,7 GHz 4 cores) installé sur une MSI Z77A-GD65 avec pour l’occasion 8 Go de DDR3-2400 11-13-14-32 CR1. Dans les deux cas, le stockage est assuré par un SSD Sandisk Extreme Pro de 480 Go et l’affichage confié à une GeForce GTX 780.

Résultats

Image7

Dans les tests mono thread comme les bons vieux CPU Mark et FPU Mark ainsi que dans les benchs récents comme GeekBench Single Core, les écarts sont faibles étant donné qu’un seul des cœurs travaille. Malgré une fréquence de 3,7 GHz dans ces conditions, le Core i7-5930K se montre généralement plus rapide que le Core i7-3770K qui atteint pourtant 3,9 GHz dans ce genre d’usage. Il faut rappeler qu’entre le Core i7-3770K Sandy Bridge et le Core i7-5930K Haswell-E, des évolutions ont déjà eu lieu avec Ivy Bridge, une génération intermédiaire. Quoi qu’il en soit, ces résultats corroborent les résultats déjà obtenus avec Haswell.
Quand le Core i7-593K peut exploiter tous ses cores, les écarts sont très importants avec au minimum un avantage de 43% qui peut aller jusqu’à 63%.

Image8
Nous avons utilisé les différents tests GPGPU d’AIDA 64 afin de mettre en avant les écarts dans les benchs assez classiques exploitant toutes les possibilités et tous les jeux d’instructions. Les résultats sont assez impressionnants.

Image9

PC Mark 8 représente une utilisation bureautique courante d’un ordinateur. Dans ce test, un processeur tel que le Core i7-5930K ne tire pas vraiment son épingle du jeu car une telle puissance n’est pas vraiment nécessaire.

Image10

Dans 3D Mark ainsi que dans les jeux et benchs 3D, l’avantage du Core i7-5930K et de ses cores n’est pas non plus très présent. Seul Crysis 3 fait figure d’exception avec des performances en hausse spectaculaire de presque 70% ! Un gain très important s’observe également dans le score Physics du 3D Mark où les 2 cores supplémentaires font la différence. Quoi qu’il en soit, dans les jeux et surtout dans les résolutions ciblées pour ce genre de matériel (au moins Full HD en qualité maximale avec tous les filtres), la carte graphique fixe la cadence et non le processeur.

Image11

Pour terminer, nous avons mesuré les performances de la mémoire et des caches avec AIDA 64. La DDR4 apporte bien un gain conséquent en bande passante mais avec en contrepartie une hausse de la latence. Toutefois, comme ce fût le cas pour la DDR2 et la DDR3, la nouvelle génération de mémoire ne se présente pas sous son meilleur jour. La montée en fréquence ainsi que l’amélioration des puces de DDR4 conduiront à des timings plus faibles et des latences réduits (sans les surcoûts actuels).
Les caches L1, L2 et L3 du Core i7-5930K offrent de bien meilleurs débits que ceux de notre Core i7-3770K de référence. Si la latence est inchangée pour le cache L1, elle augmente pour les autres niveaux de cache notamment pour le L3 en raison de sa taille imposante.

Consommation et température

Au repos, le système complet à base de Core i7-5930K consomme 67 Watts contre 46 Watts pour notre machine de référence. En charge, la consommation de la configuration Core i7-5930K atteint 252 Watts soit exactement 2x plus que notre référence (126 Watts).
Côté température, nos deux processeurs se maintiennent aux alentours de 32~33°C au repos, ce qui est courant pour les processeurs Intel depuis plusieurs générations. En charge, le Core i7-3770K n’atteint que 74°C alors que le Core i7-5930K flirte avec les 85°C. Compte tenu de l’écart de TDP (140 Watts pour le Core i7-5930K et 77 Watts pour le Core i7-3770K), la dissipation thermique et les températures sont bien maitrisées.

Au final…

IMG_9327Avec Halo, Intel met à jour sa plateforme haut de gamme qui en avait bien besoin. Le PCH DHX99 apporte le support natif de l’USB 3 et jusqu’à 10 ports SATA 6 Gbps alors que le X79 Express se contentait de l’USB 2.0 et de 2 ports SATA 6 Gbps. Les nouveaux Core i7 Haswell-E apportent à la plateforme tous les bienfaits d’Haswell notamment les jeux d’instructions et l’apport de 2 nouveaux ports d’exécution par core. Haswell-E se démarque par le support de la DDR4 qui s’impose comme une évolution naturelle de la mémoire. Actuellement, la DDR4 offre surtout un supplément de bande passante avec en contrepartie une augmentation de la latence par rapport aux meilleurs modules de DDR3. Une situation déjà rencontrée avec la DDR, la DDR2 et la DDR3 et qui évoluera favorablement… La plateforme LGA 2011-v3 introduit aussi l’arrivée du premier processeur « grand public » octo core. Si nous avons seulement testé le Core i7-5930K milieu de la gamme Haswell-E, les constats fait pour un hexa core s’appliquent également à un octo core : pour tirer parti d’autant de cores, il faut des applications gourmandes : transcodage et montage vidéo, traitements photos complexes, compilations, modélisations diverses et rendu 3D en tête de liste. Même si l’usage de tous les cores est très rare dans les jeux, la présence d’au moins 28 lignes PCI-Express 3.0 (contre 16 lignes pour les Haswell classiques) est un avantage pour le SLI et le CrossFire X à plus de deux cartes. Les Core i7 Haswell-E et la plateforme LGA 2011-v3 s’adressent en fait à tous ceux qui, pour une raison ou une autre, se sentiraient déjà à l’étroit avec un Core i7 quad core…

  • Reply
    Nottelet
    07/04/2015 at 1 h 27 min

    Très bon commentaires.

Ecrire un commentaire