Silicon : GPU, HBM, NVLink et microarchitecture IA

Silicon

CUDA vs ROCm en 2026 : l'écart réel en production IA

CUDA vs ROCm en 2026 : le débat n'est plus « est-ce que ROCm marche » mais « quel écart reste-t-il ». Versions, parité framework, vrais verrous, sources.

CUDA
ROCm
AMD
NVIDIA

Silicon

FP8, FP6, FP4 : ce que la basse précision change vraiment

FP8, FP6, FP4 : les formats numériques basse précision de l'inférence 2026. Formats à blocs MXFP4 et NVFP4, compromis portée/débit, et ce que le matériel supporte.

FP8
FP4
MXFP4
NVFP4

Silicon

AMD MI355X vs NVIDIA B200/B300 : le vrai match en 2026

AMD MI355X face à NVIDIA B200 et B300 : mémoire, bande passante, FP4 et le vrai écart — le scale-up NVLink et le logiciel. Comparatif sourcé, mi-2026.

AMD MI355X
NVIDIA B200
Blackwell
CDNA 4

Silicon

RTX 5090 vs H100 : quelle carte pour un LLM en local ?

RTX 5090 vs H100 pour faire tourner un LLM en local : 32 Go GDDR7 face à 80 Go HBM3, ce qui tient vraiment en VRAM, et pourquoi ce ne sont pas les mêmes produits.

RTX 5090
H100
LLM local
VRAM

Silicon

H100 vs B100 : analyse microarchitecturale et performance réelle en inférence LLM

H100 Hopper vs B100 Blackwell : architecture, mémoire et débit mesuré en inférence LLM. Où se situe vraiment le gain, et pour quelles charges il compte.

H100
B100
Blackwell
Hopper

Silicon

HBM et NVLink : pourquoi les LLM sont limités par la mémoire

Les LLM ne sont presque jamais limités par les FLOPS. Le vrai plafond — bande passante HBM, KV cache, interconnexions NVLink — et ce que ça change au dimensionnement.

HBM
NVLink
KV cache
Bande passante

Articles — Silicon

CUDA vs ROCm en 2026 : l'écart réel en production IA

FP8, FP6, FP4 : ce que la basse précision change vraiment

AMD MI355X vs NVIDIA B200/B300 : le vrai match en 2026

RTX 5090 vs H100 : quelle carte pour un LLM en local ?

H100 vs B100 : analyse microarchitecturale et performance réelle en inférence LLM

HBM et NVLink : pourquoi les LLM sont limités par la mémoire