Jan Sverre undersøker AMD RDNA3 GPU-hardware med hipEngine benchmark-resultater på skjermen

hipEngine – ROCm-native inference engine for AMD RDNA3 og Strix Halo

hipEngine er et nytt open source inference engine for AMD RDNA3-GPUer – kjører Qwen3.6 35B på 103 tok/s på RX 7900 XTX uten PyTorch-overhead. 120+ egenskrevne HIP-kjerner, 50% raskere prefill enn llama.cpp ved 128K kontekst.