hipEngine – ROCm-native inference engine for AMD RDNA3 og Strix Halo
hipEngine er et nytt open source inference engine for AMD RDNA3-GPUer – kjører Qwen3.6 35B på 103 tok/s på RX 7900 XTX uten PyTorch-overhead. 120+ egenskrevne HIP-kjerner, 50% raskere prefill enn llama.cpp ved 128K kontekst.