告别CUDA GPU推理迎来Triton加速新时代 PyTorch官宣 新智元报道编辑,乔杨Frey,新智元导读,用英伟达的GPU,但可以不用CUDA,PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能...