TRTIS内使用pipeline串联多个模型中间的前后处理是否需要用CUDA实现?
NVIDIA高级系统架构师胡麟:
取决于你自己是想把它放在CPU还是GPU上来做。