目前的代码测试,发现是可以有效提升npu利用率。。但如果是多个模型并行推理单个流,再将结果进行合并,是否可以实现呢??
目前的代码测试,发现是可以有效提升npu利用率。。但如果是多个模型并行推理单个流,再将结果进行合并,是否可以实现呢??