你好,按照pvm作者所说使用并行方式构建vss参数和floaps下降很多,但是训练时间确增加了很多甚至会显存不够,您知道原因吗,是否是参数计算模块有问题
你好,按照pvm作者所说使用并行方式构建vss参数和floaps下降很多,但是训练时间确增加了很多甚至会显存不够,您知道原因吗,是否是参数计算模块有问题