Skip to content

Conversation

@PPPoint-t
Copy link

@PPPoint-t PPPoint-t commented Jan 21, 2026

描述

Infinicore 赛题 T1-1-4 : 算子 sum, topk, var, var_mean, all
GPU 使用 ninetoothed 实现,ntops 仓库pr地址

记录

  1. topkntl.sort 不支持同时返回索引,暂用迭代选择法实现
  2. varvar_mean 若使用 welford 方法效果应该更好,暂用 two-pass 来实现
  3. 摩尔线程 all 算子的 GPU 实现中,若 out 是不连续输出的使用 copy_ 时会有问题,copy 后仍无法对齐,不连续输出的测例无法通过

测试截图

算子 CPU NVIDIA 摩尔线程
sum image image image
topk image image image
var image image image
var_mean image image image
all image image image

署名

HONOR_CODE.md
REFERENCE.md

@PPPoint-t PPPoint-t requested a review from a team January 21, 2026 06:30
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant