File tree Expand file tree Collapse file tree
Expand file tree Collapse file tree Original file line number Diff line number Diff line change 44
55ompsimd是DeepX框架的cpu执行器进程
66
7- + 采用OMP+SIMD加速tensor计算。
7+ + 采用OMP+SIMD加速tensor计算
8+ + double和float采用openblas加速
89+ 使用了jemalloc内存池管理内存。
910
1011
Original file line number Diff line number Diff line change 1- # range
1+ #### cpu的range算子辅助函数
22
3- range函数是shape类中的一个函数,用于根据shape对tensor进行遍历。
3+ range函数是shape类中的一个函数,用于根据shape对tensor进行omp线程并行遍历的方式
44
5- 由于非常多的算子,调用到了range函数,所以range函数需要不同类型的参数
5+ 定义和实现分别在:
6+
7+ excuter/common/src/deepx/shape.hpp
8+
9+ excuter/common/src/deepx/shape_range.cpp
610
711| func | omp并行 | omp线程local局部对象 | 调用场景 |
812| ---- | ---- | ------ | ---------- |
913| | N | | print |
1014| 函数 | 否 | 0 | 不需要并行 |
1115| 函数 | 是 | 0 | 需要并行 |
1216| 函数 | 否 | 0 | 不需要并行 |
13-
14- ##
Original file line number Diff line number Diff line change @@ -18,7 +18,6 @@ DeepX 原生分布式并行的深度学习训练推理一体框架
1818 :caption: doc 文档
1919
2020 excuter/op-mem-ompsimd/list
21- excuter/range
2221 deepxIR/ir
2322
2423.. toctree ::
@@ -31,6 +30,7 @@ DeepX 原生分布式并行的深度学习训练推理一体框架
3130 front/aboutop
3231 front/op
3332 excuter/op-mem-ompsimd/contribute
33+ excuter/op-mem-ompsimd/range
3434
3535索引和搜索
3636==========
You can’t perform that action at this time.
0 commit comments