array2d
diff --git a/‎doc/excuter/op-mem-ompsimd/list.md‎
Lines changed: 35 additions & 33 deletions b/‎doc/excuter/op-mem-ompsimd/list.md‎
Lines changed: 35 additions & 33 deletions
diff --git a/‎excuter/common/src/deepx/op/op.cpp‎
Lines changed: 3 additions & 1 deletion b/‎excuter/common/src/deepx/op/op.cpp‎
Lines changed: 3 additions & 1 deletion
diff --git a/‎excuter/common/src/deepx/op/op.hpp‎
Lines changed: 6 additions & 3 deletions b/‎excuter/common/src/deepx/op/op.hpp‎
Lines changed: 6 additions & 3 deletions
diff --git a/‎excuter/common/src/stdutil/error.hpp‎
Lines changed: 19 additions & 0 deletions b/‎excuter/common/src/stdutil/error.hpp‎
Lines changed: 19 additions & 0 deletions
diff --git a/‎excuter/op-mem-ompsimd/src/client/main.cpp‎
Lines changed: 22 additions & 4 deletions b/‎excuter/op-mem-ompsimd/src/client/main.cpp‎
Lines changed: 22 additions & 4 deletions
diff --git a/‎excuter/op-mem-ompsimd/src/deepx/op/arg.hpp‎
Lines changed: 2 additions & 12 deletions b/‎excuter/op-mem-ompsimd/src/deepx/op/arg.hpp‎
Lines changed: 2 additions & 12 deletions
@@ -2,36 +2,38 @@
 
 本页面由 `excuter/op-mem-ompsimd/src/deepx/op/opfactory.hpp` 生成，请勿手动修改 
 
-| Operation | Data Types | Math Formula | IR Instruction |
-|-----------|------------|--------------|----------------|
-| add_scalar | float32, float64 | T2 = T1 + 1.0 | add_scalar@float32 T1 1.0 -> T2 |
-| rdiv_scalar | float32, float64 | T3 =1 / T2 | rdiv_scalar@float32 1 T2 -> T3 |
-| constant | float32, float64 | T1 = full(shape, 0.0) | constant@float32 0.0 -> T1 |
-| uniform | float32, float64 | uniform(-1.0, 1.0,T1) | uniform@float32 -1.0 1.0 -> T1 |
-| mul_scalar | float32, float64 | T2 = T1 * 2.0 | mul_scalar@float32 T1 2.0 -> T2 |
-| deltensor | any | del T1 | deltensor@any T1 -> |
-| sub | float32, float64 | T3 = T1 - T2 | sub@int32 T1 T2 -> T3 |
-| sum | float32, float64 | T2 = sum(T1, dims=[1,2]) | sum@float32 T1 1 2 -> T2 |
-| argset | float32, float64, int32 | shape = [3, 4, 5] | argset@int32 3 4 5 -> shape |
-| arange | float32, float64 | arange(start=0.0, step=1.0,T1) | arange@float32 0.0 1.0 -> T1 |
-| add | float32, float64 | T3 = T1 + T2 | add@int32 T1 T2 -> T3 |
-| copytensor | float32, float64, int16, int32, int64, int8 | T2 = T1.copy() | copytensor@float32 T1 -> T2 |
-| min | float32, float64 | C = min(A,B) | min@float32 A B -> C |
-| print | any |  | print@any -> |
-| newtensor | float32, float64, int16, int32, int64, int8 | T1 = zeros(shape) | newtensor@float32 shape -> T1 |
-| div | float32, float64 | T3 = T1 / T2 | div@float32 T1 T2 -> T3 |
-| div_scalar | float32, float64 | T2 = T1 / 2.0 | div_scalar@float32 T1 2.0 -> T2 |
-| reshape | any | T2 = reshape(T1, [2,3,4]) | reshape@float32 T1 2 3 4 -> T2 |
-| min_scalar | float32, float64 | B= min(A, 1.0) | min_scalar@float32 A 1.0 -> B |
-| sqrt | float32, float64 | T2 = sqrt(T1) | sqrt@float32 T1 -> T2 |
-| mul | float32, float64 | T3 = T1 * T2 | mul@float32 T1 T2 -> T3 |
-| exp | float32, float64 | T2 = exp(T1) | exp@float32 T1 -> T2 |
-| max_scalar | float32, float64 | T2 = max(T1, 0.0) | max_scalar@float32 T1 0.0 -> T2 |
-| max | float32, float64 | T3 = max(T1,T2) | max@float32 T1 -> T2 |
-| pow | float32, float64 | T3 = T1 ^ T2 | pow@float32 T1 T2 -> T3 |
-| pow_scalar | float32, float64 | T2 = T1 ^ 2.0 | pow_scalar@float32 T1 2.0 -> T2 |
-| matmul | float32, float64 | T3 = T1 @ T2 | matmul@float32 T1 T2 -> T3 |
-| clonetensor | float32, float64, int16, int32, int64, int8 | T2 = T1.clone() | clonetensor@float32 T1 -> T2 |
-| transpose | any | T2 = transpose(T1, dimorder=[1,0]) | transpose@float32 T1 1 0 -> T2 |
-| expand | any | T2 = expand(T1, axis=[4,6,12]) | expand@float32 T1 4 6 12 -> T2 |
-| concat | float32 | T3 = concat([T1, T2], axis=3) | concat@float32 T1 T2 3 -> T3 |
+| Operation | Author | Data Types | Math Formula | IR Instruction |
+|-----------|--------|------------|--------------|----------------|
+| divscalar | miaobyte | float32, float64 | T2 = T1 / 2.0 | divscalar@float32 T1 2.0 -> T2 |
+| addscalar | miaobyte | float32, float64 | T2 = T1 + 1.0 | addscalar@float32 T1 1.0 -> T2 |
+| uniform |  | float32, float64 | uniform(-1.0, 1.0,T1) | uniform@float32 -1.0 1.0 -> T1 |
+| deltensor |  | any | del T1 | deltensor@any T1 -> |
+| minscalar |  | float32, float64 | B= min(A, 1.0) | minscalar@float32 A 1.0 -> B |
+| rdivscalar | miaobyte | float32, float64 | T3 =1 / T2 | rdivscalar@float32 1 T2 -> T3 |
+| constant |  | float32, float64 | T1 = full(shape, 0.0) | constant@float32 0.0 -> T1 |
+| powscalar | miaobyte | float32, float64 | T2 = T1 ^ 2.0 | powscalar@float32 T1 2.0 -> T2 |
+| sub | cblas | float32, float64 | T3 = T1 - T2 | sub@int32 T1 T2 -> T3 |
+| sub | miaobyte | float32, float64 | T3 = T1 - T2 | sub@int32 T1 T2 -> T3 |
+| sum |  | float32, float64 | T2 = sum(T1, dims=[1,2]) | sum@float32 T1 1 2 -> T2 |
+| argset |  | float32, float64, int32 | shape = [3, 4, 5] | argset@int32 3 4 5 -> shape |
+| arange |  | float32, float64 | arange(start=0.0, step=1.0,T1) | arange@float32 0.0 1.0 -> T1 |
+| transpose |  | any | T2 = transpose(T1, dimorder=[1,0]) | transpose@float32 T1 1 0 -> T2 |
+| clonetensor |  | float32, float64, int16, int32, int64, int8 | T2 = T1.clone() | clonetensor@float32 T1 -> T2 |
+| add | cblas | float32, float64 | T3 = T1 + T2 | add@int32 T1 T2 -> T3 |
+| add | miaobyte | float32, float64, int16, int32, int64, int8 | T3 = T1 + T2 | add@int32 T1 T2 -> T3 |
+| copytensor |  | float32, float64, int16, int32, int64, int8 | T2 = T1.copy() | copytensor@float32 T1 -> T2 |
+| min |  | float32, float64 | C = min(A,B) | min@float32 A B -> C |
+| print |  | any |  | print@any -> |
+| newtensor |  | float32, float64, int16, int32, int64, int8 | T1 = zeros(shape) | newtensor@float32 shape -> T1 |
+| mulscalar | miaobyte | float32, float64 | T2 = T1 * 2.0 | mulscalar@float32 T1 2.0 -> T2 |
+| div | miaobyte | float32, float64 | T3 = T1 / T2 | div_miaobyte@float32 T1 T2 -> T3 |
+| sqrt | miaobyte | float32, float64 | T2 = sqrt(T1) | sqrt@float32 T1 -> T2 |
+| mul | miaobyte | float32, float64 | T3 = T1 * T2 | mul@float32 T1 T2 -> T3 |
+| exp | miaobyte | float32, float64 | T2 = exp(T1) | exp@float32 T1 -> T2 |
+| max |  | float32, float64 | T3 = max(T1,T2) | max@float32 T1 -> T2 |
+| pow | miaobyte | float32, float64 | T3 = T1 ^ T2 | pow@float32 T1 T2 -> T3 |
+| maxscalar |  | float32, float64 | T2 = max(T1, 0.0) | maxscalar@float32 T1 0.0 -> T2 |
+| matmul |  | float32, float64 | T3 = T1 @ T2 | matmul@float32 T1 T2 -> T3 |
+| reshape |  | any | T2 = reshape(T1, [2,3,4]) | reshape@float32 T1 2 3 4 -> T2 |
+| expand |  | any | T2 = expand(T1, axis=[4,6,12]) | expand@float32 T1 4 6 12 -> T2 |
+| concat |  | float32 | T3 = concat([T1, T2], axis=3) | concat@float32 T1 T2 3 -> T3 |
@@ -9,7 +9,8 @@ namespace deepx::op
 {
     // 与deepx/front/py/deepx/nn/deepxir.py对应
 
-    // 新格式示例：mul@float32 a(a_grad) b(b_grad) -> a(a_grad) //id=1 create_time=1714512000 send_time=1714512000
+    // 前向 示例：miaobyte@mul[float32] a  b -> a  //id=1 create_time=1714512000 send_time=1714512000
+    // 反向,混合精度计算 示例：miaobyte@matmul  a[float16](a_grad[float16]) b[float16](b_grad[float16]) <- c[float32](a_grad[float32]) //id=1 create_time=1714512000 send_time=1714512000
     void Op::load(const string &input)
     {
         // 分割元数据部分
@@ -144,6 +145,7 @@ namespace deepx::op
                   const vector<string> &returns_grad)
     {
         this->name = opname;
+        this->author = "";
         this->dtype = dtype;
         this->args = args;
         this->returns = returns;
 
@@ -8,10 +8,12 @@
 #include <iostream>
 #include <sstream>
 #include <chrono>
+
 #include "deepx/tensor.hpp"
 #include "deepx/mem/mem.hpp"
 #include "deepx/dtype.hpp"
 
+#include "stdutil/error.hpp"
 namespace deepx::op
 {
     using deepx::mem::Mem;
@@ -21,6 +23,7 @@ namespace deepx::op
     {
     public:
         string name;
+        string author;
         string dtype;
         vector<string> args;
         vector<string> args_grad;
@@ -46,14 +49,14 @@ namespace deepx::op
         // 改为普通虚函数，提供默认实现
         virtual void forward(mem::Mem &mem)
         {
-            throw std::runtime_error("forward not implemented");
+             throw NotImplementError(name);
         }
 
         virtual void backward(mem::Mem &mem)
         {
-            throw std::runtime_error("backward not implemented");
+            throw NotImplementError(name);
         }
-
+ 
         virtual string math_formula() const {
             return "";
         }
 
@@ -0,0 +1,19 @@
+#ifndef STDUTIL_ERROR_HPP
+#define STDUTIL_ERROR_HPP
+
+#include <stdexcept>
+#include <string>
+
+
+class NotImplementError : public std::logic_error {
+public:
+    explicit NotImplementError(const std::string& method_name)
+        : std::logic_error("Not implement: " + method_name) {}
+};
+class UnsupportedOperationException : public std::logic_error {
+public:
+    explicit UnsupportedOperationException(const std::string& method_name)
+        : std::logic_error("Unsupported method: " + method_name) {}
+};
+
+#endif // STDUTIL_ERROR_HPP
@@ -59,18 +59,36 @@ int main()
             opresp.id = op.id;
             opresp.recv_at = op.recv_at;
 
-            if (opfactory.ops.find(op.name)==opfactory.ops.end()){
+ 
+            if ( opfactory.op_families.find(op.name)==opfactory.op_families.end()){
                 cerr<<"<op> "<<op.name<<" not found"<<endl;
                 opresp.error("op"+op.name+" not found");
                 continue;
+            } 
+            auto op_family = *(opfactory.op_families.find(op.name)->second);
+            string op_author_name= op.author;
+            if (op.author==""){
+                op_author_name= op_family._default;
+                if (op_author_name=="" && op_family.op_authors.size()>0){
+                    op_author_name=op_family.op_authors.begin()->first;
+                }else{
+                    cerr<<"<op> "<<op.name<<" no author implement"<<endl;
+                    opresp.error("op"+op.name+" no author implement");
+                    continue;
+                }
             }
-            auto &type_map = opfactory.ops.find(op.name)->second;
-            if (type_map.find(op.dtype)==type_map.end()){
+            if (op_family.op_authors.find(op_author_name)==op_family.op_authors.end()){
+                cerr<<"<op> "<<op.name<<" "<<op_author_name<<" not found"<<endl;
+                opresp.error("op"+op.name+" "+op_author_name+" not found");
+                continue;
+            }
+            auto &type_map =*(op_family.op_authors.find(op_author_name)->second);
+            if (type_map.ops.find(op.dtype)==type_map.ops.end()){
                 cerr<<"<op>"<<op.name<<" "<<op.dtype<<" not found"<<endl;
                  opresp.error("op"+op.dtype+" not found");
                  continue;
             }
-            auto src = type_map.find(op.dtype)->second;
+            auto src = type_map.ops.find(op.dtype)->second;
 
             (*src).init(op.name, op.dtype, op.args, op.returns, op.grad, op.args_grad, op.returns_grad);
             memmutex.lock();
 
@@ -9,21 +9,11 @@ namespace deepx::op{
     class ArgSet : public Op{
         public:
         ArgSet(){
-            this->init("argset",deepx::dtype<T>::name(), {}, {}, false, {}, {});
+            this->init("argset", deepx::dtype<T>::name(), {}, {}, false, {}, {});
         }
 
-        ArgSet(string name,T value){
-            this->init("argset",deepx::dtype<T>::name(), {name,value}, {}, false, {}, {});
-        }
- 
-        ArgSet(string name,vector<T> value){
-            this->init("argset",deepx::dtype<T>::name(), {name,value}, {}, false, {}, {});
-        }
-        ArgSet(initializer_list<string> args){
-            this->init("argset",deepx::dtype<T>::name(), args, {}, false, {}, {});
-        }
         void setexample() override {
-            this->init("argset", "int32", {"3", "4", "5"}, {"shape"}, false, {}, {});
+            this->init("argset",  "int32", {"3", "4", "5"}, {"shape"}, false, {}, {});
         }
         string math_formula() const override {
             return "shape = [3, 4, 5]";
Original file line number	Diff line number	Diff line change
`@@ -9,7 +9,8 @@ namespace deepx::op`
`9`	`9`	`{`
`10`	`10`	`// 与deepx/front/py/deepx/nn/deepxir.py对应`
`11`	`11`
`12`		`- // 新格式示例：mul@float32 a(a_grad) b(b_grad) -> a(a_grad) //id=1 create_time=1714512000 send_time=1714512000`
	`12`	`+ // 前向示例：miaobyte@mul[float32] a b -> a //id=1 create_time=1714512000 send_time=1714512000`
	`13`	`+ // 反向,混合精度计算示例：miaobyte@matmul a[float16](a_grad[float16]) b[float16](b_grad[float16]) <- c[float32](a_grad[float32]) //id=1 create_time=1714512000 send_time=1714512000`
`13`	`14`	`void Op::load(const string &input)`
`14`	`15`	`{`
`15`	`16`	`// 分割元数据部分`
`@@ -144,6 +145,7 @@ namespace deepx::op`
`144`	`145`	`const vector<string> &returns_grad)`
`145`	`146`	`{`
`146`	`147`	`this->name = opname;`
	`148`	`+ this->author = "";`
`147`	`149`	`this->dtype = dtype;`
`148`	`150`	`this->args = args;`
`149`	`151`	`this->returns = returns;`
Original file line number	Diff line number	Diff line change
`@@ -8,10 +8,12 @@`
`8`	`8`	`#include <iostream>`
`9`	`9`	`#include <sstream>`
`10`	`10`	`#include <chrono>`
	`11`	`+`
`11`	`12`	`#include "deepx/tensor.hpp"`
`12`	`13`	`#include "deepx/mem/mem.hpp"`
`13`	`14`	`#include "deepx/dtype.hpp"`
`14`	`15`
	`16`	`+#include "stdutil/error.hpp"`
`15`	`17`	`namespace deepx::op`
`16`	`18`	`{`
`17`	`19`	`using deepx::mem::Mem;`
`@@ -21,6 +23,7 @@ namespace deepx::op`
`21`	`23`	`{`
`22`	`24`	`public:`
`23`	`25`	`string name;`
	`26`	`+ string author;`
`24`	`27`	`string dtype;`
`25`	`28`	`vector<string> args;`
`26`	`29`	`vector<string> args_grad;`
`@@ -46,14 +49,14 @@ namespace deepx::op`
`46`	`49`	`// 改为普通虚函数，提供默认实现`
`47`	`50`	`virtual void forward(mem::Mem &mem)`
`48`	`51`	`{`
`49`		`- throw std::runtime_error("forward not implemented");`
	`52`	`+ throw NotImplementError(name);`
`50`	`53`	`}`
`51`	`54`
`52`	`55`	`virtual void backward(mem::Mem &mem)`
`53`	`56`	`{`
`54`		`- throw std::runtime_error("backward not implemented");`
	`57`	`+ throw NotImplementError(name);`
`55`	`58`	`}`
`56`		`-`
	`59`	`+`
`57`	`60`	`virtual string math_formula() const {`
`58`	`61`	`return "";`
`59`	`62`	`}`