array2d
diff --git a/‎doc/deepxIR/func.md‎
Lines changed: 9 additions & 0 deletions b/‎doc/deepxIR/func.md‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎excuter/common/src/deepx/mem/mem.hpp‎
Lines changed: 4 additions & 0 deletions b/‎excuter/common/src/deepx/mem/mem.hpp‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎excuter/common/src/deepx/op/op.hpp‎
Lines changed: 9 additions & 0 deletions b/‎excuter/common/src/deepx/op/op.hpp‎
Lines changed: 9 additions & 0 deletions
diff --git a/‎excuter/op-mem-ompsimd/src/deepx/op/elementwise.hpp‎
Lines changed: 64 additions & 24 deletions b/‎excuter/op-mem-ompsimd/src/deepx/op/elementwise.hpp‎
Lines changed: 64 additions & 24 deletions
diff --git a/‎excuter/op-mem-ompsimd/src/deepx/op/opfactory.cpp‎
Lines changed: 5 additions & 0 deletions b/‎excuter/op-mem-ompsimd/src/deepx/op/opfactory.cpp‎
Lines changed: 5 additions & 0 deletions
diff --git a/‎front/py/deepx/__init__.py‎
Lines changed: 4 additions & 14 deletions b/‎front/py/deepx/__init__.py‎
Lines changed: 4 additions & 14 deletions
diff --git a/‎front/py/deepx/nn/functional/__init__.py‎
Lines changed: 2 additions & 2 deletions b/‎front/py/deepx/nn/functional/__init__.py‎
Lines changed: 2 additions & 2 deletions
diff --git a/‎front/py/deepx/nn/functional/elementwise.py‎
Lines changed: 63 additions & 14 deletions b/‎front/py/deepx/nn/functional/elementwise.py‎
Lines changed: 63 additions & 14 deletions
@@ -0,0 +1,9 @@
+`torch.rsqrt`是PyTorch中的一个函数，用于计算输入张量每个元素的平方根的倒数。在数学上，对于一个数 \(x\)，\(\text{rsqrt}(x)\) 的计算公式为：
+
+\(\text{rsqrt}(x)=\frac{1}{\sqrt{x}}\)
+
+其中，\(\sqrt{x}\) 表示 \(x\) 的平方根。
+
+例如，对于张量 `x = torch.tensor([4., 9., 16.])`，`torch.rsqrt(x)` 将返回 `tensor([0.5000, 0.3333, 0.2500])`，分别是 \(4\)、\(9\)、\(16\) 的平方根的倒数。
+
+从数学原理上来说，`torch.rsqrt` 是基于浮点数的运算规则来实现的。在计算平方根的倒数时，它会先计算平方根，然后再取倒数。在计算机中，浮点数的表示和运算有一定的精度限制，因此在实际计算中可能会存在一些微小的误差。
@@ -129,6 +129,10 @@ namespace deepx::mem
         {
             return mem.find(name) != mem.end();
         }
+        bool existarg(const string &name) const
+        {
+            return args.find(name) != args.end();
+        }
 
         template <typename T>
         shared_ptr<Tensor<T>> gettensor(const string &name) const
 
@@ -72,6 +72,15 @@ namespace deepx::op
         {
             return deepx::dtype<T>::name();
         }
+        T getarg(int idx,mem::Mem &mem){
+            auto x = T(0);
+            if (mem.existarg(this->args[idx])){
+                x = mem.getarg<T>(this->args[idx]);
+            }else{
+                x = T(std::stof(this->args[idx].c_str()));
+            }
+            return x;
+        }
     };
 }
 #endif
@@ -46,7 +46,8 @@ namespace deepx::op
             deepx::tensorfunc::add(*b_grad, *c_grad, *b_grad);  // b_grad += c_grad
         }
     };
- 
+    
+    //Add_scalar
     template <typename T>
     class Add_scalar : public OpT<T>
     {
@@ -63,10 +64,10 @@ namespace deepx::op
         //已验证，2025-02-19，lipeng
         void forward(mem::Mem &mem) override
         {
-            auto a = mem.gettensor<T>(this->args[0]);
-            auto b = mem.getarg<T>(this->args[1]);
-            auto c = mem.gettensor<T>(this->returns[0]);
-            deepx::tensorfunc::add(*a, b, *c);
+            auto A=mem.gettensor<T>(this->args[0]).get();
+            auto b = this->getarg(1,mem);
+            auto C = mem.gettensor<T>(this->returns[0]).get();
+            deepx::tensorfunc::add(*A, b, *C);
         }
         //已验证，2025-02-19，lipeng  
         void backward(mem::Mem &mem) override
@@ -169,16 +170,16 @@ namespace deepx::op
         //已验证，2025-02-19，lipeng
         void forward(mem::Mem &mem) override    
         {
-            auto a = mem.gettensor<T>(this->args[0]).get();
-            auto b = mem.getarg<T>(this->args[1]);
-            auto c = mem.gettensor<T>(this->returns[0]).get();
-            deepx::tensorfunc::mul(*a, b, *c);
+            auto A=mem.gettensor<T>(this->args[0]).get();
+            auto b = this->getarg(1,mem);
+            auto C = mem.gettensor<T>(this->returns[0]).get();
+            deepx::tensorfunc::mul(*A, b, *C);
         }
         //已验证，2025-02-19，lipeng
         void backward(mem::Mem &mem) override
         {
             // 需要用到前向传播的标量输入b
-            auto b = mem.getarg<T>(this->args[1]);  // 获取标量b
+            auto b = this->getarg(1,mem);
             auto a_grad = mem.gettensor<T>(this->args_grad[0]).get();
             auto c_grad = mem.gettensor<T>(this->returns_grad[0]).get();
 
@@ -235,6 +236,7 @@ namespace deepx::op
     };
 
     //Div_scalar之所以不复用Mul_scalar，是防止b接近0时，Mul_scalar(1/b)不稳定
+    //A/b=C
     template <typename T>
     class Div_scalar : public OpT<T>
     {
@@ -251,25 +253,16 @@ namespace deepx::op
         //已验证，2025-02-19，lipeng
         void forward(mem::Mem &mem) override
         {
-            if (mem.existstensor(this->args[0])){
-                //C= A/b
-                auto A = mem.gettensor<T>(this->args[0]).get();
-                auto b = mem.getarg<T>(this->args[1]);
-                auto C = mem.gettensor<T>(this->returns[0]).get();
-                tensorfunc::div_scalar(*A, b, *C);  // 直接使用除法
-            }else{
-                //C=a/B
-                auto a = mem.getarg<T>(this->args[0]);
-                auto B = mem.gettensor<T>(this->args[1]).get();
-                auto C = mem.gettensor<T>(this->returns[0]).get();
-                tensorfunc::div_scalar(a, *B, *C);  // 直接使用除法
-            }          
+            auto A = mem.gettensor<T>(this->args[0]).get();
+            auto b = this->getarg(1,mem);
+            auto C = mem.gettensor<T>(this->returns[0]).get();
+            tensorfunc::div_scalar(*A, b, *C);  // 直接使用除法
         }
 
         //已验证，2025-02-19，lipeng
         void backward(mem::Mem &mem) override
         {
-            auto b = mem.getarg<T>(this->args[1]);  // 获取标量b
+            auto b = this->getarg(1,mem);
             auto a_grad = mem.gettensor<T>(this->args_grad[0]).get();
             auto c_grad = mem.gettensor<T>(this->returns_grad[0]).get();
 
@@ -280,6 +273,53 @@ namespace deepx::op
             // 标量b不需要计算梯度
         }
     };
+ 
+
+    template <typename T>
+    class RDiv_scalar : public OpT<T>
+    {
+    public:
+        RDiv_scalar(){
+            this->init("rdiv_scalar",dtype<T>::name(), {}, {}, false, {}, {});
+        }
+        RDiv_scalar(vector< string> args, vector< string> returns, bool require_grad = false, vector< string> args_grad = {}, vector< string> returns_grad = {}){
+            this->init("rdiv_scalar",dtype<T>::name(), args, returns, require_grad, args_grad, returns_grad);
+        }
+        RDiv_scalar(initializer_list< string> args, initializer_list< string> returns, bool require_grad = false, initializer_list< string> args_grad = {}, initializer_list< string> returns_grad = {}){
+            this->init("rdiv_scalar",dtype<T>::name(), args, returns, require_grad, args_grad, returns_grad);
+        }   
+ 
+        void forward(mem::Mem &mem) override
+        {
+            //C=a/B
+            auto a = this->getarg(0,mem);
+            auto B = mem.gettensor<T>(this->args[1]).get();
+            auto C = mem.gettensor<T>(this->returns[0]).get();
+            tensorfunc::div_scalar(a, *B, *C);  // 直接使用除法
+                
+        }
+
+        //TODO: 未验证
+        void backward(mem::Mem &mem) override
+        {
+            // 需要用到前向传播的输入
+            auto a = this->getarg(0,mem);
+            auto B = mem.gettensor<T>(this->args[1]).get();
+            auto C = mem.gettensor<T>(this->returns[0]).get();  // C = a/B
+            auto B_grad = mem.gettensor<T>(this->args_grad[1]).get();
+            auto C_grad = mem.gettensor<T>(this->returns_grad[0]).get();
+            
+            // 标量除法的反向传播：
+            // 对于 C = a/B
+            // ∂L/∂B = ∂L/∂C * ∂C/∂B = ∂L/∂C * (-a/B²)
+            // = -C_grad * (a/B²) = -C_grad * (C/B)
+            auto temp = mem.temptensor<T>(B->shape.shape).get();
+            deepx::tensorfunc::div(*C, *B, *temp);      // temp = C/B
+            deepx::tensorfunc::muladd(*C_grad, *temp, T(-1), *B_grad, T(1), *B_grad);  // B_grad -= C_grad * temp
+            
+            // 标量a不需要计算梯度
+        }
+    };
 
     template <typename T>
     class Sqrt : public OpT<T>
 
@@ -97,6 +97,10 @@ namespace deepx::op
         opfactory.add_op(Div_scalar<float>());
         opfactory.add_op(Div_scalar<double>());
     }
+    void register_rdiv_scalar(OpFactory &opfactory){
+        opfactory.add_op(RDiv_scalar<float>());
+        opfactory.add_op(RDiv_scalar<double>());
+    }
     void register_sqrt(OpFactory &opfactory){
         opfactory.add_op(Sqrt<float>());
         opfactory.add_op(Sqrt<double>());
@@ -113,6 +117,7 @@ namespace deepx::op
         register_mul_scalar(opfactory);
         register_div(opfactory);
         register_div_scalar(opfactory);
+        register_rdiv_scalar(opfactory);
         register_sqrt(opfactory);
         register_exp(opfactory);
     }
 
@@ -1,23 +1,13 @@
 from .tensor import Tensor,Shape,Device,DeviceType
-from deepx.nn.functional import *
+from deepx.nn.functional import *  # 导入所有functional函数
+from deepx.nn.functional import __all__ as _func_all  # 获取functional的导出列表
+
 __all__ = [
     #tensor
     'Tensor',
     'Shape',
     'Device','DeviceType',
-    #nn.functional
-        #init
-        'full','zeros', 'ones', 'arange', 'rand', 'randn', 'eye',
-        #elementwise
-        "add","sub","mul","div","clamp",
-        #matmul
-        "matmul",
-        #reduce
-        "max","min","sum","prod","mean",
-        #transpose
-        "transpose",
-        #relu
-        "relu",
+    *_func_all
 ]
 
 # 为了支持 import deepx as dx 的用法
 
@@ -1,4 +1,4 @@
-from .elementwise import add,sub,mul,div,clamp
+from .elementwise import *
 from .new import newtensor
 from .print import printtensor
 from .matmul import matmul
@@ -11,7 +11,7 @@
     "newtensor",
     "printtensor",
     "constant","full","zeros","ones","uniform","arange","rand","randn","eye",
-    "add","sub","mul","div","clamp",
+    "add","sub","mul","div","clamp","exp","sqrt","rsqrt",
     "matmul",
     "max","min","sum","prod","mean",
     "transpose","reshape",
 
@@ -9,27 +9,47 @@ def _A_B_elementwiseop_C(
         b: Tensor, 
         op:str=None,
         out:Tensor=None):
-    opnode = a.graph.add_op(op)
+    g=a.graph
+    if g is None:
+       g=b.graph
+
+    opnode = g.add_op(op)
     opnode.add_input(a.node)
     opnode.add_input(b.node)
     out.node.add_input(opnode)
-    if a.graph.eager:
+    if g.eager:
         ir=DeepxIR(op, a.dtype, [a.node.name, b.node.name], [out.node.name])
         send(ir)
 def _A_b_elementwiseop_C(
-        a:Tensor,
-        b: Optional[Union[ float, int]] = None, 
+        a:Optional[Union[ Tensor, float, int]] = None, 
+        b: Optional[Union[ Tensor, float, int]] = None, 
         op:str=None,
         out:Tensor=None):
-    varnode=a.graph.add_var("",b)
-    opnode = a.graph.add_op(op)
-    opnode.add_input(a.node)
-    opnode.add_input(varnode)
+    if isinstance(a,Tensor):
+        g=a.graph
+    else:
+        g=b.graph
+
+    opnode = g.add_op(op)
+    if isinstance(a,Tensor):
+        opnode.add_input(a.node)
+    else:
+        varnode=g.add_var("",a)
+        opnode.add_input(varnode)
+
+    if isinstance(b,Tensor):
+        opnode.add_input(b.node)
+    else:
+        varnode=g.add_var("",b)
+        opnode.add_input(varnode)
+
     out.node.add_input(opnode)
-    if a.graph.eager:
-        varir=DeepxIR("argset", a.dtype, [b], [varnode.name])
-        send(varir)
-        ir=DeepxIR(op, a.dtype, [a.node.name,varnode.name], [out.node.name])
+    if g.eager:
+        ir=None
+        if isinstance(a,Tensor):
+            ir=DeepxIR(op, a.dtype, [a.node.name,b], [out.node.name])
+        else:
+            ir=DeepxIR(op, b.dtype, [a,b.node.name], [out.node.name])
         send(ir)
 #add
 OpNode.register("add")
@@ -75,15 +95,20 @@ def mul(
 #div
 OpNode.register("div")
 OpNode.register("div_scalar")
-
+OpNode.register("rdiv_scalar")
 def div(
         a: Optional[Union[Tensor, float, int]] = None,
         b: Optional[Union[Tensor, float, int]] = None, 
         out:Tensor=None):
     if isinstance(b,Tensor) and isinstance(a,Tensor):
         _A_B_elementwiseop_C(a,b,"div",out)
     else:
-        _A_b_elementwiseop_C(a,b,"div_scalar",out)
+        if isinstance(a,Tensor):
+            #C=A/b
+            _A_b_elementwiseop_C(a,b,"div_scalar",out)
+        else:
+            #C=a/B
+            _A_b_elementwiseop_C(a,b,"rdiv_scalar",out)
 
 
 #clamp
@@ -118,6 +143,30 @@ def exp(
         ir=DeepxIR("exp", a.dtype, [a.node.name], [out.node.name])
         send(ir)
 
+#sqrt
+OpNode.register("sqrt")
+def sqrt(
+        input:Tensor,
+        out:Optional[Tensor]=None)->Tensor:
+    if out is None:
+        out=Tensor(shape=input.shape, dtype=input.dtype, device=input.device)
+    g=input.graph
+    opnode = g.add_op("sqrt")
+    opnode.add_input(input.node)
+    out.node.add_input(opnode)
+    if g.eager:
+        ir=DeepxIR("sqrt", input.dtype, [input.node.name], [out.node.name])
+        send(ir)
+    return out
+
+def rsqrt(
+        input:Tensor,
+        out:Optional[Tensor]=None)->Tensor:
+    if out is None:
+        out=Tensor(shape=input.shape, dtype=input.dtype, device=input.device)
+    out=1/sqrt(input,out)
+    return out
+
 # OpNode.register("ReLU", 101)
 # OpNode.register("Placeholder", 102)
 # OpNode.register("Neg", 103)
Original file line number	Diff line number	Diff line change
`@@ -129,6 +129,10 @@ namespace deepx::mem`
`129`	`129`	`{`
`130`	`130`	`return mem.find(name) != mem.end();`
`131`	`131`	`}`
	`132`	`+ bool existarg(const string &name) const`
	`133`	`+ {`
	`134`	`+ return args.find(name) != args.end();`
	`135`	`+ }`
`132`	`136`
`133`	`137`	`template <typename T>`
`134`	`138`	`shared_ptr<Tensor<T>> gettensor(const string &name) const`
Original file line number	Diff line number	Diff line change
`@@ -72,6 +72,15 @@ namespace deepx::op`
`72`	`72`	`{`
`73`	`73`	`return deepx::dtype<T>::name();`
`74`	`74`	`}`
	`75`	`+ T getarg(int idx,mem::Mem &mem){`
	`76`	`+ auto x = T(0);`
	`77`	`+ if (mem.existarg(this->args[idx])){`
	`78`	`+ x = mem.getarg<T>(this->args[idx]);`
	`79`	`+ }else{`
	`80`	`+ x = T(std::stof(this->args[idx].c_str()));`
	`81`	`+ }`
	`82`	`+ return x;`
	`83`	`+ }`
`75`	`84`	`};`
`76`	`85`	`}`
`77`	`86`	`#endif`