|
1 | 1 | --- |
2 | | -title: Resolução de sistemas lineares por Quadrados Mínimos (e Pseudoinversa) |
| 2 | +title: Resolução de sistemas lineares por Quadrados Mínimos |
3 | 3 | --- |
4 | 4 |
|
5 | 5 | ### O Problema de Quadrados Mínimos |
@@ -103,62 +103,7 @@ Uma vez que $Ax=b$ é um **sistema impossível**, as soluções (ou a solução |
103 | 103 |
|
104 | 104 | ### Caso geral e pseudoinversa |
105 | 105 |
|
106 | | -A decomposição SVD de $A$ nos permite construir uma ferramenta para resolver $A^{T}Ax=A^{T}b$ no caso geral, que independe da quantidade de linhas e colunas, assim como do posto de $A$. |
107 | | -
|
108 | | -Começamos definindo a **pseudoinversa** de uma matriz e constatando algumas de suas propriedades. |
109 | | -
|
110 | | -:::{prf:definition} Pseudoinversa de Moore-Penrose |
111 | | -
|
112 | | -Seja $A=U\Sigma V^{T}$. A *pseudoinversa* de $A$ é a matriz: |
113 | | -
|
114 | | -$$ |
115 | | -A^{+}=V\Sigma^{+}U^{T} |
116 | | -$$ |
117 | | -
|
118 | | -Onde $\Sigma^{+}$ é obtida invertendo os valores singulares não nulos de $\Sigma$ (isto é, se $\sigma_{i}\neq 0$ faz-se $\frac{1}{\sigma_{i}}$) e tomando a transposta. |
119 | | -
|
120 | | -::: |
121 | | -
|
122 | | -Para ilustrar melhor como obter ${} \Sigma^{+} {}$, se posto de $A$ é igual a $r$ e seja: |
123 | | -
|
124 | | -$$ |
125 | | -\Sigma = |
126 | | -\begin{bmatrix} |
127 | | -\sigma_1 & & & & \cdots & & 0 \\ |
128 | | - & \sigma_2 & & & \cdots & & 0 \\ |
129 | | - & & \ddots & & & & \vdots \\ |
130 | | - & & & \sigma_r & & & 0 \\ |
131 | | - & & & & 0 & & 0 \\ |
132 | | -\vdots & \vdots & & & \vdots & \ddots & \vdots \\ |
133 | | -0 & 0 & \cdots & & 0 & \cdots & 0 |
134 | | -\end{bmatrix} |
135 | | -$$ |
136 | | -
|
137 | | -A matriz resultante da inversão dos $\sigma_{i}$ ($i=1,\dots,r$) é: |
138 | | -
|
139 | | -$$ |
140 | | -\Sigma' = |
141 | | -\begin{bmatrix} |
142 | | -\frac{1}{\sigma_{1}} & & & & \cdots & & 0 \\ |
143 | | - & \frac{1}{\sigma_{2}} & & & \cdots & & 0 \\ |
144 | | - & & \ddots & & & & \vdots \\ |
145 | | - & & & \frac{1}{\sigma_{r}} & & & 0 \\ |
146 | | - & & & & 0 & & 0 \\ |
147 | | -\vdots & \vdots & & & \vdots & \ddots & \vdots \\ |
148 | | -0 & 0 & \cdots & & 0 & \cdots & 0 |
149 | | -\end{bmatrix} |
150 | | -$$ |
151 | | -
|
152 | | -E então, $\Sigma^{+}=(\Sigma')^{T}$. |
153 | | -
|
154 | | -$A^{+}$ é uma generalização da ideia de inversa para uma matriz qualquer, daí o nome de pseudoinversa. Existem outros tipos de pseudoinversas, esta em específico satisfaz as chamadas **condições de Penrose**: |
155 | | -
|
156 | | -1. $AA^{+}A=A$ |
157 | | -2. $A^{+}AA^{+}=A^{+}$ |
158 | | -3. $(AA^{+})^{T}=AA^{+}$ |
159 | | -4. $(A^{+}A)^{T}=A^{+}A$ |
160 | | -
|
161 | | -Essas condições são verificadas sem muita dificuldade considerando-se a decomposição SVD de $A$ e as propriedades das matrizes $U$, $V$, $\Sigma $ e $\Sigma^{+}$. |
| 106 | +Utilizando a pseudoinversa de Moore-Penrose, dada por [](#def-pseudoinversa), podemos resolver $A^{T}Ax=A^{T}b$ no caso geral, que independe da quantidade de linhas e colunas, assim como do posto de $A$. |
162 | 107 |
|
163 | 108 | :::{prf:theorem} |
164 | 109 | :label: teo-pseudoinversa-postocompleto |
|
234 | 179 | A\bar{x}=A\hat{x}\implies A(\bar{x}-\hat{x})=0 |
235 | 180 | $$ |
236 | 181 |
|
237 | | -O que por sua vez nos dá que $\bar{x}-\hat{x}$ é um vetor do núcleo de $A$. Em particular, seja $z=\bar{x}-\hat{x}$, então todo vetor $\bar{x}$ solução da eq. normal pode ser escrito como $\bar{x}=z+\hat{x}$. Agora, considere a decomposição SVD de $A$. Pela construção que se tem a pseudoinversa, note que o vetor $\hat{x}=A^{+}b$ irá pertencer ao espaço coluna de $A^{T}$. Mas temos que o núcleo de $A$ é ortogonal ao espaço coluna de $A^{T}$, consequentemente $\langle \hat{x} , z \rangle = 0$. |
| 182 | +O que por sua vez nos dá que $\bar{x}-\hat{x}$ é um vetor do núcleo de $A$. Em particular, seja $z=\bar{x}-\hat{x}$, então todo vetor $\bar{x}$ solução da eq. normal pode ser escrito como $\bar{x}=z+\hat{x}$. Agora, considere a decomposição SVD de $A$. Pela construção que tem a pseudoinversa, note que o vetor $\hat{x}=A^{+}b$ irá pertencer ao espaço coluna de $A^{T}$. Mas temos que o núcleo de $A$ é ortogonal ao espaço coluna de $A^{T}$, consequentemente $\langle \hat{x} , z \rangle = 0$. |
238 | 183 |
|
239 | 184 | Assim, temos enfim que: |
240 | 185 |
|
241 | 186 | $$ |
242 | 187 | \lVert \bar{x} \rVert^{2}=\lVert z+\hat{x} \rVert ^{2}=\lVert z \rVert ^{2}+\lVert \hat{x} \rVert ^{2}\geq \lVert \hat{x} \rVert ^{2} |
243 | 188 | $$ |
244 | 189 |
|
245 | | -(veja que a quebra da norma nas duas parcelas é consequência do fato de $\hat{x}$ e $z$ serem ortogonais) |
| 190 | +(veja que a quebra da norma nas duas parcelas é consequência do fato de $\hat{x}$ e $z$ serem ortogonais e [](#teo-pitagoras)) |
246 | 191 |
|
247 | 192 | Donde concluímos que $\lVert \bar{x} \rVert\geq \lVert \hat{x} \rVert$ e teremos a igualdade somente quando $z=0$ e $\bar{x}=\hat{x}$. Portanto, $\hat{x}$ é a solução da equação normal de norma mínima. |
248 | 193 |
|
|
0 commit comments