Eigenvalues and Eigenvectors

Derivative of an eigenvalue dependent on a parameter

$H(\alpha)$ $\alpha$ $\lambda_i(\alpha)$ $v_{i}(\alpha)$ $u_{i}(\alpha)$ $\frac{\partial \lambda_i(\alpha)}{\partial \alpha}$ . The naive way to do this is via finite differences:

\begin{matrix} (1) & \frac{\partial λ_{i} (α)}{\partial α} \approx \frac{λ_{i} (α + ϵ) - λ_{i} (α)}{ϵ} \end{matrix}

$i$ th eigenvalue:

\begin{matrix} (2) & u_{i}^{T} H v_{i} = λ_{i} \end{matrix}

$\alpha$ :

\begin{matrix} (3) & \frac{\partial}{\partial α} (u_{i}^{T} H v_{i}) = \frac{\partial u_{i}^{T}}{\partial α} H v_{i} + u_{i}^{T} \frac{\partial H}{\partial α} v_{i} + u_{i}^{T} H \frac{\partial v_{i}}{\partial α} = λ_{i} (\frac{\partial u_{i}^{T}}{\partial α} v_{i} + u_{i}^{T} \frac{\partial v_{i}}{\partial α}) + u_{i}^{T} \frac{\partial H}{\partial α} v_{i} \end{matrix}

$u^T_i v_j = \delta_{ij}$ $\frac{\partial u^T_i}{\partial \alpha} v_i =u^T_i \frac{\partial v_i}{\partial\alpha} = 0$ $d$ $d$ $H$ , and we can just throw away any changes that would bring us off the sphere). So the formula is

\begin{matrix} (4) & \frac{\partial λ_{i}}{\partial α} = \frac{\partial}{\partial α} (u_{i}^{T} H v_{i}) = u_{i}^{T} \frac{\partial H}{\partial α} v_{i} \end{matrix}

$H$ by automatic differentiation.

Degenerate Eigenvalues

$\lambda_i$ $\lambda_j$ $\alpha$ $u_i$ $u_j$ $\frac{\partial u^{T}_{i}}{\partial \alpha}$ $u_j$ . Then we get

\begin{matrix} (5) & \frac{\partial}{\partial α} (u_{i}^{T} H v_{i}) = λ_{i} (\frac{\partial u_{i}^{T}}{\partial α} v_{i} + u_{i}^{T} \frac{\partial v_{i}}{\partial α}) + u_{i}^{T} \frac{\partial H}{\partial α} v_{i} = λ_{i} (g (α) u_{j}^{T} v_{i} + g^{'} (α) u_{i}^{T} v_{j}) + u_{i}^{T} \frac{\partial H}{\partial α} v_{i} \end{matrix}

$g(\alpha)$ $g'(\alpha)$ $u_j$ $v_j$ $u_j$ $u_i$ $v_i$ $v_j$ , respectively.

Eigenvectors

$\lambda_i$ $u_i$ , we differentiate

\begin{aligned} \frac{\partial}{\partial α} (H u_{i} - λ_{i} u_{i}) = (\frac{\partial H}{\partial α} - \frac{\partial λ_{i}}{\partial α} I) u_{i} + (H - λ_{i} I) \frac{\partial u_{i}}{\partial α} & = 0 \\ \Rightarrow \frac{\partial u_{i}}{\partial α} = (H - λ_{i} I)^{- 1} (\frac{\partial H}{\partial α} - \frac{\partial λ_{i}}{\partial α} I) u_{i} \end{aligned}

$H - \lambda_i I$ $u_i$ $\frac{\partial H}{\partial \alpha}$ $(H - \lambda_i I)^{-1}$ is unambiguous. We may use the Moore-Penrose pseudo inverse to write:

\begin{matrix} (6) & \begin{matrix} \frac{\partial u_{i}}{\partial α} = (H - λ_{i} I)^{+} \frac{\partial H}{\partial α} u_{i} \end{matrix} \end{matrix}