spectraplex GPU eigendecomposition

spectraplex LMO is `eigen!(Symmetric(...))` over a reshape of an n²-vec to n×n.
O(n³). dominates per-iter cost on PSD-cone problems past n≈100 (75–80% of
per-iter for trace regression at n=200, see `examples/bench_spectraplex_apple.jl`).

`AppleAccelerate` doesn't help — `dsyevd` / `ssyevd` lands within noise of
OpenBLAS at n≤500 on apple silicon. real lever is GPU eigen.

paths:
- [ ] MPS eigensolver on Metal. verify NaN behavior at large n (JuliaGPU/Metal.jl#381).
- [ ] cuSOLVER `syevd` on CUDA.
- [ ] cross-vendor: lanczos via `KernelAbstractions.jl`. FW only needs the
  smallest eigenvector — partial decomp is much cheaper than full.
- [ ] dispatch on n: above some crossover, GPU; below, CPU.
- [ ] crossover benchmark — extend `bench_spectraplex_apple.jl`.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

spectraplex GPU eigendecomposition #52

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

spectraplex GPU eigendecomposition #52

Description

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions