Closed
Milestone
Linearer Löser operiert auf dem Device
Closed nach Zwischenvortrag, wir wollen uns auf PALMA-Benchmarks konzentrieren.
Bisher transferieren wir die Daten am innerhalb der Gridoperator-funktionen auf das Device, und am Ende wieder zurück auf die CPU. Das Bedeutet inbesodere transfers für jede iteration des Linearen Lösers. Wäre es möglich die Daten bloß einmal am anfang des Linearen lösens auf das Device zu transferieren, und am Ende wieder zurück? Der Löser sollte ja bloß gewisse operationen auf den Daten benötigen, wie das anwenden des Operators oder das ausrechnen eines Skalarproduktes.