Komplette Eingabedaten auf die GPU transferieren

in #44 (closed) wurden die lokalen Eingabedaten zl und wl noch im Kernel-Lambda gecaptured. Das ist für Element-parallele Ausführung ungeeignet, diese Daten unterscheiden sich ja von Element zu Element.

In diesem Task sollen die z und w am Anfang von GridOperator::nonlinear_jacobian_apply() auf die GPU transferiert werden. Das gatheren von zl aus den transferierten z und wl aus den transferierten w soll dann im Kernel-Lambda vor dem Aufruf von jacobian_apply_volume() passieren.

Blockiert von:

Edited by Dr. Jorrit Fahlke