development/html/kernels_8h_source.html

 //##############################################################################
 //##############################################################################

 #ifndef KERNELS_H
 #define KERNELS_H
 #include<stdio.h>

 __device__ double2 subtract(double2 a, double2 b);

 __device__ double2 add(double2 a, double2 b);

 __device__ double2 pow(double2 a, int b);

 __device__ double2 mult(double2 a, double b);

 __device__ double2 mult(double2 a, double2 b);

 __global__ void make_cufftDoubleComplex(double *in, double2 *out);

 __device__ unsigned int getGid3d3d();

 __device__ unsigned int getBid3d3d();

 __device__ unsigned int getTid3d3d();

 __global__ void is_eq(bool *a, bool *b, bool *ans);

 //##############################################################################
 //##############################################################################

 __device__ double complexMagnitude(double2 in);

 __global__ void complexMultiply(double2 *in1, double2 *in2, double2 *out);

 __host__ __device__ double2 complexMultiply(double2 in1, double2 in2);

 __device__ double2 make_complex(double in, int evolution_type);

 __global__ void complexAbsSum(double2 *in1, double2 *in2, double *out);

 __global__ void complexMagnitude(double2 *in, double *out);

 __device__ double complexMagnitudeSquared(double2 in);

 __global__ void complexMagnitudeSquared(double2 *in, double *out);

 __global__ void complexMagnitudeSquared(double2 *in, double2 *out);

 __device__ double2 conjugate(double2 in);

 __device__ double2 realCompMult(double scalar, double2 comp);

 //##############################################################################
 //##############################################################################

 __global__ void cMult(double2* in1, double2* in2, double2* out);

 __global__ void cMultPhi(double2* in1, double* in2, double2* out);

 __global__ void cMultDensity(double2* in1, double2* in2, double2* out, double dt, double mass, int gstate, double gDenConst);

 __global__ void cMultDensity_ast(EqnNode_gpu *eqn, double2* in, double2* out,
                                  double dx, double dy, double dz, double time,
                                  int e_num, double dt, double mass, int gstate,
                                  double gDenConst);


 __global__ void pinVortex(double2* in1, double2* in2, double2* out);


 __global__ void vecMult(double2 *in, double *factor, double2 *out);

 __global__ void l2_norm(double *in1, double *in2, double *in3, double *out);

 __global__ void l2_norm(double2 *in1, double2 *in2, double2 *in3, double *out);

 __global__ void l2_norm(double *in1, double *in2, double *out);

 __global__ void l2_norm(double2 *in1, double2 *in2, double *out);

 __global__ void scalarDiv(double2* in, double factor, double2* out);

 __global__ void scalarDiv(double* in, double factor, double* out);

 __global__ void scalarMult(double2* in, double factor, double2* out);

 __global__ void scalarPow(double2* in, double param, double2* out);

 __global__ void vecConjugate(double2 *in, double2 *out);

 __global__ void scalarDiv1D(double2*, double2*);

 __global__ void scalarDiv2D(double2*, double2*);

 __global__ void scalarDiv_wfcNorm(double2* in, double dr, double* pSum, double2* out);

 //##############################################################################

 __global__ void reduce(double2* in, double* out);

 __global__ void thread_test(double* input, double* output);

 __global__ void multipass(double2* input, double2* output, int pass);

 __global__ void multipass(double* input, double* output);

 //##############################################################################

 __global__ void angularOp(double omega, double dt, double2* wfc, double* xpyypx, double2* out);

 __global__ void ast_mult(double *array, double *array_out, EqnNode_gpu *eqn,
                          double dx, double dy, double dz, double time,
                          int element_num);
 __global__ void ast_cmult(double2 *array, double2 *array_out, EqnNode_gpu *eqn,
                           double dx, double dy, double dz, double time,
                           int element_num);
 __global__ void ast_op_mult(double2 *array, double2 *array_out,
                             EqnNode_gpu *eqn,
                             double dx, double dy, double dz, double time,
                             int element_num, int evolution_type, double dt);

 __device__ double2 real_ast(double val, double dt);

 __device__ double2 im_ast(double val, double dt);

 __global__ void zeros(bool *in, bool *out);

 __global__ void set_eq(double *in1, double *in2);

 __global__ void energyCalc(double2 *wfc, double2 *op, double dt, double2 *energy, int gnd_state, int op_space, double sqrt_omegaz_mass, double gDenConst);

 inline __device__ double2 braKetMult(double2 in1, double2 in2);


 __global__ void pSum(double* in1, double* output, int pass);


 #endif
complexMagnitude
__device__ double complexMagnitude(double2 in)
Calculates magnitude of complex number. $|a + ib|$.

braKetMult
__device__ double2 braKetMult(double2 in1, double2 in2)
Performs bra-ket state multiplication. Not fully implemented.

wfc
% % % starting wavefunction wfc
Definition: GPE_2d.m:52

conjugate
__device__ double2 conjugate(double2 in)
Returns conjugate of the a complex number.

pow
__device__ double2 pow(double2 a, int b)
power operation for a double2

add
__device__ double2 add(double2 a, double2 b)
addition operation for 2 double2 values

realCompMult
__device__ double2 realCompMult(double scalar, double2 comp)
Multiply real scalar by a complex number.

en.dy
tuple dy
Definition: en.py:60

set_eq
__global__ void set_eq(double *in1, double *in2)
Sets in2 to be equal to in1.

make_complex
__device__ double2 make_complex(double in, int evolution_type)
Transforms field value into operator.

cMultPhi
__global__ void cMultPhi(double2 *in1, double *in2, double2 *out)
Kernel for multiplcation with real array and complex array.

complexAbsSum
__global__ void complexAbsSum(double2 *in1, double2 *in2, double *out)
Sums the absolute value of two complex arrays.

en.dx
tuple dx
Definition: en.py:59

cMultDensity
__global__ void cMultDensity(double2 *in1, double2 *in2, double2 *out, double dt, double mass, int gstate, double gDenConst)
Kernel for complex multiplication with nonlinear density term.

scalarMult
__global__ void scalarMult(double2 *in, double factor, double2 *out)
Complex field scaling and renormalisation. Used mainly post-FFT.

cMult
__global__ void cMult(double2 *in1, double2 *in2, double2 *out)
Kernel for complex multiplication.

time
end % idx is for time
Definition: defectTriangulation.m:51

scalarDiv
__global__ void scalarDiv(double2 *in, double factor, double2 *out)
Complex field scaling and renormalisation. Used mainly post-FFT.

observables.omega
tuple omega
Definition: observables.py:73

reduce
__global__ void reduce(double2 *in, double *out)
Not implemented.

cMultDensity_ast
__global__ void cMultDensity_ast(EqnNode_gpu *eqn, double2 *in, double2 *out, double dx, double dy, double dz, double time, int e_num, double dt, double mass, int gstate, double gDenConst)
Kernel for complex multiplication with nonlinear density term.

scalarDiv_wfcNorm
__global__ void scalarDiv_wfcNorm(double2 *in, double dr, double *pSum, double2 *out)
Used as part of multipass to renormalise the wavefucntion.

getTid3d3d
__device__ unsigned int getTid3d3d()
Indexing of threads in a block on device.

vecConjugate
__global__ void vecConjugate(double2 *in, double2 *out)
Conjugate of double2*.

complexMagnitudeSquared
__device__ double complexMagnitudeSquared(double2 in)
Return the squared magnitude of a complex number. $|(a+{i}b)*(a-{i}b)|$.

ast_cmult
__global__ void ast_cmult(double2 *array, double2 *array_out, EqnNode_gpu *eqn, double dx, double dy, double dz, double time, int element_num)
Complex multiplication of array with AST.

ast_op_mult
__global__ void ast_op_mult(double2 *array, double2 *array_out, EqnNode_gpu *eqn, double dx, double dy, double dz, double time, int element_num, int evolution_type, double dt)
Multiplication of array with AST Operator.

thread_test
__global__ void thread_test(double *input, double *output)
Performs wavefunction renormalisation using parallel summation and applying scalarDiv_wfcNorm.

getBid3d3d
__device__ unsigned int getBid3d3d()
Indexing of blocks on device.

energyCalc
__global__ void energyCalc(double2 *wfc, double2 *op, double dt, double2 *energy, int gnd_state, int op_space, double sqrt_omegaz_mass, double gDenConst)
Calculates energy of the current state during evolution. Not implemented.

subtract
__device__ double2 subtract(double2 a, double2 b)
subtraction operation for 2 double2 values

EqnNode_gpu
Struct to hold the node information for the AST on the GPU.
Definition: ds.h:71

scalarPow
__global__ void scalarPow(double2 *in, double param, double2 *out)
Complex field raised to a power.

make_cufftDoubleComplex
__global__ void make_cufftDoubleComplex(double *in, double2 *out)
transforms an array of doubles into double2&#39;s

a
tic for a
Definition: GPE_2d.m:90

scalarDiv2D
__global__ void scalarDiv2D(double2 *, double2 *)
Complex field scaling and renormalisation. Not implemented. Use scalarDiv.

l2_norm
__global__ void l2_norm(double *in1, double *in2, double *in3, double *out)
performs the l2 normalization of the provided terms

vort.val
int val
Definition: vort.py:104

im_ast
__device__ double2 im_ast(double val, double dt)
Function to find AST operator in imaginary-time.

angularOp
__global__ void angularOp(double omega, double dt, double2 *wfc, double *xpyypx, double2 *out)
Calculates angular momentum. Not fully implemented. Handled in post-processing instead.

is_eq
__global__ void is_eq(bool *a, bool *b, bool *ans)
checks to arrays to see if they are equal

getGid3d3d
__device__ unsigned int getGid3d3d()
Indexing of threads on grid.

en.dt
tuple dt
Definition: en.py:61

multipass
__global__ void multipass(double2 *input, double2 *output, int pass)
Performs wavefunction renormalisation using parallel summation and applying scalarDiv_wfcNorm.

real_ast
__device__ double2 real_ast(double val, double dt)
Function to find AST operator in real-time.

mult
__device__ double2 mult(double2 a, double b)
multiplication operation for double2 and double values

pinVortex
__global__ void pinVortex(double2 *in1, double2 *in2, double2 *out)
Hold vortex at specified position. Not implemented. cMultPhi should implement required functionality...

pSum
__global__ void pSum(double *in1, double *output, int pass)
Performs parallel sum. Not verified. I use multipass instead.

zeros
__global__ void zeros(bool *in, bool *out)
Sets boolean array to 0.

ast_mult
__global__ void ast_mult(double *array, double *array_out, EqnNode_gpu *eqn, double dx, double dy, double dz, double time, int element_num)
Multiplication of array with AST.

complexMultiply
__global__ void complexMultiply(double2 *in1, double2 *in2, double2 *out)
Complex multiplication of two input arrays.

vecMult
__global__ void vecMult(double2 *in, double *factor, double2 *out)
Complex field scaling and renormalisation. Used mainly post-FFT.

observables.mass
tuple mass
Definition: observables.py:72

scalarDiv1D
__global__ void scalarDiv1D(double2 *, double2 *)
Complex field scaling and renormalisation. Not implemented. Use scalarDiv.