quda: fixed pack_test bug (missing blas initialization)

git-svn-id: http://lattice.bu.edu/qcdalg/cuda/quda@598 be54200a-260c-0410-bdd7-ce6af2a381ab

quda: fixed pack_test bug (missing blas initialization)
git-svn-id: http://lattice.bu.edu/qcdalg/cuda/quda@598 be54200a-260c-0410-bdd7-ce6af2a381ab
d8c36033 · rbabich · e5f59d3a · d8c36033 · d8c36033 · d8c36033
Commit d8c36033 authored Dec 10, 2009 by rbabich
--- a/include/blas_quda.h
+++ b/include/blas_quda.h
@@ -17,8 +17,8 @@ extern "C" {
  // ---------- blas_quda.cu ----------
  // creates and destroys reduction buffers  
-  void initBlas(); 
+  void initBlas(void); 
-  void endBlas();
+  void endBlas(void);
  void zeroCuda(ParitySpinor a);
  void copyCuda(ParitySpinor dst, ParitySpinor src);

--- a/lib/blas_quda.cu
+++ b/lib/blas_quda.cu
@@ -22,13 +22,13 @@
 #endif
 // These are used for reduction kernels
-QudaSumFloat *d_reduceFloat=0;
+static QudaSumFloat *d_reduceFloat=0;
-QudaSumComplex *d_reduceComplex=0;
+static QudaSumComplex *d_reduceComplex=0;
-QudaSumFloat3 *d_reduceFloat3=0;
+static QudaSumFloat3 *d_reduceFloat3=0;
-QudaSumFloat *h_reduceFloat=0;
+static QudaSumFloat *h_reduceFloat=0;
-QudaSumComplex *h_reduceComplex=0;
+static QudaSumComplex *h_reduceComplex=0;
-QudaSumFloat3 *h_reduceFloat3=0;
+static QudaSumFloat3 *h_reduceFloat3=0;
 unsigned long long blas_quda_flops;
 unsigned long long blas_quda_bytes;
@@ -38,8 +38,8 @@ int blas_threads[3][22];
 // Number of thread blocks for each blas kernel
 int blas_blocks[3][22];
-dim3 blasBlock;
+static dim3 blasBlock;
-dim3 blasGrid;
+static dim3 blasGrid;
 void initBlas(void) {
@@ -85,12 +85,12 @@ void initBlas(void) {
    }
  }
-  // Output from blas_test
+// Output from blas_test
-#include<blas_param.h>
+#include <blas_param.h>
 }
-void endBlas() {
+void endBlas(void) {
  if (d_reduceFloat) cudaFree(d_reduceFloat);
  if (d_reduceComplex) cudaFree(d_reduceComplex);
  if (d_reduceFloat3) cudaFree(d_reduceFloat3);

--- a/lib/interface_quda.cpp
+++ b/lib/interface_quda.cpp
@@ -22,8 +22,6 @@ FullClover cudaCloverSloppy;
 FullClover cudaCloverInvPrecise; // inverted clover term
 FullClover cudaCloverInvSloppy;
-void initBlas(void);
 // define newQudaGaugeParam() and newQudaInvertParam()
 #define INIT_PARAM
 #include "check_params.h"

--- a/tests/pack_test.c
+++ b/tests/pack_test.c
@@ -4,6 +4,7 @@
 #include <quda_internal.h>
 #include <gauge_quda.h>
 #include <spinor_quda.h>
+#include <blas_quda.h>
 #include <util_quda.h>
 #include <test_util.h>
@@ -70,6 +71,7 @@ void init() {
  int dev = 0;
  cudaSetDevice(dev);
+  initBlas();
  param.X[0] /= 2;
  cudaFullSpinor = allocateSpinorField(param.X, param.cuda_prec, sp_pad);