From 0ee1efefbfc0e35967b7f331c8337e17945108fa Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 11:16:54 -0400
Subject: [PATCH 01/15] Implemented CPU scan and stream compaction

---
 stream_compaction/cpu.cu | 34 +++++++++++++++++++++++++++++++---
 1 file changed, 31 insertions(+), 3 deletions(-)
diff --git a/stream_compaction/cpu.cu b/stream_compaction/cpu.cu
index e600c29..0b46006 100644
--- a/stream_compaction/cpu.cu
+++ b/stream_compaction/cpu.cu
@@ -1,5 +1,6 @@
 #include <cstdio>
 #include "cpu.h"
+#include <cstring>
 
 namespace StreamCompaction {
 namespace CPU {
@@ -9,7 +10,10 @@ namespace CPU {
  */
 void scan(int n, int *odata, const int *idata) {
     // TODO
-    printf("TODO\n");
+    odata[0] = 0;
+    for (int i = 1; i < n; ++i) {
+      odata[i] = odata[i - 1] + idata[i - 1];
+    }
 }
 
 /**
@@ -19,7 +23,13 @@ void scan(int n, int *odata, const int *idata) {
  */
 int compactWithoutScan(int n, int *odata, const int *idata) {
     // TODO
-    return -1;
+  int oIndex = 0;
+  for (int iIndex = 0; iIndex < n; ++iIndex) {
+    if (idata[iIndex] != 0) {
+      odata[oIndex++] = idata[iIndex];
+    }
+  }
+  return oIndex;
 }
 
 /**
@@ -29,7 +39,25 @@ int compactWithoutScan(int n, int *odata, const int *idata) {
  */
 int compactWithScan(int n, int *odata, const int *idata) {
     // TODO
-    return -1;
+    memset(odata, 0, n);
+    for (int i = 0; i < n; ++i) {
+      if (idata[i] != 0) {
+        odata[i] = 1;
+      }
+    }
+    int* scanResult = new int[n];
+    scan(n, scanResult, odata);
+
+    int remainingNumberOfElements = 0;
+    for (int i = 0; i < n; ++i) {
+      if (odata[i] == 1) {
+        odata[scanResult[i]] = idata[i];
+        remainingNumberOfElements = scanResult[i] + 1;
+      }
+    }
+
+    delete[] scanResult;
+    return remainingNumberOfElements;
 }
 
 }

From 32b257f22a051d06d0d97b52da45cab12fdc49bc Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 14:14:51 -0400
Subject: [PATCH 02/15] Implemented naive GPU scan

---
 stream_compaction/naive.cu | 86 +++++++++++++++++++++++++++++++++++++-
 1 file changed, 85 insertions(+), 1 deletion(-)

diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 3d86b60..7a7e33d 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -3,17 +3,101 @@
 #include "common.h"
 #include "naive.h"
 
+//#define DEBUG
+#define BLOCK_SIZE 128
+#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
+
 namespace StreamCompaction {
 namespace Naive {
 
 // TODO: __global__
 
+__global__ void inclusiveToExclusiveScan(int n, int* odata, const int* idata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+
+  if (tid == 0) {
+    odata[0] = 0;
+    return;
+  }
+
+  odata[tid] = idata[tid - 1];
+}
+
+__global__ void naiveScan(int n, int offset, int* odata, const int *idata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+  if (tid >= offset) {
+    odata[tid] = idata[tid - offset] + idata[tid] ;
+  } else {
+    odata[tid] = idata[tid];
+  }
+}
+
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
 void scan(int n, int *odata, const int *idata) {
     // TODO
-    printf("TODO\n");
+
+  int* dev_odata1;
+  int* dev_odata2;
+
+  cudaMalloc((void**)&dev_odata1, n * sizeof(int));
+  cudaMalloc((void**)&dev_odata2, n * sizeof(int));
+
+  cudaMemcpy(dev_odata1, idata, n * sizeof(int), cudaMemcpyHostToDevice);
+  cudaMemcpy(dev_odata2, idata, n * sizeof(int), cudaMemcpyHostToDevice);
+#ifdef DEBUG
+  int* temp = new int[5];
+#endif
+
+  int height = ilog2ceil(n);
+  //height = 2;
+  for (int level = 1; level <= height; ++level) {
+    int offset = pow(2, level - 1);
+    naiveScan << <BLOCK_COUNT(n), BLOCK_SIZE >> >(
+      n, 
+      offset, 
+      (level % 2) == 0 ? dev_odata1 : dev_odata2, 
+      (level % 2) == 0 ? dev_odata2 : dev_odata1
+        );
+
+#ifdef DEBUG
+    printf("----\n");
+    cudaMemcpy(temp, dev_odata1, 5 * sizeof(int), cudaMemcpyDeviceToHost);
+    for (int j = 0; j < 5; ++j) {
+      printf("offset: %d, odata1[k]: %d\n", offset, temp[j]);
+    }
+    printf("\n");
+    cudaMemcpy(temp, dev_odata2, 5 * sizeof(int), cudaMemcpyDeviceToHost);
+    for (int j = 0; j < 5; ++j) {
+      printf("offset: %d, odata2[k]: %d\n", offset, temp[j]);
+    }
+#endif
+
+  }
+
+  if (height % 2 == 0) {
+    inclusiveToExclusiveScan<<<BLOCK_COUNT(n), BLOCK_SIZE>>>(n, dev_odata2, dev_odata1);
+    cudaMemcpy(odata, dev_odata2, n * sizeof(int), cudaMemcpyDeviceToHost);
+  } else {
+    inclusiveToExclusiveScan << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata1, dev_odata2);
+    cudaMemcpy(odata, dev_odata1, n * sizeof(int), cudaMemcpyDeviceToHost);
+  }
+
+  odata[0] = 0;
+
+#ifdef DEBUG
+  delete[] temp;
+#endif
+
+  cudaFree(dev_odata1);
+  cudaFree(dev_odata2);
 }
 
 }

From af6eccc9b3fbcbc62270c7bab3d30dc0424e8d82 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 20:15:14 -0400
Subject: [PATCH 03/15] Implemented work-efficient scan

---
 stream_compaction/efficient.cu | 54 +++++++++++++++++++++++++++++++++-
 1 file changed, 53 insertions(+), 1 deletion(-)

diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index b2f739b..5457cd0 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -3,17 +3,69 @@
 #include "common.h"
 #include "efficient.h"
 
+#define BLOCK_SIZE 128
+#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
+
 namespace StreamCompaction {
 namespace Efficient {
 
 // TODO: __global__
 
+__global__ void upsweep(int n, int level, int* odata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+
+  int twoToLevel = powf(2, level);
+  int twoToLevelPlusOne = powf(2, level + 1);
+  if (tid % twoToLevelPlusOne == 0) {
+    odata[tid + twoToLevelPlusOne - 1] += odata[tid + twoToLevel - 1];
+  }
+}
+
+__global__ void downsweep(int n, int level, int* odata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+  int twoToLevel = powf(2, level);
+  int twoToLevelPlusOne = powf(2, level + 1);
+
+  if (tid % twoToLevelPlusOne == 0) {
+    int t = odata[tid + twoToLevel - 1];
+    odata[tid + twoToLevel - 1] = odata[tid + twoToLevelPlusOne - 1];
+    odata[tid + twoToLevelPlusOne - 1] += t;
+  }
+}
+
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
 void scan(int n, int *odata, const int *idata) {
     // TODO
-    printf("TODO\n");
+  int* dev_odata;
+
+  int height = ilog2ceil(n);
+
+  int ceilPower2 = pow(2, height);
+  cudaMalloc((void**)&dev_odata, ceilPower2 * sizeof(int));
+  cudaMemset(dev_odata, 0, ceilPower2 * sizeof(int));
+  cudaMemcpy(dev_odata, idata, n * sizeof(int), cudaMemcpyHostToDevice);
+
+  for (int level = 0; level < height; ++level) {
+    upsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
+  }
+
+  cudaMemset(dev_odata + (ceilPower2 - 1), 0, sizeof(int));
+
+  for (int level = height - 1; level >= 0; --level) {
+    downsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
+  }
+
+  cudaMemcpy(odata, dev_odata, n * sizeof(int), cudaMemcpyDeviceToHost);
+
+  cudaFree(dev_odata);
 }
 
 /**

From 6b1fd30b0a35a38ff3215b99432b9a66ae204c3d Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 20:16:39 -0400
Subject: [PATCH 04/15] Implemen thrust scan

---
 stream_compaction/thrust.cu | 8 ++++++++
 1 file changed, 8 insertions(+)

diff --git a/stream_compaction/thrust.cu b/stream_compaction/thrust.cu
index d8dbb32..16bbd17 100644
--- a/stream_compaction/thrust.cu
+++ b/stream_compaction/thrust.cu
@@ -16,6 +16,14 @@ void scan(int n, int *odata, const int *idata) {
     // TODO use `thrust::exclusive_scan`
     // example: for device_vectors dv_in and dv_out:
     // thrust::exclusive_scan(dv_in.begin(), dv_in.end(), dv_out.begin());
+
+  // Convert to device vector
+  thrust::device_vector<int> dev_idata(idata, idata + n);
+  thrust::device_vector<int> dev_odata(odata, odata + n);
+  thrust::exclusive_scan(dev_idata.begin(), dev_idata.end(), dev_odata.begin());
+
+  thrust::host_vector<int> host_odata = dev_odata;
+  cudaMemcpy(odata, host_odata.data(), n * sizeof(int), cudaMemcpyHostToHost);
 }
 
 }

From 6d83f44d01fbc2fd7ff2d48f3ebf4313532a75eb Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 20:31:58 -0400
Subject: [PATCH 05/15] Moved inclusive to exclusive scan result conversion
 kernel to common.cu

---
 stream_compaction/common.cu | 20 ++++++++++++++++++
 stream_compaction/common.h  |  2 ++
 stream_compaction/naive.cu  | 42 ++-----------------------------------
 3 files changed, 24 insertions(+), 40 deletions(-)

diff --git a/stream_compaction/common.cu b/stream_compaction/common.cu
index fe872d4..2026069 100644
--- a/stream_compaction/common.cu
+++ b/stream_compaction/common.cu
@@ -18,6 +18,26 @@ void checkCUDAErrorFn(const char *msg, const char *file, int line) {
 namespace StreamCompaction {
 namespace Common {
 
+  /**
+   * Convert an inclusice scan result to an exclusive scan result
+   *
+   */
+__global__ void inclusiveToExclusiveScanResult(int n, int* odata, const int* idata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+
+  if (tid == 0) {
+    odata[0] = 0;
+    return;
+  }
+
+  odata[tid] = idata[tid - 1];
+}
+
+
+
 /**
  * Maps an array to an array of 0s and 1s for stream compaction. Elements
  * which map to 0 will be removed, and elements which map to 1 will be kept.
diff --git a/stream_compaction/common.h b/stream_compaction/common.h
index 4f52663..7b55c66 100644
--- a/stream_compaction/common.h
+++ b/stream_compaction/common.h
@@ -27,6 +27,8 @@ inline int ilog2ceil(int x) {
 
 namespace StreamCompaction {
 namespace Common {
+    __global__ void inclusiveToExclusiveScanResult(int n, int* odata, const int* idata);
+
     __global__ void kernMapToBoolean(int n, int *bools, const int *idata);
 
     __global__ void kernScatter(int n, int *odata,
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 7a7e33d..3d9b7d0 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -3,7 +3,6 @@
 #include "common.h"
 #include "naive.h"
 
-//#define DEBUG
 #define BLOCK_SIZE 128
 #define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
 
@@ -12,20 +11,6 @@ namespace Naive {
 
 // TODO: __global__
 
-__global__ void inclusiveToExclusiveScan(int n, int* odata, const int* idata) {
-  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
-  if (tid >= n) {
-    return;
-  }
-
-  if (tid == 0) {
-    odata[0] = 0;
-    return;
-  }
-
-  odata[tid] = idata[tid - 1];
-}
-
 __global__ void naiveScan(int n, int offset, int* odata, const int *idata) {
   int tid = threadIdx.x + (blockIdx.x * blockDim.x);
   if (tid >= n) {
@@ -52,9 +37,6 @@ void scan(int n, int *odata, const int *idata) {
 
   cudaMemcpy(dev_odata1, idata, n * sizeof(int), cudaMemcpyHostToDevice);
   cudaMemcpy(dev_odata2, idata, n * sizeof(int), cudaMemcpyHostToDevice);
-#ifdef DEBUG
-  int* temp = new int[5];
-#endif
 
   int height = ilog2ceil(n);
   //height = 2;
@@ -66,36 +48,16 @@ void scan(int n, int *odata, const int *idata) {
       (level % 2) == 0 ? dev_odata1 : dev_odata2, 
       (level % 2) == 0 ? dev_odata2 : dev_odata1
         );
-
-#ifdef DEBUG
-    printf("----\n");
-    cudaMemcpy(temp, dev_odata1, 5 * sizeof(int), cudaMemcpyDeviceToHost);
-    for (int j = 0; j < 5; ++j) {
-      printf("offset: %d, odata1[k]: %d\n", offset, temp[j]);
-    }
-    printf("\n");
-    cudaMemcpy(temp, dev_odata2, 5 * sizeof(int), cudaMemcpyDeviceToHost);
-    for (int j = 0; j < 5; ++j) {
-      printf("offset: %d, odata2[k]: %d\n", offset, temp[j]);
-    }
-#endif
-
   }
 
   if (height % 2 == 0) {
-    inclusiveToExclusiveScan<<<BLOCK_COUNT(n), BLOCK_SIZE>>>(n, dev_odata2, dev_odata1);
+    Common::inclusiveToExclusiveScanResult << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata2, dev_odata1);
     cudaMemcpy(odata, dev_odata2, n * sizeof(int), cudaMemcpyDeviceToHost);
   } else {
-    inclusiveToExclusiveScan << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata1, dev_odata2);
+    Common::inclusiveToExclusiveScanResult << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata1, dev_odata2);
     cudaMemcpy(odata, dev_odata1, n * sizeof(int), cudaMemcpyDeviceToHost);
   }
 
-  odata[0] = 0;
-
-#ifdef DEBUG
-  delete[] temp;
-#endif
-
   cudaFree(dev_odata1);
   cudaFree(dev_odata2);
 }

From d7c2ca54eb59e607679eea2e8153a1d9a561eba3 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 20 Sep 2016 20:38:37 -0400
Subject: [PATCH 06/15] Moved #define BLOCK_SIZE and BLOCK_COUNT to common.h

---
 stream_compaction/common.h     | 4 ++++
 stream_compaction/efficient.cu | 3 ---
 stream_compaction/naive.cu     | 3 ---
 3 files changed, 4 insertions(+), 6 deletions(-)

diff --git a/stream_compaction/common.h b/stream_compaction/common.h
index 7b55c66..cdeee04 100644
--- a/stream_compaction/common.h
+++ b/stream_compaction/common.h
@@ -7,6 +7,10 @@
 #define FILENAME (strrchr(__FILE__, '/') ? strrchr(__FILE__, '/') + 1 : __FILE__)
 #define checkCUDAError(msg) checkCUDAErrorFn(msg, FILENAME, __LINE__)
 
+#define BLOCK_SIZE 128
+#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
+
+
 /**
  * Check for CUDA errors; print and exit if there was a problem.
  */
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index 5457cd0..0e7f5b8 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -3,9 +3,6 @@
 #include "common.h"
 #include "efficient.h"
 
-#define BLOCK_SIZE 128
-#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
-
 namespace StreamCompaction {
 namespace Efficient {
 
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 3d9b7d0..3d29d2c 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -3,9 +3,6 @@
 #include "common.h"
 #include "naive.h"
 
-#define BLOCK_SIZE 128
-#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
-
 namespace StreamCompaction {
 namespace Naive {
 

From bb454063b98ea5f6981ca74bd825c2bbc6b6d6b0 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Fri, 23 Sep 2016 21:44:46 -0400
Subject: [PATCH 07/15] Cleaned up codes for work-efficient stream compaction

---
 stream_compaction/common.cu    | 43 +++++++++++++++-
 stream_compaction/common.h     |  3 ++
 stream_compaction/efficient.cu | 90 +++++++++++++++++++++++++++-------
 3 files changed, 118 insertions(+), 18 deletions(-)

diff --git a/stream_compaction/common.cu b/stream_compaction/common.cu
index 2026069..cf8450a 100644
--- a/stream_compaction/common.cu
+++ b/stream_compaction/common.cu
@@ -14,6 +14,34 @@ void checkCUDAErrorFn(const char *msg, const char *file, int line) {
     exit(EXIT_FAILURE);
 }
 
+/* Max reduction is really just the partial sum upsweep algorithm */
+__global__ void maxReduction(int n, int level, int* odata) {
+  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
+  if (tid >= n) {
+    return;
+  }
+  
+  int twoToLevel = powf(2, level);
+  int twoToLevelPlusOne = powf(2, level + 1);
+  if (tid % twoToLevelPlusOne == 0) {
+    odata[tid + twoToLevelPlusOne - 1] = imax(odata[tid + twoToLevel - 1], odata[tid + twoToLevelPlusOne - 1]);
+  }
+}
+
+int findMaxInDeviceArray(int n, int *dev_idata) {
+
+  int height = ilog2ceil(n);
+
+
+  for (int level = 0; level < height; ++level) {
+	  maxReduction << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, level, dev_idata);
+  }
+
+  int maxValue = 0;
+  cudaMemcpy(&maxValue, dev_idata + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
+
+  return maxValue;
+}
 
 namespace StreamCompaction {
 namespace Common {
@@ -43,7 +71,12 @@ __global__ void inclusiveToExclusiveScanResult(int n, int* odata, const int* ida
  * which map to 0 will be removed, and elements which map to 1 will be kept.
  */
 __global__ void kernMapToBoolean(int n, int *bools, const int *idata) {
-    // TODO
+  int tid = threadIdx.x + blockDim.x * blockIdx.x;
+  if (tid >= n) {
+    return;
+  }
+
+  bools[tid] = (bool)idata[tid];
 }
 
 /**
@@ -53,6 +86,14 @@ __global__ void kernMapToBoolean(int n, int *bools, const int *idata) {
 __global__ void kernScatter(int n, int *odata,
         const int *idata, const int *bools, const int *indices) {
     // TODO
+  int tid = threadIdx.x + blockDim.x * blockIdx.x;
+  if (tid >= n) {
+    return;
+  }
+
+  if (bools[tid] == 1) {
+    odata[indices[tid]] = idata[tid];
+  }
 }
 
 }
diff --git a/stream_compaction/common.h b/stream_compaction/common.h
index cdeee04..35fb581 100644
--- a/stream_compaction/common.h
+++ b/stream_compaction/common.h
@@ -10,6 +10,7 @@
 #define BLOCK_SIZE 128
 #define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
 
+#define imax(a, b) (((a) > (b)) ? (a) : (b))
 
 /**
  * Check for CUDA errors; print and exit if there was a problem.
@@ -28,6 +29,8 @@ inline int ilog2ceil(int x) {
     return ilog2(x - 1) + 1;
 }
 
+int findMaxInDeviceArray(int n, int *idata);
+
 
 namespace StreamCompaction {
 namespace Common {
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index 0e7f5b8..e0ccc15 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -14,8 +14,8 @@ __global__ void upsweep(int n, int level, int* odata) {
     return;
   }
 
-  int twoToLevel = powf(2, level);
-  int twoToLevelPlusOne = powf(2, level + 1);
+  int twoToLevel = 1 << level;
+  int twoToLevelPlusOne = 1 << (level + 1);
   if (tid % twoToLevelPlusOne == 0) {
     odata[tid + twoToLevelPlusOne - 1] += odata[tid + twoToLevel - 1];
   }
@@ -26,8 +26,8 @@ __global__ void downsweep(int n, int level, int* odata) {
   if (tid >= n) {
     return;
   }
-  int twoToLevel = powf(2, level);
-  int twoToLevelPlusOne = powf(2, level + 1);
+  int twoToLevel = 1 << level;
+  int twoToLevelPlusOne = 1 << (level + 1);
 
   if (tid % twoToLevelPlusOne == 0) {
     int t = odata[tid + twoToLevel - 1];
@@ -36,30 +36,50 @@ __global__ void downsweep(int n, int level, int* odata) {
   }
 }
 
+// Should only be launched with 1 thread?
+__global__ void remainingElementsCountForCompact(const int boolIndex, int* dev_indices, const int* dev_bools, int* remainingElementsCount) {
+	*remainingElementsCount = dev_bools[boolIndex] == 1 ? boolIndex : boolIndex;
+}
+
+void deviceScan(int n, int* dev_odata) {
+
+	int height = ilog2ceil(n); 
+	int ceilPower2 = 1 << height;
+
+	for (int level = 0; level < height; ++level) {
+		upsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
+		cudaThreadSynchronize();
+	}
+
+	// Set the root to zero
+	cudaMemset(dev_odata + (ceilPower2 - 1), 0, sizeof(int));
+
+	// Downsweep
+	for (int level = height - 1; level >= 0; --level) {
+		downsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
+		cudaThreadSynchronize();
+	}
+}
+
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
 void scan(int n, int *odata, const int *idata) {
     // TODO
   int* dev_odata;
-
   int height = ilog2ceil(n);
-
-  int ceilPower2 = pow(2, height);
+  int ceilPower2 = 1 << height;
   cudaMalloc((void**)&dev_odata, ceilPower2 * sizeof(int));
+  
+	// Reset to zeros
   cudaMemset(dev_odata, 0, ceilPower2 * sizeof(int));
-  cudaMemcpy(dev_odata, idata, n * sizeof(int), cudaMemcpyHostToDevice);
 
-  for (int level = 0; level < height; ++level) {
-    upsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
-  }
+  // Copy idata to device memory
+  cudaMemcpy(dev_odata, idata, n * sizeof(int), cudaMemcpyHostToDevice);
 
-  cudaMemset(dev_odata + (ceilPower2 - 1), 0, sizeof(int));
-
-  for (int level = height - 1; level >= 0; --level) {
-    downsweep << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, level, dev_odata);
-  }
+  deviceScan(n, dev_odata);
 
+  // Transfer data back to host
   cudaMemcpy(odata, dev_odata, n * sizeof(int), cudaMemcpyDeviceToHost);
 
   cudaFree(dev_odata);
@@ -76,7 +96,43 @@ void scan(int n, int *odata, const int *idata) {
  */
 int compact(int n, int *odata, const int *idata) {
     // TODO
-    return -1;
+    
+  int height = ilog2ceil(n);
+  int ceilPower2 = 1 << height;
+  int *dev_bools, *dev_indices, *dev_odata, *dev_idata;
+  cudaMalloc((void**)&dev_bools, sizeof(int) * ceilPower2);
+  cudaMalloc((void**)&dev_idata, sizeof(int) * ceilPower2);
+  cudaMalloc((void**)&dev_indices, sizeof(int) * ceilPower2);
+  cudaMalloc((void**)&dev_odata, sizeof(int) * ceilPower2);
+
+  // Transfer idata from host to device
+  cudaMemcpy(dev_idata, idata, sizeof(int) * n, cudaMemcpyHostToDevice);
+
+  // Set all non-zeros to 1s and zeros to 0s. This is our pass condition for an element to remain/discard after compaction
+  Common::kernMapToBoolean << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, dev_bools, dev_idata);
+  
+  // Compute indices of the out compacted stream
+  // Reset to zeros
+  cudaMemset(dev_indices, 0, ceilPower2 * sizeof(int));
+  // Copy dev_bools to dev_indices to device memory
+  cudaMemcpy(dev_indices, dev_bools, n * sizeof(int), cudaMemcpyDeviceToDevice);
+  StreamCompaction::Efficient::deviceScan(ceilPower2, dev_indices);
+
+  // Move elements that are not discarded into appropriate slots based on scan result
+  Common::kernScatter << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, dev_odata, dev_idata, dev_bools, dev_indices);
+
+  // Transfer output back to host
+  cudaMemcpy(odata, dev_odata, sizeof(int) * n, cudaMemcpyDeviceToHost);
+
+  // The max value of all the valid indices for the compacted stream is the number of remaining elements
+  int remainingElementsCount = findMaxInDeviceArray(ceilPower2, dev_indices);
+
+  // Cleanup
+  cudaFree(dev_idata);
+  cudaFree(dev_indices);
+  cudaFree(dev_odata);
+
+  return remainingElementsCount;
 }
 
 }

From 5125f043ca384921e78304a52bf18ece2db5c275 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Sun, 25 Sep 2016 18:46:00 -0400
Subject: [PATCH 08/15] Adding profiling code

---
 src/main.cpp                        | 111 ++++++++++++++++++++++------
 stream_compaction/CMakeLists.txt    |   3 +-
 stream_compaction/common.h          |   8 +-
 stream_compaction/efficient.cu      |  60 +++++++++++++--
 stream_compaction/naive.cu          |  19 ++++-
 stream_compaction/profilingcommon.h |  10 +++
 stream_compaction/thrust.cu         |  13 ++++
 7 files changed, 189 insertions(+), 35 deletions(-)
 create mode 100644 stream_compaction/profilingcommon.h

diff --git a/src/main.cpp b/src/main.cpp
index 675da35..337acde 100644
--- a/src/main.cpp
+++ b/src/main.cpp
@@ -11,12 +11,21 @@
 #include <stream_compaction/naive.h>
 #include <stream_compaction/efficient.h>
 #include <stream_compaction/thrust.h>
+#include <iostream>
 #include "testing_helpers.hpp"
+#include <stream_compaction/profilingcommon.h>
 
 int main(int argc, char* argv[]) {
-    const int SIZE = 1 << 8;
-    const int NPOT = SIZE - 3;
-    int a[SIZE], b[SIZE], c[SIZE];
+    const int SIZE = 1 << 10;
+    const int NPOT = SIZE - 5;
+	int* a = new int[SIZE];
+	int* b = new int[SIZE];
+	int* c = new int[SIZE];
+
+#ifdef PROFILE
+	printDesc("PROFILING ON");
+	printf("\n\n");
+#endif
 
     // Scan tests
 
@@ -27,17 +36,41 @@ int main(int argc, char* argv[]) {
 
     genArray(SIZE - 1, a, 50);  // Leave a 0 at the end to test that edge case
     a[SIZE - 1] = 0;
-    printArray(SIZE, a, true);
+    //printArray(SIZE, a, true);
 
-    zeroArray(SIZE, b);
+    zeroArray(SIZE, b); 
     printDesc("cpu scan, power-of-two");
-    StreamCompaction::CPU::scan(SIZE, b, a);
-    printArray(SIZE, b, true);
+
+#ifdef PROFILE
+	auto begin = std::chrono::high_resolution_clock::now();
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+
+		StreamCompaction::CPU::scan(SIZE, b, a);
+
+#ifdef PROFILE
+	}
+	auto end = std::chrono::high_resolution_clock::now();
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin)/PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+
+	//printArray(SIZE, b, true);
 
     zeroArray(SIZE, c);
     printDesc("cpu scan, non-power-of-two");
-    StreamCompaction::CPU::scan(NPOT, c, a);
-    printArray(NPOT, b, true);
+
+#ifdef PROFILE
+	begin = std::chrono::high_resolution_clock::now();
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+		StreamCompaction::CPU::scan(NPOT, c, a);
+#ifdef PROFILE
+	}
+	end = std::chrono::high_resolution_clock::now();
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+	
+	//printArray(NPOT, b, true);
     printCmpResult(NPOT, b, c);
 
     zeroArray(SIZE, c);
@@ -66,14 +99,14 @@ int main(int argc, char* argv[]) {
 
     zeroArray(SIZE, c);
     printDesc("thrust scan, power-of-two");
-    StreamCompaction::Thrust::scan(SIZE, c, a);
-    //printArray(SIZE, c, true);
+	StreamCompaction::Thrust::scan(SIZE, c, a);
+	//printArray(SIZE, c, true);
     printCmpResult(SIZE, b, c);
 
     zeroArray(SIZE, c);
     printDesc("thrust scan, non-power-of-two");
-    StreamCompaction::Thrust::scan(NPOT, c, a);
-    //printArray(NPOT, c, true);
+	StreamCompaction::Thrust::scan(NPOT, c, a);
+	//printArray(NPOT, c, true);
     printCmpResult(NPOT, b, c);
 
     printf("\n");
@@ -85,28 +118,55 @@ int main(int argc, char* argv[]) {
 
     genArray(SIZE - 1, a, 4);  // Leave a 0 at the end to test that edge case
     a[SIZE - 1] = 0;
-    printArray(SIZE, a, true);
+    //printArray(SIZE, a, true);
 
-    int count, expectedCount, expectedNPOT;
+    int count = 0, expectedCount, expectedNPOT;
 
     zeroArray(SIZE, b);
     printDesc("cpu compact without scan, power-of-two");
-    count = StreamCompaction::CPU::compactWithoutScan(SIZE, b, a);
-    expectedCount = count;
-    printArray(count, b, true);
+#ifdef PROFILE
+	begin = std::chrono::high_resolution_clock::now();
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+		count = StreamCompaction::CPU::compactWithoutScan(SIZE, b, a);
+#ifdef PROFILE
+	}
+	end = std::chrono::high_resolution_clock::now();
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+	expectedCount = count;
+    //printArray(count, b, true);
     printCmpLenResult(count, expectedCount, b, b);
 
     zeroArray(SIZE, c);
     printDesc("cpu compact without scan, non-power-of-two");
-    count = StreamCompaction::CPU::compactWithoutScan(NPOT, c, a);
-    expectedNPOT = count;
-    printArray(count, c, true);
+#ifdef PROFILE
+	begin = std::chrono::high_resolution_clock::now();
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+		count = StreamCompaction::CPU::compactWithoutScan(NPOT, c, a);
+#ifdef PROFILE
+	}
+	end = std::chrono::high_resolution_clock::now();
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+	expectedNPOT = count;
+    //printArray(count, c, true);
     printCmpLenResult(count, expectedNPOT, b, c);
 
     zeroArray(SIZE, c);
     printDesc("cpu compact with scan");
-    count = StreamCompaction::CPU::compactWithScan(SIZE, c, a);
-    printArray(count, c, true);
+#ifdef PROFILE
+	begin = std::chrono::high_resolution_clock::now();
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+		count = StreamCompaction::CPU::compactWithScan(SIZE, c, a);
+#ifdef PROFILE
+	}
+	end = std::chrono::high_resolution_clock::now();
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+	//printArray(count, c, true);
     printCmpLenResult(count, expectedCount, b, c);
 
     zeroArray(SIZE, c);
@@ -120,4 +180,9 @@ int main(int argc, char* argv[]) {
     count = StreamCompaction::Efficient::compact(NPOT, c, a);
     //printArray(count, c, true);
     printCmpLenResult(count, expectedNPOT, b, c);
+
+
+	delete[] a;
+	delete[] b;
+	delete[] c;
 }
diff --git a/stream_compaction/CMakeLists.txt b/stream_compaction/CMakeLists.txt
index cdbef77..a97c3e4 100644
--- a/stream_compaction/CMakeLists.txt
+++ b/stream_compaction/CMakeLists.txt
@@ -1,6 +1,7 @@
 set(SOURCE_FILES
     "common.h"
     "common.cu"
+    "profilingcommon.h"
     "cpu.h"
     "cpu.cu"
     "naive.h"
@@ -13,5 +14,5 @@ set(SOURCE_FILES
 
 cuda_add_library(stream_compaction
     ${SOURCE_FILES}
-    OPTIONS -arch=sm_20
+    OPTIONS -arch=sm_52
     )
diff --git a/stream_compaction/common.h b/stream_compaction/common.h
index 35fb581..26a03e1 100644
--- a/stream_compaction/common.h
+++ b/stream_compaction/common.h
@@ -7,10 +7,14 @@
 #define FILENAME (strrchr(__FILE__, '/') ? strrchr(__FILE__, '/') + 1 : __FILE__)
 #define checkCUDAError(msg) checkCUDAErrorFn(msg, FILENAME, __LINE__)
 
+#define imin(a, b) (((a) < (b)) ? (a) : (b))
+#define imax(a, b) (((a) > (b)) ? (a) : (b))
+
 #define BLOCK_SIZE 128
-#define BLOCK_COUNT(n) ((n + BLOCK_SIZE - 1) / BLOCK_SIZE)
+#define BLOCK_COUNT(n) (((n) + BLOCK_SIZE - 1) / BLOCK_SIZE)
 
-#define imax(a, b) (((a) > (b)) ? (a) : (b))
+// Milliseconds to nanoseconds
+#define MS_TO_NS(ms) ((ms) * 1000000)
 
 /**
  * Check for CUDA errors; print and exit if there was a problem.
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index e0ccc15..22ca44b 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -3,6 +3,8 @@
 #include "common.h"
 #include "efficient.h"
 
+#define PROFILE
+
 namespace StreamCompaction {
 namespace Efficient {
 
@@ -77,12 +79,36 @@ void scan(int n, int *odata, const int *idata) {
   // Copy idata to device memory
   cudaMemcpy(dev_odata, idata, n * sizeof(int), cudaMemcpyHostToDevice);
 
+#ifdef PROFILE
+  // CUDA events for profiling
+  cudaEvent_t start, stop;
+  cudaEventCreate(&start);
+  cudaEventCreate(&stop);
+#endif
+
+#ifdef  PROFILE
+  cudaEventRecord(start);
+  // -- Start code to profile
+#endif
   deviceScan(n, dev_odata);
-
+#ifdef  PROFILE
+  // -- End code to profile
+  cudaEventRecord(stop);
+#endif
+
+ 
+#ifdef PROFILE
+  cudaEventSynchronize(stop);
+  float milliseconds = 0;
+  cudaEventElapsedTime(&milliseconds, start, stop);
+  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+#endif
   // Transfer data back to host
   cudaMemcpy(odata, dev_odata, n * sizeof(int), cudaMemcpyDeviceToHost);
 
+  // Cleanup
   cudaFree(dev_odata);
+
 }
 
 /**
@@ -108,6 +134,18 @@ int compact(int n, int *odata, const int *idata) {
   // Transfer idata from host to device
   cudaMemcpy(dev_idata, idata, sizeof(int) * n, cudaMemcpyHostToDevice);
 
+#ifdef PROFILE
+  // CUDA events for profiling
+  cudaEvent_t start, stop;
+  cudaEventCreate(&start);
+  cudaEventCreate(&stop);
+#endif
+	
+#ifdef PROFILE
+  // -- Start code block to profile
+  cudaEventRecord(start);
+#endif
+
   // Set all non-zeros to 1s and zeros to 0s. This is our pass condition for an element to remain/discard after compaction
   Common::kernMapToBoolean << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, dev_bools, dev_idata);
   
@@ -121,17 +159,29 @@ int compact(int n, int *odata, const int *idata) {
   // Move elements that are not discarded into appropriate slots based on scan result
   Common::kernScatter << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, dev_odata, dev_idata, dev_bools, dev_indices);
 
-  // Transfer output back to host
-  cudaMemcpy(odata, dev_odata, sizeof(int) * n, cudaMemcpyDeviceToHost);
-
   // The max value of all the valid indices for the compacted stream is the number of remaining elements
   int remainingElementsCount = findMaxInDeviceArray(ceilPower2, dev_indices);
+  
+#ifdef PROFILE
+  // -- End code block to profile
+  cudaEventRecord(stop);
+#endif
+
+  // Transfer output back to host
+  cudaMemcpy(odata, dev_odata, sizeof(int) * n, cudaMemcpyDeviceToHost);
 
   // Cleanup
   cudaFree(dev_idata);
   cudaFree(dev_indices);
   cudaFree(dev_odata);
-
+  
+#ifdef PROFILE
+  // Print runtime result
+  cudaEventSynchronize(stop);
+  float milliseconds;
+  cudaEventElapsedTime(&milliseconds, start, stop);
+  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+#endif
   return remainingElementsCount;
 }
 
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 3d29d2c..9d75938 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -26,6 +26,10 @@ __global__ void naiveScan(int n, int offset, int* odata, const int *idata) {
 void scan(int n, int *odata, const int *idata) {
     // TODO
 
+  cudaEvent_t start, stop;
+  cudaEventCreate(&start);
+  cudaEventCreate(&stop);
+
   int* dev_odata1;
   int* dev_odata2;
 
@@ -34,11 +38,11 @@ void scan(int n, int *odata, const int *idata) {
 
   cudaMemcpy(dev_odata1, idata, n * sizeof(int), cudaMemcpyHostToDevice);
   cudaMemcpy(dev_odata2, idata, n * sizeof(int), cudaMemcpyHostToDevice);
-
+  
+  cudaEventRecord(start);
   int height = ilog2ceil(n);
-  //height = 2;
   for (int level = 1; level <= height; ++level) {
-    int offset = pow(2, level - 1);
+    int offset = 1 << (level - 1);
     naiveScan << <BLOCK_COUNT(n), BLOCK_SIZE >> >(
       n, 
       offset, 
@@ -49,12 +53,19 @@ void scan(int n, int *odata, const int *idata) {
 
   if (height % 2 == 0) {
     Common::inclusiveToExclusiveScanResult << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata2, dev_odata1);
+	cudaEventRecord(stop);
     cudaMemcpy(odata, dev_odata2, n * sizeof(int), cudaMemcpyDeviceToHost);
   } else {
     Common::inclusiveToExclusiveScanResult << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, dev_odata1, dev_odata2);
-    cudaMemcpy(odata, dev_odata1, n * sizeof(int), cudaMemcpyDeviceToHost);
+	cudaEventRecord(stop);
+	cudaMemcpy(odata, dev_odata1, n * sizeof(int), cudaMemcpyDeviceToHost);
   }
 
+  cudaEventSynchronize(stop);
+  float milliseconds = 0;
+  cudaEventElapsedTime(&milliseconds, start, stop);
+  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+
   cudaFree(dev_odata1);
   cudaFree(dev_odata2);
 }
diff --git a/stream_compaction/profilingcommon.h b/stream_compaction/profilingcommon.h
new file mode 100644
index 0000000..ede143c
--- /dev/null
+++ b/stream_compaction/profilingcommon.h
@@ -0,0 +1,10 @@
+#pragma once
+
+#include <iostream>
+
+#define PROFILE
+
+#ifdef PROFILE
+#include <chrono>
+#define PROFILE_ITERATIONS 1000
+#endif
\ No newline at end of file
diff --git a/stream_compaction/thrust.cu b/stream_compaction/thrust.cu
index 16bbd17..473f9ba 100644
--- a/stream_compaction/thrust.cu
+++ b/stream_compaction/thrust.cu
@@ -5,6 +5,7 @@
 #include <thrust/scan.h>
 #include "common.h"
 #include "thrust.h"
+#include "profilingcommon.h"
 
 namespace StreamCompaction {
 namespace Thrust {
@@ -20,8 +21,20 @@ void scan(int n, int *odata, const int *idata) {
   // Convert to device vector
   thrust::device_vector<int> dev_idata(idata, idata + n);
   thrust::device_vector<int> dev_odata(odata, odata + n);
+
+#ifdef PROFILE
+  auto begin = std::chrono::high_resolution_clock::now();
+  for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+#endif
+
   thrust::exclusive_scan(dev_idata.begin(), dev_idata.end(), dev_odata.begin());
 
+#ifdef PROFILE
+  }
+  auto end = std::chrono::high_resolution_clock::now();
+  std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+#endif
+
   thrust::host_vector<int> host_odata = dev_odata;
   cudaMemcpy(odata, host_odata.data(), n * sizeof(int), cudaMemcpyHostToHost);
 }

From 435a0d8f9c091b46c9638c34a02d52852e488130 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Sun, 25 Sep 2016 20:07:50 -0400
Subject: [PATCH 09/15] Clean up profiling

---
 src/main.cpp                   | 157 +++++++++++++++++++++++++--------
 stream_compaction/cpu.cu       |   8 +-
 stream_compaction/efficient.cu |   8 +-
 stream_compaction/efficient.h  |   4 +-
 stream_compaction/naive.cu     |   4 +-
 stream_compaction/naive.h      |   2 +-
 stream_compaction/thrust.cu    |   6 +-
 stream_compaction/thrust.h     |   2 +-
 8 files changed, 136 insertions(+), 55 deletions(-)

diff --git a/src/main.cpp b/src/main.cpp
index 337acde..3cb598c 100644
--- a/src/main.cpp
+++ b/src/main.cpp
@@ -16,13 +16,16 @@
 #include <stream_compaction/profilingcommon.h>
 
 int main(int argc, char* argv[]) {
-    const int SIZE = 1 << 10;
-    const int NPOT = SIZE - 5;
-	int* a = new int[SIZE];
-	int* b = new int[SIZE];
-	int* c = new int[SIZE];
+    const int SIZE = 1 << 16;
+    const int NPOT = SIZE - 3;
+	int a[SIZE];
+	int b[SIZE];
+	int c[SIZE];
 
 #ifdef PROFILE
+	float timeElapsedMs = 0;
+	float totalTimeElapsedMs = 0;
+
 	printDesc("PROFILING ON");
 	printf("\n\n");
 #endif
@@ -36,7 +39,7 @@ int main(int argc, char* argv[]) {
 
     genArray(SIZE - 1, a, 50);  // Leave a 0 at the end to test that edge case
     a[SIZE - 1] = 0;
-    //printArray(SIZE, a, true);
+    printArray(SIZE, a, true);
 
     zeroArray(SIZE, b); 
     printDesc("cpu scan, power-of-two");
@@ -51,10 +54,10 @@ int main(int argc, char* argv[]) {
 #ifdef PROFILE
 	}
 	auto end = std::chrono::high_resolution_clock::now();
-	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin)/PROFILE_ITERATIONS).count() << " ns" << std::endl;
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin)/PROFILE_ITERATIONS).count() / 1000000.0f << " ms" << std::endl;
 #endif
 
-	//printArray(SIZE, b, true);
+	printArray(SIZE, b, true);
 
     zeroArray(SIZE, c);
     printDesc("cpu scan, non-power-of-two");
@@ -67,46 +70,109 @@ int main(int argc, char* argv[]) {
 #ifdef PROFILE
 	}
 	end = std::chrono::high_resolution_clock::now();
-	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() / 1000000.0f << " ms" << std::endl;
 #endif
 	
-	//printArray(NPOT, b, true);
+	printArray(NPOT, b, true);
     printCmpResult(NPOT, b, c);
 
     zeroArray(SIZE, c);
     printDesc("naive scan, power-of-two");
-    StreamCompaction::Naive::scan(SIZE, c, a);
-    //printArray(SIZE, c, true);
+
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Naive::scan(SIZE, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(SIZE, c, true);
     printCmpResult(SIZE, b, c);
 
     zeroArray(SIZE, c);
     printDesc("naive scan, non-power-of-two");
-    StreamCompaction::Naive::scan(NPOT, c, a);
-    //printArray(SIZE, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Naive::scan(NPOT, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(SIZE, c, true);
     printCmpResult(NPOT, b, c);
 
     zeroArray(SIZE, c);
     printDesc("work-efficient scan, power-of-two");
-    StreamCompaction::Efficient::scan(SIZE, c, a);
-    //printArray(SIZE, c, true);
+
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Efficient::scan(SIZE, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+
+	printArray(SIZE, c, true);
     printCmpResult(SIZE, b, c);
 
     zeroArray(SIZE, c);
     printDesc("work-efficient scan, non-power-of-two");
-    StreamCompaction::Efficient::scan(NPOT, c, a);
-    //printArray(NPOT, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Efficient::scan(NPOT, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(NPOT, c, true);
     printCmpResult(NPOT, b, c);
 
     zeroArray(SIZE, c);
     printDesc("thrust scan, power-of-two");
-	StreamCompaction::Thrust::scan(SIZE, c, a);
-	//printArray(SIZE, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Thrust::scan(SIZE, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(SIZE, c, true);
     printCmpResult(SIZE, b, c);
 
     zeroArray(SIZE, c);
     printDesc("thrust scan, non-power-of-two");
-	StreamCompaction::Thrust::scan(NPOT, c, a);
-	//printArray(NPOT, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		StreamCompaction::Thrust::scan(NPOT, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(NPOT, c, true);
     printCmpResult(NPOT, b, c);
 
     printf("\n");
@@ -118,7 +184,7 @@ int main(int argc, char* argv[]) {
 
     genArray(SIZE - 1, a, 4);  // Leave a 0 at the end to test that edge case
     a[SIZE - 1] = 0;
-    //printArray(SIZE, a, true);
+    printArray(SIZE, a, true);
 
     int count = 0, expectedCount, expectedNPOT;
 
@@ -132,10 +198,10 @@ int main(int argc, char* argv[]) {
 #ifdef PROFILE
 	}
 	end = std::chrono::high_resolution_clock::now();
-	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() / 1000000.0f << " ms" << std::endl;
 #endif
 	expectedCount = count;
-    //printArray(count, b, true);
+    printArray(count, b, true);
     printCmpLenResult(count, expectedCount, b, b);
 
     zeroArray(SIZE, c);
@@ -148,10 +214,10 @@ int main(int argc, char* argv[]) {
 #ifdef PROFILE
 	}
 	end = std::chrono::high_resolution_clock::now();
-	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() / 1000000.0f << " ms" << std::endl;
 #endif
 	expectedNPOT = count;
-    //printArray(count, c, true);
+    printArray(count, c, true);
     printCmpLenResult(count, expectedNPOT, b, c);
 
     zeroArray(SIZE, c);
@@ -164,25 +230,40 @@ int main(int argc, char* argv[]) {
 #ifdef PROFILE
 	}
 	end = std::chrono::high_resolution_clock::now();
-	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+	std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() / 1000000.0f << " ms" << std::endl;
 #endif
-	//printArray(count, c, true);
+	printArray(count, c, true);
     printCmpLenResult(count, expectedCount, b, c);
 
     zeroArray(SIZE, c);
     printDesc("work-efficient compact, power-of-two");
-    count = StreamCompaction::Efficient::compact(SIZE, c, a);
-    //printArray(count, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		count = StreamCompaction::Efficient::compact(SIZE, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(count, c, true);
     printCmpLenResult(count, expectedCount, b, c);
 
     zeroArray(SIZE, c);
     printDesc("work-efficient compact, non-power-of-two");
-    count = StreamCompaction::Efficient::compact(NPOT, c, a);
-    //printArray(count, c, true);
+#ifdef PROFILE
+	totalTimeElapsedMs = 0;
+	for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
+		timeElapsedMs = 0;
+#endif
+		count = StreamCompaction::Efficient::compact(NPOT, c, a, &timeElapsedMs);
+#ifdef PROFILE
+		totalTimeElapsedMs += timeElapsedMs;
+	}
+	std::cout << "Runtime: " << totalTimeElapsedMs / PROFILE_ITERATIONS << " ms" << std::endl;
+#endif
+	printArray(count, c, true);
     printCmpLenResult(count, expectedNPOT, b, c);
-
-
-	delete[] a;
-	delete[] b;
-	delete[] c;
 }
diff --git a/stream_compaction/cpu.cu b/stream_compaction/cpu.cu
index 0b46006..294f06d 100644
--- a/stream_compaction/cpu.cu
+++ b/stream_compaction/cpu.cu
@@ -39,13 +39,15 @@ int compactWithoutScan(int n, int *odata, const int *idata) {
  */
 int compactWithScan(int n, int *odata, const int *idata) {
     // TODO
-    memset(odata, 0, n);
-    for (int i = 0; i < n; ++i) {
+    memset(odata, 0, n * sizeof(int));
+
+	for (int i = 0; i < n; ++i) {
       if (idata[i] != 0) {
         odata[i] = 1;
       }
     }
-    int* scanResult = new int[n];
+
+	int* scanResult = new int[n];
     scan(n, scanResult, odata);
 
     int remainingNumberOfElements = 0;
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index 22ca44b..3f23434 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -66,7 +66,7 @@ void deviceScan(int n, int* dev_odata) {
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
-void scan(int n, int *odata, const int *idata) {
+void scan(int n, int *odata, const int *idata, float* timeElapsedMs) {
     // TODO
   int* dev_odata;
   int height = ilog2ceil(n);
@@ -101,7 +101,7 @@ void scan(int n, int *odata, const int *idata) {
   cudaEventSynchronize(stop);
   float milliseconds = 0;
   cudaEventElapsedTime(&milliseconds, start, stop);
-  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+  *timeElapsedMs = milliseconds;
 #endif
   // Transfer data back to host
   cudaMemcpy(odata, dev_odata, n * sizeof(int), cudaMemcpyDeviceToHost);
@@ -120,7 +120,7 @@ void scan(int n, int *odata, const int *idata) {
  * @param idata  The array of elements to compact.
  * @returns      The number of elements remaining after compaction.
  */
-int compact(int n, int *odata, const int *idata) {
+int compact(int n, int *odata, const int *idata, float* timeElapsedMs) {
     // TODO
     
   int height = ilog2ceil(n);
@@ -180,7 +180,7 @@ int compact(int n, int *odata, const int *idata) {
   cudaEventSynchronize(stop);
   float milliseconds;
   cudaEventElapsedTime(&milliseconds, start, stop);
-  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+  *timeElapsedMs = milliseconds;
 #endif
   return remainingElementsCount;
 }
diff --git a/stream_compaction/efficient.h b/stream_compaction/efficient.h
index 395ba10..35d9b46 100644
--- a/stream_compaction/efficient.h
+++ b/stream_compaction/efficient.h
@@ -2,8 +2,8 @@
 
 namespace StreamCompaction {
 namespace Efficient {
-    void scan(int n, int *odata, const int *idata);
+	void scan(int n, int *odata, const int *idata, float* timeElapsedMs);
 
-    int compact(int n, int *odata, const int *idata);
+	int compact(int n, int *odata, const int *idata, float* timeElapsedMs);
 }
 }
diff --git a/stream_compaction/naive.cu b/stream_compaction/naive.cu
index 9d75938..bf3790a 100644
--- a/stream_compaction/naive.cu
+++ b/stream_compaction/naive.cu
@@ -23,7 +23,7 @@ __global__ void naiveScan(int n, int offset, int* odata, const int *idata) {
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
-void scan(int n, int *odata, const int *idata) {
+void scan(int n, int *odata, const int *idata, float* timeElapsedMs) {
     // TODO
 
   cudaEvent_t start, stop;
@@ -64,7 +64,7 @@ void scan(int n, int *odata, const int *idata) {
   cudaEventSynchronize(stop);
   float milliseconds = 0;
   cudaEventElapsedTime(&milliseconds, start, stop);
-  printf("Runtime: %d ns\n", (int)MS_TO_NS(milliseconds));
+  *timeElapsedMs = milliseconds;
 
   cudaFree(dev_odata1);
   cudaFree(dev_odata2);
diff --git a/stream_compaction/naive.h b/stream_compaction/naive.h
index 21152d6..25b7c4e 100644
--- a/stream_compaction/naive.h
+++ b/stream_compaction/naive.h
@@ -2,6 +2,6 @@
 
 namespace StreamCompaction {
 namespace Naive {
-    void scan(int n, int *odata, const int *idata);
+    void scan(int n, int *odata, const int *idata, float* timeElapsedMs);
 }
 }
diff --git a/stream_compaction/thrust.cu b/stream_compaction/thrust.cu
index 473f9ba..a109198 100644
--- a/stream_compaction/thrust.cu
+++ b/stream_compaction/thrust.cu
@@ -13,7 +13,7 @@ namespace Thrust {
 /**
  * Performs prefix-sum (aka scan) on idata, storing the result into odata.
  */
-void scan(int n, int *odata, const int *idata) {
+	void scan(int n, int *odata, const int *idata, float* timeElapsedMs) {
     // TODO use `thrust::exclusive_scan`
     // example: for device_vectors dv_in and dv_out:
     // thrust::exclusive_scan(dv_in.begin(), dv_in.end(), dv_out.begin());
@@ -24,15 +24,13 @@ void scan(int n, int *odata, const int *idata) {
 
 #ifdef PROFILE
   auto begin = std::chrono::high_resolution_clock::now();
-  for (auto it = 0; it < PROFILE_ITERATIONS; ++it) {
 #endif
 
   thrust::exclusive_scan(dev_idata.begin(), dev_idata.end(), dev_odata.begin());
 
 #ifdef PROFILE
-  }
   auto end = std::chrono::high_resolution_clock::now();
-  std::cout << "Runtime: " << std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() << " ns" << std::endl;
+  *timeElapsedMs = std::chrono::duration_cast<std::chrono::nanoseconds>((end - begin) / PROFILE_ITERATIONS).count() / 1000000.0f;
 #endif
 
   thrust::host_vector<int> host_odata = dev_odata;
diff --git a/stream_compaction/thrust.h b/stream_compaction/thrust.h
index 06707f3..44d7fcf 100644
--- a/stream_compaction/thrust.h
+++ b/stream_compaction/thrust.h
@@ -2,6 +2,6 @@
 
 namespace StreamCompaction {
 namespace Thrust {
-    void scan(int n, int *odata, const int *idata);
+	void scan(int n, int *odata, const int *idata, float* timeElapsedMs);
 }
 }

From cd40d4ee4d90fe9c0219584a97906f063e85b3d4 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Sun, 25 Sep 2016 22:48:44 -0400
Subject: [PATCH 10/15] Add profile analysis images

---
 images/BlockSizePerformanceAnalysis.png | Bin 0 -> 14554 bytes
 images/CompactPerformaceAnalysis.png    | Bin 0 -> 13411 bytes
 images/ScanPerformaceAnalysis.png       | Bin 0 -> 22870 bytes
 stream_compaction/radixsort.cu          |  18 ++++++++++++++++++
 stream_compaction/radixsort.h           |   7 +++++++
 5 files changed, 25 insertions(+)
 create mode 100644 images/BlockSizePerformanceAnalysis.png
 create mode 100644 images/CompactPerformaceAnalysis.png
 create mode 100644 images/ScanPerformaceAnalysis.png
 create mode 100644 stream_compaction/radixsort.cu
 create mode 100644 stream_compaction/radixsort.h

diff --git a/images/BlockSizePerformanceAnalysis.png b/images/BlockSizePerformanceAnalysis.png
new file mode 100644
index 0000000000000000000000000000000000000000..44952ea577a61437b3ffaed24ff2c327e3fa4f58
GIT binary patch
literal 14554
zcmb_@by!qe+qZ%ON*G9&aYUqRK%@i|3_xlKQ9@v7kd~oT4j@u0IW#CWbmxGh2r_gx
zD9F$Z(#^Lvderlr^M3F1UDx*y*SKA?_nNitb^qeNx4(+A0_AbW<A)9%qP%tUy4s;b
zMB0ZA9d;li0awN*T#61Ix{`G3x{Su-f%!PnFb#No-LOQA%W$lzp>Hg+;BA#e7u}O5
z@5Rc~+cOIW_Wg0g&e3s*LE+l<!>`VM;(dSiCY2C5Ir(|wn~%czJ5F1vg^mv|4?Ebz
zt?SjGk=_0?YwO~ZUT8hfRXE0_W@~hDK>$4WkV@8&_Yvp=Jva21f)@HqLJs}q2h;oe
zb%VVBy#CJMFu3&JTz`Tk0waGPf5`hNxbpk;9}oU7uK#VK2jl-QKj3-O*6OU19~Dc}
z=uY!!)aW*5RA_&RZ~tNS_AntjM0&4ppSWz2ReuL>yO+B8L3&3{9fNcd^4MBwa~j`^
zI?cVmR$5~nxl7pJv$YzTA1rNV+ihp--}G7}^)j#-uAtE^@z{12*B_*5JR#XoerbSR
z^@@n~fH9-6nL+ipAY1KSK|w*;Nty|X+eC3j0kk~lv(p^Ry3$|S?xoy`oO4Mt*$Ry2
z?G&v&-BpopHCWOtv9tIApS!=6+nli5pMYXlijJCSjHJ`H-QU|?yV^6kk+8p+P`152
zlbPGZw*QUI&vS%JD<{fsybfjSxg3Lc@tky-6WCszHO<k(SVW3i^|jfQx-KJZN)FLy
z<(@FA3-q@n^W0ze8g)@uM4U}kj=RTAV!5&S#ks%MpW0}diuuZC@t#Ww?x%IvRyywv
zx_<Db<f0~-g&ym%EbcUO<|^MXg=UvWsm<^}PN`Y@`O%%t<;iWS@k&B<0G9LIg`L5g
z-NB?9tWF_fv!@w{d%+W$aY9Z$1D>gwl%VD1&WfB$YBQSn`nAt#Mbh$K4LOJm51x(1
z4=0S|XFk&D3o8UO3q<nii_G?97wT~HsB2!-duqRoS6ZIc-yd+_-yY?ADZ}{!d#}<t
z`++8yMqicdGJex$#9^`}h$mAkH$JWu(HvcAlb5{6RP&9=dDy5vxc@zuw6wINo{sRD
zt6m-vHCvfA1vMx5tOrYq2Te^)2Ya382kcHo9BTQ@N$#=q^_Iilj;oOKoVIwbtk3cM
zRq($iHCzv77m%X`CIPnkH5(uK6oVLHO}4u|wmzQwg{G|~%dGB;GTWDK)(n@9dJZBu
zVnnPNEAQ@n)Zg)u?4i?l$I=~ng5}(IobLEI!mRJH+D+70Vl!+JEoy5cVlxy~^dy|2
z%^hw_<A<&A+^xtCZlm06<f|!KmJg&i?9F{pS>nMWX8$(MYo_aRWxUN)Z_a~&`SG?S
zIefbU8_a8O(#vMOyV}ET*$ZrL(&VE4{;EEH#ElR{Lxy$O{_K6isyhQMCAB?Qc%C7P
z1I1gKkmrFr)0?4Qzq3Ht%h|op*;kdoWfeoir5R<>jqYzvd~e@hV3IWX7OhFs(y?@R
z@9W(;!gv!($gWj9Fkx>c%~=P;q{nh=yrgAjh-1rSOI%^M<`zYC0?y@hY%T@vYeQ&r
zY4s}4_NK;5F0KpXxfVPua<iF?jRC1J{lTvj6EqvlTSFe(Yq0%|kbN_+UP1P|lB;31
z(lRW`#(Zzw*)n$Y-k0s~Z8s<EO(#ST4Gr~G1<>&gtfu(M!JjX*;=~D6Mx&)x{RQv7
zndBf^Vi}N4O-+j8d?QX@rn)n=hTJGYdcv_-2z@DF_h~SgO32uIRY4JPJZOwxI~fFp
z^Ja`~wRu_$%o357rigl||3LTb`iX%U%674gMG9JZ96J3oWxV&c%bxB2n(fgR>*<b^
z5*4-WTo!TXGh*KGGv38+>o)rASlu{!f`sR4ranzNZ--PEip=H>k#re>;6ZS^%)qTR
zu>$sC6W<yo@S(J31miY1T{?o~(nxqbdh5~N39pS0Z4T<;5s&Bc>*tDs2@^r0BYDe}
zPP4RIV#X~W*2EpB+Mq2PRZykWq{rR1+`U(9@p12(`8~vLOPsjKir#Y7Wb#}dnt6P;
zZhw!kKe98Szn20t3t|#2>3{Sf2D^5joR&LpaAq4MdChVKQMuujXK*ne7-@w+Z6wxy
zKdO5}Pt?mqD(tZ8n%vPa!LuVo8b?#*P^6~sjnmKIR?On}ZjrVcE`G+AU{@y-ycS|=
z9)El2ruY#J&wODOd)i}-V|mDQegsq5Tu}w~OJJPdHm07<O9JsY?2B%Jv45PVJYQK*
zfmVX&Rz@=?I5)T!hpP&(S2^C#1fT20?&03~Q!<IvHb?!jrTlD}OEZh!vejw4j<V2U
zQdvBEG(e>|KQ;XFQu1^jr+}YjTXrxlF1>=&g5gCvGM(~u#NBA&%PE96W$lE~U6k5t
z-1_#SW@fG)W?+5tA`Zrcz&%K9vMlI|s=gwg3?d>?k)GSO``#I&&$4xLa6ugJQ8$kA
z_*?!I{^+$ayRq71mG@B>c4uAoOE5lfj@!X~rZA<}e#d2+2P<6w2vmD)&sEiISJrSX
zx>B)9MDYiVH8%|_d9OlQ+j&5DH8ks_<KU5TC}zm5#<MLnXml3EUp&myxR~kGwNRgA
zp|{H#HvI^p2X{kzcDj4?s@8;lc29ElMkCZ=1>4qT%MoHOcv+0ehXOIfbkesys*~P_
ziAl5zS*++HZ=Qf(vgrTw7`6K{I3XWVShY%y-lymFN_g!LpR`vTCcckQ>t3~3PASpP
zc@QDz6)1eSmkT-uk``L0t)yR}1)lrO2IpqUo`n7B1XuHa6x8dq+>?n8|1(BYL@pO*
z*|TDu=G7WasPK0S$sjtn;ri^u(Z|x21EW)`lhXUHIG?+mv+}6PmKzM=>D$4PhAOoD
zWkD`Ag4cXD_u?+EQoZ>Wny~Xn(yhgk##?J~M<yGE#nkBtF55#6t(yhc(aJq5MdqDj
zo>V4FE0s$Nck93HQH@Otc<wyb=d0jgU?Z%n-Y2<ZJ+ngk36+_Sn$hqq6>N^49GE$V
z;_h{=OES8&6$|j5LrdaYE%jPz8WBH^5=KM)WiNxYzT-6G!*klhr+t|`u`~lY*BmJ`
z;=ZVqyla%+`5=Aflfg6wf7$Z%j)Wk!VS?_58&!K-vuhr^TdRZ$tUW5~jY5e0NNFQJ
z1M7mG)QckM!(Yf;cpIPYulUTRD$5w0RnKlTe11p9o20*m%;GM+MC*8c$l&P90u!9x
zG#u5=Aqj)~q_aLo<GQ4}2YFwyGTyts?78U8_U8g0Ze5i*-9nv(#*sU&M$q*J?;%;K
zTuY|uT_yAjo#nT7{1?zAuK*$9TsI5k5`8qum0R_2&?4PH!)W20obQ<igK~>!oN#oX
zGb<hM{XEIMBHLAa`}xe*G^a<NY43mXVf=!eBxNG2q=-awJhRTL!VJD<Ag8&#HTj_2
z-b6euoki1}p1b$SeeWyi<2GO3`v?S$TaPnZo?yPxW-~r;+GA3D^j5z?d0js`m~w58
zoRJl-bgVes9$qNp@RmCgiLluG^1)C2DxDuvqGI%kXQlMsw-BRQq>zZsb26<I=D7*_
zS`(S>92Jx#Lw2GJS$ycgJux}z5GZM>!sAFNdpyH2TqQ(jzluNJoQO0sGMg6HfG0NP
zl)iboeixo>p#xZ57+074A9@HGpRrcYwL)1GS#gMcH??7sSLqB*BpCy9v63B}JO|e*
zZWAWRJ~G3R#Cdm}AlcXQk#hUxZNmk|^NsZET<*6EC?o24j?dmm57eu&-rKI(7k6Z$
zba{!U%8_wRmhW%Tu9UeB`}0|53#FXATw^y=9zRK@QjEw^shC-rnd~i1TNT1pLlm4Z
zht86}i<L{qm#^K0ZDN~))8=Mq@|r~85=;7S427rmwxTU5k?9}dFw#R5J-sBwMygMf
z(J*-Bbi1hZR(r@?pO{Z`2N|3xT_IrrnIY+0K!i?KcYB#vhcjH6>la!{uuZugKDPr>
zxSvfL#fyTYIPFhO)0kP;2z35QWY=?i#`@r}pth{_ldhM#_s}>Mk~-a8>XM))pSlz3
z+iXE}G|bK7Xex`TY=T<NDO+L$pA9|bs^gh0o{LDu7j9X>vlEeMtQxVa$y%4x?Q_Im
zuL?hQ3*?MRk)|*VSv)4kzSnRmp(s@?K@08;V!y;UnS+E2#Hj`V+r5k~iij&7TSXY<
z;j)KY7sh;@A5FQnm&~wGKxF&osa_+M{`UsqpND1P?lb-~1<~02(nRBSwnN2|odntL
zNQm1%k^L-B*86<I+;0512DMwEipo;f{qlm^`Yj@$1+JCXJIOu@DJ&mM$CjegVI5@y
z`7+bVqcX`d4-WrRAAHvt|GfTB-SAI+@Lgy8^ZHNSa7IYnW#Re}VFlZ3%ekl#r|o&}
zb}*cdT~rpj=0Kr&nIY>q4QFk#{RA!*Fct)11XDfX5140RLsOG59IYWRKTs^BTWZ6T
z*Ag%3rU=-XQgbv+Nm)5q4CJ<_4rEJfgSIh%2A=XhIz-ma+{V<LWW~r`AI_!K1QMbm
zAiEbBvb;%8M3Yc5MipE3M&F6#MF9wp1_CCAn3SrvN6c~R<pWcYgYZiejrdQmF0hM>
z4|3lt;#d$c&XEscwO$x1_r?<0{Aort6@*tQp^UiVwO0l4?mxU??i-H^jT=snR+T$U
zMjL+c{g_I6f^|+vU6$RlDM}!zK1$N9WO}%=v>a%Kd+w3++%|tc!B0_|1!Fm19}rTM
zlt)Dn2T3O2+U$IMt)c`V7gE8E^36?(loO=l77HtlnxbKi#wI5HiuWp>V8`Ui%z{Ur
z;OVo@7h~<uy`lbSkTDGB@BAZFGea$<uV~~_qkOs1+FXBUQ>>U!cJ&<!T2a|+4l5+W
z^#(Lz-o=I=NIKJ1-`pg*(|_3{tLiHrKOmw-H9rezWwldR$;?o>L$y(Qg{mSz|7_3P
z-)C&k#0_uFDAhmXow5dBo@`xjjuA2qjw7hJW%-cPZT0k*SjRMc`n1R*hgZH|>D;_B
z)&3#&s?+gbTQkSR-Aj@Q_VX1*&))8~wOgjsY!7N@$9*tHMJF3Xz{j3;w`ScMPfR&-
z70ptRWYQRc_%`;@F2rtQ(a?>m#nCYD3Ddb~V&ogKuznHk8Oc73o6BG$pH;aiGvoU0
zaea99z3yt8{(_Wu0zfdH(M<z-Nu-gc^{ZF}?*ogvV3vSiTe(I-Ymiqh61H+fJ}e<I
zj})wsVIIHs6YTjiL$$s)Vn|{Va(?Y2BmwXJh}hbgypPgz6M5hGLJX}xmWYD(DV7Mt
zF*tN20q+b{Hxk7XMSuH3bGvvfNB{%*xq#0h7Agr+p`oEhybmhQ=q|9l;k1&-0xMAe
zfY$b9hnyc3Dwsulz?5NTb-7hKglBu|O^6~;I&)DvSQC2gcLt~ExsSUED-Z;+Z$hLj
z5KU2rN^m{Bcoe_kGX`l-_jK%%J-&&dv%+b%&w+$GXoK}S$;|HhXz7JYpd$tuFW1YR
zkTh2C?JY3xOhtj*Xq0!z`-VXt$6PxzE@A|C-c?8wDG?;7(?HSl?kRC|fl1@*oJa~5
z-N}=_@d4UEyF*JwMnUT%87<e}p$m7%-J9-zV%Tl>jn(LaceoYC_<pr}f7KF>D^<V7
zGpW(R!J+v=h{Ut+%aoj_;J~4aOptWzky_3L>M-@;#}_37t=oC{M7yg_Ghyc4=<w|G
z6pUHv)_Jub1L&Gvs+U>RGt@3_zntO+V%kD8`<~CQjdNa=0!Pq#Jq(3n=rvfK>2A!@
z!(3HM<vK3CzuBr3%C2<0N&4|(B1*z_=|S%iZzsBPyK(va1wvun`st6%XQa+ZnFZsg
zSd`<gI=NftEiEs5SSMH2nF9nzbfv2%ZC}34#Jx(tl8nX*7}fQy8JL^ry>`N!aa)@c
zcu?sK19YyaF@#N8&p_Iumi<drP=9O`p?cdU>H1pgiE!2?98S<}eL-oKEvX|6WFis1
zs>Nrv)g2l1+!VAbAh5!2VBnJJ&MH8zhL=D3^2~KQB{Iu}EMj_zl!1Yv=Lt=>L9tbT
z$6R0j2gY=8gJ@PsWNn0blrPAE10)O6*V3`KdsfxPRfNsj-Z7HGgvIT@K5uAg5dluf
z(!A-rCx=DeGZr~bwPAbeY3mGJg|02*n+sQKrUL^Liz<M#l3(UbK?~xVw2c`<5LqIF
z1fo(cM`%~tT{ivl1zZ`BQ<tnv!*4TX4OhCv__2BRt)1K%S+6#&-dSqwE5J9$DA?3H
z^-^dS<V1q(%4?8nTo4xF@JWW#Bi)YIqBm#WA#AH{u*6!(n}qU(<(08x)Umm{NcBG<
zIjfJzzE?aKnT<631_X38<Rh%(9-B*7I?ul_nJXGfxne@*)G~7}sm^i4sAg@zGRc>B
z#BSW9ePmO$m1jhNUmKhTHjvYNSI&1CT%1Mf)OdP0Y^_ZHDXy3Q(8s!sJ?y<YC!g8t
zFuj$MrMocilsS~3^$50>T{+f_lr2;yR?H!Fmw60j8ZQ7zI6`p{S{hQSX_HMTqf+Wt
zsqHN5vo7-kFx}$m?4Hj2Z~=8r;hR<C@&W;10`0#|Kv-0}p+XOhn*}R!%tgZZ(@7z(
zJ@;+BRO6|(q@#g81vh}X71G_9IzVy<RRZFzpYx7FXR4ABip9kJ{t0h@M0J7)^cxRA
z-<qlKN}Rf*Z?U5F?H%!nTB#WHN|^l$t1dj%uvXmWj5p2d&}kN8Zy#*(;$e_?ZaR2R
zT+Es^c_Sb6P;N*Zpp+50N7CF~pab0zH-o;wq|L5`VPB)T6iK)!P`tf8(>>X`Jru_&
z<8qfZolJoNm7SpuOVq<io-4wvS9M<*cC+$m(FkVxXpmxW^DX!(_B}{yhoawzzAcBs
z&Au<su%t1Ct~f)D?{Ge%nQ`z#TL2@r@-X(9ubg#!iS4K!H_06x7MBHFZN}BkBs31B
zUKEgZbuG6rtQC&ar*+eSpJwNG_on0A_4=TWcy3(z#j7MF<UexiOFRjePVXH!9r_W-
zA(-ZBvri;WaT+l^0uO7+3f(vDN2OpAdjO#2DE*Ku=~{+%^xSckEpqdPUCQPFYw}Gj
zYBWl19tgQC+!xO#nYADY1H-ZJ>Udp{(Dpi^wEqvd9s0N+E}xo3bi^5V?bdkuWW*Fb
zbSQmJB#I&BqM5RcAMkxlRf<srp*Xh$?5_U0KH0jrHv(vnl5DE2CiZmh@P9~>AMu&K
zL4RFtG1CrH@d$SY>GxIZu7Y)LysNAc!t9<eF3Cb!a_}ZR78%^0mf*=a-RB?7WGh~*
z9_s%BY2*L*m3>xl%$MwUR3RbfaBl-d#{1~~D8Lnh@Gtd{qw~_ykjqtNcS4nw2+G=+
z#wXb0ROWB(crdLb$~_1qIN{D@96@S{BEtuKNx5K>)sJO-zI0TCuX^MBU%<qAz>oY`
zb<+fdVEnEC$}go(q3Rf`Z?Vh@e=d=~bmh_KYgTa_t&&u%a`@YlbK^le{!kVN(>i!;
zAoet4)csam(8E066KpmS+&W`1X@)O^TT(CJ96~VlZI2X?Tek`>H3Mo1VwLDSY#HVW
z9|^6qUI`wK0)kP%5v$M|cg60#RCDdAiSqgddd75dF0MvIN5|0x`~k`uo`5)#8WT62
z;8j(Mh=B)3g_H!%M-<-Oa9zk3PmLeXJY3d!>~DkZNi0E7ua#GT@dfHQZP$k8=3?s{
z=7xB;x!|N3c>(i|w?$hRd(ryua0(I7SAzx_NM+1!GCg;3ZpZjk)s#PfG~wpjkdX_;
z`d4~M0r}QdN-0;8AJ}ggf}eVT5Yo2r>dw|J1sp2msruhI43Fe&->bRudc*oF?i+cM
zexJv;4hY2ti#kLoA{o3VWHF?xf%jLJ$aNPe{pv9Gt-?LC5j?ubnJ<hugixc(fPo#I
zZ&d&AH-wHq*Z_!R^btoJ0g6J;{aOAw{>jL9Cc>*IOu8cPa1BrqJ3}IHU_meg>QcrJ
z!la$4xt)n$`<;(JG#oHkED^8b0UcBz++>zSb_II?$^>&5^;k#6#xgqqFRss?Ko2(@
zH(Vu*N-q>#_YRv;6$5#Smwz8{4?*jJqI@HS(_CM>``+ecz6mndPev<OZ&+e)V|;B$
zK>J<L$>zft@Z`>51vZZ^z=A(SqpPYUgbd#w5%S#GQ1PCa0B&b0Ab$Ci6zqcPGQw(Z
z04U^2U8j=#<~}Vlu6hg<nWqBVIo~8iaxKb3GnqB55agTCxHvHTA3S_2&Ql{p?PFwq
z$GCY|!)-(!2^F&$SjGrP4FAeh?D~is-?RvlH@N^l;@}k0TJFAC&}{#UJR;Lr&|~U7
zw_8b8H0v)4DkB4f0G6$eee2fJzcIirD%vZt^yva1;f0>x0`#>*ivfSocP9VNWDgcq
z-1>^!T9yYs0X@g5nPrx_TXn*cDmqa;O&JBqN<ZiOMC|PpO3gFgFsB)fLSX&&tt<>z
zDox<R=bghj;es_=-ML_2ey&ywAk>4-cTp&mostT0*_vj$Gu1`zWH276mxj<w+xTMJ
z(Gf(>eI{<f-@f-6@TZLdgNez>!4hRdcC#NG=5kDm24w`Aq&|>=+R}CcFn(X4K~g>L
zGW`l2^8hrdzUu_dAn(k3A98$3q+Y=Xkt0fN-^S~e<mG)~1{clqgcaoggR~}IKl`A<
zQ9#^zE>DsoyrJVI<!>Qq?pL4%F^GAw^gxvaDGw|0%*10efH=H&*8JFgpl$5dztmwn
zq8=bAEyF?%HWAV=Q<UaZBmv~qfQ20X8K#grg822%sHUKO^q*1vYxIwxepZxbQxkXO
zTk-M4cRwikS$^#^8&5_K*fZepL~L=LdIZsh%l$xtf`3Lryq(+|ewCzg`(`vQoGWH+
zelP~(w!Rf{=^;p_>_S4FQfDgw-9rEod9<g$&@^Ovpg1!_r!cjlp&`E&MiDRf5~@j5
zZHxu{cnSy*lTHJ%l_wJr&jxs_AgB!lp)e(*Fu!GQPI0Sn7je{VZ>}w<2c6WN1Z4*2
zI3OfZjgfpY7Zie{=H{#l&DxX8>R*;KN+OGZsH8eb+z=Ma0KGE?ibAO%ynuXK{PLms
z^~F2x%lMW!OJ7PR+89=e$9b)a$52^-v;N5nNx(I1hp6p{VgTVZ$i(LXeK!EP<A$Ji
zZ?3**XWHG;Qy&drwj)EJX0VBe(y_2rAHPU;V9#`C8nvgROCSW`Sy|jMx9-qEIp^7r
zC3`EP&1>ukrOe9Xh-l*u;Gms}>De~!=WuBP3^f`hWSZLT;t%G0>IgJ_AXQECM6CJ@
z7-1H`bGs~_5*QviG<1Iuk4y51lW^@Q4Ia>p6L)EGp@56NxE0Et(oLZGea1H4DKlcL
zYXJ}Qx~eVqb~dYB9q>*0%PbZl#gD$oj$Va$CLqq$MxTcK!7`%&U5)|=(GW_ZCn0<f
z3jq+K4^j@#YwSRcSB<r8vCZ(+(1ZkAH)_sIaIUKRt|D_?!On<+TvjY6QUvHXw_eqi
z1pz8HDXUg2iWfxTh3g>43i}BTlH9?NR=N;u+%|o9)_vv1^~`rNfyf)^<<TuUbEOUt
zh=;SnmOV{~^3x{mwH+yUn)~vN1hiG$-Fr6l&IcU;IIa-;OqMYVD8zfB_kLvH{!<z-
z`lv|b3t2CK@YV6l=uMn;UmtdnW3dx_QNVK`Gk+j}OS6IG*3=tBT_8h`hI!VDW7O<X
z;M~?nC@>hpDd_p%)d3wx9+gDJa`lW^AZ@n+jk7MKSd)RwRj@6yB)Max@mNUHf<IL;
z;sTB=b4FDqO_^n|xd7DUst><2_U&RaXiJo_Q&N-oaK=Q}X}s%s4w`PEGcAP0u%|M<
zu2ID!r>-AThO$EISW>pWWx`N-p{+sD<NC*oSkh*IU~_Jgk+-({iY>Lch0-TvDYuO!
ziU~mT#(-+mLlB79zIcNSFwt+2@lLDfcJ`|D{?0N{<D0;|iiaPMcV=qwZR<U_q?L1D
z=N(1Hx#$9e3`E{*YjL}=>*7|`ipfo3QUNX)K(7W6BSjb&gTg!`r~(pwjuNr<HS{jK
zWSvl}gb^*bw!tVDdAdc<W%blPb68ua^H{%WLUF5+TCW;Bse17}`GF_{;vFgHDxz)L
z8edG3`a_|v9S$B@2vwEWW)U>LX%!m)JQ`GzoF6T}oFFffs8mlKrtMz>@X(z5&09rv
zpgP?L-Go&AgELHWwEkQhXE_42%1Ybq$OoNM1$;F-1+HWMm*$ED^=2YCSs#CX8s%GR
zJ6aM#^$xfWPu`P)1c=MWE}f@NN;5V^AnNcJnGE4NC~#&rDiCOaDm<xDP{GZdJ0_eY
zT<s<3u`u&fph~-BlJTtmQK#YXO^kO`1BL54HG!TnS8mHpJZSkGak|Ad4Dik27z;Oo
z04Qh&f-`y8=LDb#VW!>_Fd|;vKjc2&6nQ@r4YRa5A;)KNBo|xzUNLy!y!B|cq=`3;
zt*%Mv&?XmC8fUXH3D-#e(4)P9R$wf!P1B=K!^0nrR(lvF>;mKv1n}UW-C1U5<N)~g
z!)-wU*bkA$%kw%&<fNkJ5jmw-V>|&`yqONV$*W;sRr?vg{zWLp%>khhD4JH!VBj|K
z(F2&Y41gF#PRFb5aP}Na1K0wAhkxo+yO-N0Fz#4>{q!m+RX#bx)WDEJv#;c;S6sk=
zPKHO<RQnrp>%1<+ZOXP$_hqHQYEGO$mq;dPC_n&t<h)hft5+y3O9-v24`MP^D1@ip
zfoA{<;Qhe{ur{|>D!#NTdivO87GyB1!V6mD5je6#77xcy)5!?GsEmgB%oCFQSPKSm
zx#{xCaXkys*w+RS@HwT}yU$#tW2QYfLY65=!2`@gehmzov^XB`cP!EOi>lix_CZbk
zM8-adDKW|^(e)T$R(o_yDhh$p$zRiJ2u^a=9nhp2EjLwaRB??fS<CQ{1_T7(c~?5f
zJ=kzEFa!HtjJcS<I+$XnMO>AUQR>4y&#lgcXf1sYm?P@76allY*RgAUoj80DBnX)q
z{heVFb?@(jk<f9z-;5aeHPj-!2#qdPMYy{~?@pgl2ns3z3wD>?=uaq7Rf7cP&jk^m
zzbP_sP1_+JV9ut6+YnL}@a6G7Aa<?Ogo5}o28uNr=QGsPwtOFhz&fyX0TEqMzVlw5
ziHwm2mT`=!uQJb{Vs)(d+GxhyU8B3o@e<`4!dQdwOSiXNHLgz|h5Qg?nplH8(;_2F
z(A7kl$`2e_ST)*AJq+^IdKy|r(we<biWwr{kWK>z)Ek!puuX?e9fR4VZTucBIiKbN
zU$A`#2#2miu~9vhxbXF`-HbOVlD##lf)n4r`Ta2<l9(RJD^PY)7Z(C{24qDBqZ&$(
zft}#sOU=M7dHEu4PXHKzKb5b*P=mmM0|+@KhyR+ycYgid8YBg57y8P1KsTfyN&`^=
z!#oc6LkEoJ$A5fh-UkVIQRZKnI&iN4M%2N5{vzs-#Yo3~V0!+=>%nN~vG0729hkw;
zQ$N4I4!OJs?B~a5$d4@JhsaVhAmoR=Kl(HP9q>OAEbs*4f6%f2LS+2s)PK_$Kc@bd
zB)J_{vFm*Lh|F6hP+)*o^VwOzN+6B^)`^S=(u)U1;}53s`+$FpJqQS3N<ITb@B5nn
z{0I!$-|q|V22p{Jzb)3y7SkZY#pk(BhmJ}i<pvnDB;D4cavoGhgG3k&>7bpBZ$wPi
zBUSyz2t+g>I8gu>Q9$!;MOgNO#u)cy;q1-egW82!%58R_UFU`?drKkXbj}`=Y9Bx1
zL3-hoYRj<$0&?8_n(fU71D30fpCHFB>s~PqvP+r8>}!opO=Ez)@Uce>_>~V#LAe7D
z_yPjt&{WUeEj$2msW%-}t`3#=r&gbmvMw?(6SkQ|ZM2DdO00E98z_Guy%Kto!8z9W
zy4WQOS{dN$E*{35yXXyjy!e@j{RZ9ysIdHLP-=|1cqd|`2PN*3!ysZ6)tYXG0Sy9u
z<`|37Zxj(__7g8M?iHhLD}Yah2laqd@SB~lhA%4`=Z&Fqj3*rzhQvBSv0gn>lLyd8
zHmI9Nd>??naD6aKAtC%*hbQ=kNm>Z2q(x)^aP=)|S6#Q(3AVg?Ra4??mbn<sKjah+
z-!aI0Ld1qSM@bnWsG4>+LAmUypt`H8Yqjeo<yd|&p%v6o6R&u$Jy-GUUNHxJEle9H
z+YEFh^n4N9k1uFaK^k520FP+`yj}fjYceA5eT(^6tv>>gUXcr;4tPaKZi?^!a`=>r
zExMb+F00QKNtKoyIDE~A^gxY5(+%PPM};dNeIWu-18D}pNg6;+rM)>ul-efISqtlw
zqhDiFx*B~HK3;6zS*Og!wG3)}XZW>wi&`N|&zf1zmqGyOw^D+MgfA6KbcZW#kHN*O
zX@CgU6=>oRF!PSuYAx7wqKx<4HpGx4^*#HcO1twthFri(``6LzPLrVgVQs02si$Jp
z`mu?C5j@3OfVQ^m*UR>kEi9JoRs9$KD%z;(6(-IDk!YH^pwWFv?p6AWwg5p1m_^qj
z11k*CyOTbt(?y{v;gHdK4(g~A3Wu2O<R5P`6ywoEaLRNo59eN5r9n4ob)ZSf&3q38
z0(2V0fWM(|K&+4dAlCWj#a{NPi+*UVu(X-R*4n&fy!+BE-H&v_{Qga#It93c44*}9
zj_;~!YvCUh5rUd6+;PC{k5=-N8qd-xoHKQv-0rx;hXU1)+8*<vvV3a^{VqkOp9^mC
z$pHAIt<k=#v%P~^fxfb4pn{`Q_1MlTZg+cqkUI#C2}^o4-7Yd9Vn*A=dP^q;fKIA$
z9@NAY!Kc3vQ|dUaCS?Eh)2B(D(<GL_IA5c;NJtUU2J||ZM}0606h;O}_GKx1x@j$e
zQJn8o2N=Mrdg>i^IQ->-vQhm^jEr>fz6iA$)|aRe$|3h}PUB>d+eA-0WYEY4;Xw0^
z)hG}Pk_Fh;n?R@ec&sMR$i#)juuVvevs|*^dw<rnB{rXu0NUkjDu6%$F2nKewHX+P
z)YjAmaUQt|6&gg1=dRW2Bq)wNl-gbCEUQ;`V*HULR(yp;v{jswo?Hav_-V-ZBGZr4
z{8z3AKtc&R4(V)%<W62UKYCOuQ4|t&M-GNT00Jda3fiMme<fAu^ZzvFM}Z5df_J1V
zbx<7(N}C`Cz8Air>;ERELEUSG1ghggI0(2TIM3wN-%X$PU$*5FF#oal2i0GIOOS|9
z1_iRe4Q~VUJuo?cNq(p<{M%?^q!D!U|IQ%z-|$P}$p7Gy{XYQM(;ool^q&9*3Z)~^
zE<if~KuiYc&hM~u<Kz)YzC&iiuaDn%?B`e@lfQEdnUg<0f|B1~UxUUTsMx>2{5uu#
zl(KZ^lX15u=2&cJ>KHMY?=P%(oFC}!%F^ll`t@rR=%S(1HvQpbKwepqWp9hsa7B0N
z{YF6GCS%gfn_V>0RnE~uc9f2e&O!Cv8bmrGauyc8ys{up@87oMGU_4fDD~r{J{eKr
z@CJ3IbDfDY#K6?zbl6-narpY_6!7M(X?gCQ(VhH^^>&W?mqPmn#Vs(GdHbYZQr5@s
zOf{+qwnJrxl-eN0cuWczygS4Ms_}}O668j~MK(}pF*xDimqRg_2BMII^?yaPm;WuA
z1&=YXH;;m1HG{C3%Ft?SoVY1+eZd-dbS5A-7_}rw6Lf9yO{i3;cFa|ZT%Gw7vEY3|
zDlZ`$xRRhuf8ytXT{6oH^S|n`<@i1*40SyEDfK1gC}75HHF*oFwMy?-#r4dBV$&ES
zw@DIIv<>n#`WN_mkI1V927$FRw-p<>fiTqesw0NV0GfWI$8BpmZGN(SO;E=_7$kQN
z$g}{d$pp&4zhL4G_Vu|k&|~mEsB3|<tOcY|4}>gUru#8u*LI?}wt*x*PR~s@V49{J
zHzyJdx}TyzfAQeDpd~0iD@{uPZ^alnP-<(d@4amXNm|PkE6wkcw%Ih<$P!gxV<U}T
zs)Z~a;H6=bm>IL=gBbfc#rRwnhVn_?#Yn2v;qKVj<g}jsBw<zw7EOmb30*x{YI`Z`
z{E9s&rm4S?r%X7eZsgn?f{ec*pe@V5VN&pH*@R?Orxq})<MfSryFRdjUN;8ybA?eH
zgWoMH2$2{>{z4>);#;^+pPnma?uIsUi)rkpZORz6m)h#<uBLESCmz0K?B0{5W8_AL
zRK4H~%YvQ*)0PdI1wwlvCO0tLvdU|1PRH^}C_~ocdV6{Jb~)5n`8~=&jD?U`0zuou
zpQT?javy{2rt)bkFu7Cs_}f_DRj7hApA9TM)66zwWKmEFB_nxprdplpOjibIV>xv}
z9_lFH#`8R==n7;O6I^no^#iIzc9nCbMN9Key{b4@F&3D5j!8gvI6SC&++MYbkHG_m
zg8jLs5{%sW=AG=~CE>`G4AIyE;EgYY>nh~xmRKEw(Xx5%<a^|Dt7v$qSQLW8R*P<B
zMzeNpmTjuG2#wgCUOi7yV1OkW-4QZv>8o1@t-7K>5|wuPz_e{Ks}b49=Yj8+h0zMz
z{c}E2HUfwWXl)spxH(u}xLNTW*CFyg3b7wZX#G6zkgkAoIH)j?fPSn1(S>tl=N~-#
zs~-X)-`~FjB`hd1pgi{1=kGlezs3Lo$M_GR`q4B2t{(yt1=@7bWbrrjgXGnZl=^Qq
zj{iP;Llu#~DW?N8{WqQUn{qmQAe?^bEa-)e?=N-y^CgXcyM9v$^cOUbhe*diiUW0!
zPBffL|JpYT<}T3-7l?Q7JijZoS-V0Q9fe*|Kzw?64&Pg|2TKln7VqCPE~>Y*^+te%
z{PrtQ!+Wn6)xcW>PD(UL3}>~ES<IP$E=vSRR8#u0j)ak63nVyYg&+ikKwHxF%SR=t
zv+HfEzOE`50SELv$nf|NC!`hcZM33<>Z_Jp#K|<DF^Y%H&kUC4mV54A-HIdv6cGl@
zuN%+RdW6bYYrehiWeWnn<%?KA=BnAbb|BwGy%kV3QBY|U0;xo{>S0eG@S7<Lt@;I5
z_%6PkcygHdWOCRlMb6Jh4;_6?vj^;55l}tg2bPr}I7*@bofL||cXzj&K;Hsz`DFIh
z9s+9@A6c_=Q8ug~9=o~`6j`-r7KnW&%(KG+POu0NM{-4{+a3dPgfE|rm)lnx11>mz
zwO3yOns7gIr|!<)dSD$r_f0wP6fbFD?Z|@h8w%1}udH)@_AZ8?6+Cyw*<yfzIxBy9
zhQUPAbNu4In><*bx3|9J>T!}%G3U`ufaZs0ubq0Yv-ghCgT@kMf0yJ|B=<~DJm}xa
zG)`JsQ7rnoHZR$IYFy%vd#qYDHZ>K|6(B2QzFBaC1WJwO*`nhE<pUFmM7562ZK-x>
zdU{^MfM-D=^!<&X|KBg>{0h$h@{OYnB-E9}33$L+G$5@&DVQk7UNMXoHdlLC&o{kG
z484l<Ip-BXotd6&OPkT^Ao_z>m^i4QTu4GeuVS$G_Eu;UMDq`{4REd@p5I5&>qfws
zLbgA6SLfiZ4#2sM26vYtYlI<GngznAIab0|aHVWy_insIzx&1)zcmR)5i2vzTs@Ww
zCC<rw5X(?yvVS*QJO3FU<00?@l?qY<yljDwa~ZkJUjwiUvA!^T&~Ds(!gG<h&~{V`
z;v-P+P$zh8!(s8WjQDWAkpcj2mdYxynFzo_4m$mS!AJ?S#qPSybTv>g2-Y%RdGu}}
z7YNvrXu+FZ%O?l?dIs~2{LI@D59<p<tB|;|vF^3+vJCv=P5grz&*3gKys;Xc9TwOG
zocH+xaJbd;AKq{P>Z7k{zy?b3(HQ__>(?A6a5R>V&mOPmrUQKqyD7W9*;86=0$wGW
z8DtM%J_$N#MEd*t5unoM-f+<4*&&zu7Bov7#RFHp6YBk22XzgYBy#0Bk9v4)fjkww
zG2?}D`fc7mvug0(!m;%l%U<3XS9^%x6#*jiP9!7NPbH=RKvE3Yr+W1H!v~8umM+-|
zIw;7Syq23qtt&a8uJT&NxT~-d#ct15$@TkITc*<6C<alRSdU!AF2Lhnv-Vc*13xqx
zyrCdfG6xP@sU)-aTYFYqbey!;NVOK8i#veiVA7`zfzN=K-d~m`Z(<WRd#O`ypW-nJ
z41>W`TszcR^u|t!55QwJX!EQ@37Wjf9#QWe0y)WwDfiOA{(8;+Zl7C{Mcw+SR}J(7
z6hIj?>u{&*r|X;nM-QH$mINpnsLqzYbB8l|f}WW*4Dw3`XM2))X_Hc=hx@mWbok2A
z-5k&f`2q$*CzF4u^a}Es7}f_(GP13gyO&k&%9(T-FPZrr{n@4Z>oEQ|ujl<+hKKF|
q&=mar9T5O#{m1oxw%NL4HoSZu%a9_JL%%|IxphPNdXB8Yv;PAgCZ6d4

literal 0
HcmV?d00001

diff --git a/images/CompactPerformaceAnalysis.png b/images/CompactPerformaceAnalysis.png
new file mode 100644
index 0000000000000000000000000000000000000000..f597ed51243fe7150a18b6383cbf2f277b44f730
GIT binary patch
literal 13411
zcmb7rc|4Tu+xH+#WGShTrG?5`*+O<IWJzXh*|P6t%~(t5uA~Uri6LVc%P^rC<Su1t
z?914a-55)@?C*K0`&oX!_j%sW>kl>8T-S9T=XoCI_xK*)<M5ZE{&iMn9%dK}#;Sco
z(+CEmHHE=we3%%(l^+uUI2cS?L|aqM_yL(ZbnwAZzl^=5<o<LeCntZW0RQ=RHB|{3
zd3ruo!Lu*V(~c&J-WfGCzDC10arm-GbVSzkT`jiWdrykr2!8n@BqBlUE&7+BAjgfH
zkD0Uu5Bwb3*_|xdH3>kc&YsZ@_!+8XpfppAo-fYn+?ny(nKc<X3~bQs3g|lk{yiWD
ze$gHSzi3$gKR<?t)Bo3J|J%m|hi){yqsqr=V<|RFENlxOCR)2aA?eUpV*B&caqBDJ
z_GSyQIs=s+6O1aq9&*pWA7cw#Zj}=y+7g%fNQ?bWnSpwWzSA#zee)Zq7YPd?2D=-X
zduBXxo??=OmAJ8=N4dDZs_b;CByadx5d^+fZ%Rbe)+>9xADA`>+l*gUNza^$T_LhM
z)>wNbf3%#u=P~@jY`$uWe`CfVOeAb?Jxo$=@Lt5B6Bkw2=7%giD06E&xx-<5AugSH
zG20C)+Yx3No<r60FIXHDO(u!$4s%@v@r4_{+@3Ym$|u`ct=8lAuO$VTOyAvQSN@eX
z!Y;ETI6?@*_ilIQ=`Abn#TzKktm{t9<Y%s>taaTssA4uHHhhd^5ydq8oM<LYnpJr_
zm{NG=qeIUR+_2vJ`!CMJJ8f)^BMjw3Ir27o$(KJZC~S|Z?B=)+R2G@{$iE3+O&!_(
z>=vA<9CETz%c9PEYw-U4`;Nq3>#+22dX5rTVM@~Y$ad?<m#%`_6U~yfub&;4Y}#C<
zO!U_7RwVZnTPl*a1wvL{O(pF<=aw2@nd$VNY~kiiT#+Yk4J|ai;8PR{{_f0Gzk5|D
zj4=BkjHcNLfe=1tkn#E;r|_Gl)!FXC5`JxMZAWt5L%P<HngycboS)xT{fwe`mq)IK
zy1M$`%D4#25u3^&90Mj`B&3%!HzRP8TRwFA{n6vcoAdNiZ*uA8yKucz0Mqe!yKp#t
zy%0-`(@m228p(3}WaFp1b!`*9ej8s6Lhn`vT-kFwAjVO`QNh5<W3SAC`|*P^7ORp7
z%xvl@vQQeEC#+jZ)rQ(`RWA^?T5#DK(THDl?baBcE5zMRHz{RFNz!0|Ld)oahEA=a
z?+5<VrHTRbX~BD2BS~Q!Nnx*+r%27UyOi3dk)5HD<fT!J+dF~HY|k@F?)hOAJOPAW
z|7A7)xlOPi4F@^BJ}gBg_u##(u}cW8&kD~sTjfT+Ot<GunAC121X30JX5V<28yR^I
z`DLhtg&G(6T(l;RB7CLoWxa+6x7nxn{!R}VzHt4;$%F4tQhJKwuf^~r3tZJpk$(03
z`JqOK&GC4Hmc25BO4zRkffQ=d*4Ghl#X#V#Ex1y<#;EOD|Basx+$y0T%%ULAO?v(M
z=*HTBmuSoS$llJ#WZSQW&~?RL3X)2e(bm<CulA#)1g>nv$H(g}Rt8O_2jl{$cH~#e
z#gHg9bJ-uF)#}t)mj*_5dx8b+otzkD_NFq!tZd1|kgXQ!9gd})tj;y9&490QLXO)%
zK0RyQ30$76LffP(_%+>zx3OQZNwN;@7sWk4Dc>;|Hj!ZR(Y)7?4)Jc_2HhwrbWLix
znV6L&I2X?K&+3_nv`dD1NI6v`l#|<BEMzFn`6gJa7uMwUk+9m4Uc%C6UL|;jv-uR7
z*>rQa<0)$41CP~?c;oKQmfpbCt?kW|0>O(9?S#ndRYiM>cpBY?r}`EIq~Di4x1FtZ
z?4mi3eehIyrB-n82a4aSN3{*BWsUzTnvKG)IWo0mxn?-rAZU{v)n*OfWVbdqpLGpY
zTKVA>x<fy+U=oHvByJS4#==P%N=nwd^_BJJrFSEHDYKHkeAwE-?nH5mmK_Pp>c<tu
z*$fy%{HqS@L4=HGpXB7db&rb!N`n_|;Tt#_Vu!2`(pvQNF;-gz&#7<ej(i=Rovl08
z+dq!?hJ-2bA<^@GY<aAS1BO&Z{lZ5*Th}!<Q)Jv)LRhK0{C1ICtXIvsk(45QOURCZ
zA6k?0_3);h&Cl_#j%kSJ5rNoQ+g{cBk=DHw1ab9cfURwIONvbM^G==kg<#He`qHD8
zQ+_qYaznoH`Fv9eq9!*LwFuaS>$>anLrT#r6$iuFczy&YDZO652=MCEN?QutJ3xb7
z@z>U(sH7zO34WYwPV}*riy6D!?3eS|jYlN;EU)b>&b4JnU@U8TC^8iu@w;)`v3tMR
zNlEC$UlnJuV_>;>e^y8Flzi;J)}&xud4KG42`!?8!rS7H4<#@nB|MzQV)?Dw1Ci_V
z)K%S)(D$De8gB9i<mct3Xguq63$Ujb+ft}Gco|;$4Su);gLcr@e?eI<TRkzNR#-rc
zEfsL>YOp3!<|YZ7UVCd^j{L0Gvv;xmr0{P4NJQ%Od;x!b_>d|EjT_1!9$!6sSn2t6
zO$M^BJs`;W6FHz?Bal5JJd#H};z@0TnLb7;IZe6FFHOIb{Zc-=E~VsIWqL`dB?Ggm
zXCM0|1=h97EA_>0?`TBRJaWB#d|H!UG8ie{Ip$i&>>m;l$XBR)XeV+(mz~BuI)1yo
z(dA{kYA&Vl;qrBr%~vKDJ0#mJJgYvrh0XeZZE0EA`cU2KOU$_*%fMBFzMCEqSY$|-
zn2JU%*rl;;&16M)1Pj=OS?!$SY+A#yp)3hVnejcDpvaER_8+*D#G#7!W+v1h4a^UB
zhvj-=&u^`j4AZS`sQ;eMM|9%V&FLJjyqTFfa(+yuT#2dEjEf?@HJLR+pZDs6lCfx1
zH&Yk-z;wU+D1(^N88O4U4(pfMf97UyR_UJ1y}sDM9(}Up5rAr|M)ZMSYoaJzt(07}
z8m{$ucU0qg$-AL7>OiZ)^eO9f0}{i^b$nrWC8?E&Zt^RB8tzb`<}*9rFk<JMyc!CA
z+M4;B*19yF>W`j#y;ngIkB(ARl%tSKY&A&iYDGBLAmuQ)N>Jq7;%Gx?lH{A;E{N$Q
zubNDN5Y!s|SLou*=&Q`V?J36;e<PRn&sjZ^M5oM<9^9w4249|&n9n(6y@#EQnFu?K
zb)R`v36E6tCMusQ;;U?_Kf-Rb<F}o;w~^_%36N490FlZ{L;p2@a$du*AifM7QEX1S
z|Lg}=9_g3s!$BmRc;`-)Tdzdb&e{NhJg{L0FsWLggck3WpgN%Df>N!`T_N&kEM1St
z`IgfyJhX<KOe!vyNb+NF0^TvWzW_3V0#c68<qzb03}PJC)=y9t=ic8RYq7)ltBafC
zm=yX<7fh6H)vb$Jjlgmq=9bYVO3G2tt;c=Sb_FOwPV<9RTp~^g3keUFyoF015e}==
z3F8^&Nu@)y$6PrI<GxEfkM%_`vLjms-f`-Uxc;@k_(GPsdy9NSdJz36L&rm<Yg$)D
zGelGya#?}RQTH>?5T{l!)rO?ghk&~tgppOv*q1hfJS{zya>O}UKOx#WB~OlMc#)Nx
zXR0d1bp>NpcHfUobo5%3*r-)teBiixa=BCNnAu~p%%j>y=e_{s^Nf3k-AhV&o@~jU
z3}8m@D$o_TgiknHa&mHt-o%sdm_=u-?tNZ&*DP$!+40i|`F+?1E;_Ftqz>TaoCwYd
z+A8NOG(F*A!84L}>DFOXmkL!yjPGXM%1&Loq#R*ydzlo?SAtvMPA3gZ;nTa@^JI-!
zoh&tW+SvVg`w5F5S#0SsHa&8EI>`*GtoO+C+M;orZk7WftlXD#)yM9J3G1cUTlsXo
zyTz5~V)y+zf8gI@SP48oVq<3^%!^0RI<_(g8c6J=GGas&S(z;Rq_`N`Kol+{mN@0t
zzw$DBm!o}MEvxYZ@P-bInN;UB?X9q~>e~lp`<%~s4#`%xuFegsF1Un6KNgj;sWLNB
zx^zwSAsL~=$g0ufK)}_C2Su8Wm{g~)V*P$Z?f5l7r<5KR?$(oBi=50@$PR%xvFa1#
z%CxPB67mNNM6?BIF`R01NhLH)AR&MW+R(sY93|j?|MoF_IrWRfLVvbZgk)SZhX~;f
zW-V=gg-6kU?&1z?rsBxzM?AT?+Df2JUvem0sg@$7fRl4ccWO<M$(ZpNsATPXrUV1y
z(;{M+O_L-n<BBb76o^q)#Kv_V#~vHYvWDukmz^c|M%ATat-P-<Q0N_LKsJzdjZuuM
zdJ9YERGWoKXE@E5fBZvhYiq*CkLo^4PJH>j_ioqju3}qvF5J%hA~zCzW{Q+4hxZ%w
z3SH)vGB7hsu3B6SsNJ%Z_nSTHB?9Jmil^a)6|CY`&b17dBn8Wl>Wwp3k*|zd4|8*K
zzaXKa@hfeKwN@!b8!H<t6)PJlvK}IoUTm!=Q`5I^iB<$;a)Tq1so05>;XVH46*D&b
z_+3EdtIPz_4J5C+Ws=sbR@IBDPa^x~0Us-tY@*;id5VuoTFqTqpyEd)R5sgV&z?Ki
zD5Wo{idmj16Cs?(4EM5pGAHh=S%8Z?9_=io+4mdEQ_I&F!1lboWD^27;yN=2@`T&o
z?oP(WO65YfIO`Gf(xniILL{evfWV>*70yrDjTQ)<mOJ2rx)zb@)d#WG(||0mwBWr)
zh|HuS4Tz{`S~Q@dQU$iZGnN6+!Oqk(U=T&-$qnJVv~T0}Qe~4jr0qq9Jdu0sVZR~@
ztkM+&zTK|xsI*Ar5=FeZAF{PJ5pxLaiKbm$hlUA{k$$E!RsOjH`&mGH<i-$KEAb>r
z>qPu8vU#wVIc~v6FYU^$r%#`b1NMLDR|?NDTwD&;C6YNPe3A7$2uQN)ihi^9iEzfE
zn=@C6CQYU9O~1Eoh|*S5d+2h~lm61kROncY+|Bo0;38{6nFn3F-+RE#T7#Pt#h0JE
z4ORO^8usSt@nV~L0b%s~+*@c8D|Z=qFGmcGE<3@DO+eZG^UU$u34HBNk)6<#lggG^
z<Wy5rllN*0^87bBG3Ur8Yt@ZUlA*Tq0#_fjNzJ!qYd8*)!giOLn_bz@>?YQueP^-_
z@@MK1C65l8R;O3!C47^z|H47~MN;0n>G^&%iWyrl<{KhzKGd;<{BjtkTBm*##JT0x
zw|J_@qt}%N-poA6zP9x$9CBh(rsBxtR?4QrF6~o^*jk5f=GUKG8;s4(kwXq`^(iV+
zQsqswJ?Aom@A4E_jOy?fSt$5Ue|H%#KBdE3ZIE%b|9Lsyt+VmhJROu9-#S`?8;a8s
zHB`{&4Yt6{zFJ%GB}`TOQ&S3iaVB=SM|oqjJw+6`tnHskwHU+tjsb;vC_8XU^ZP;t
z>0Pg76eIrwRjc47EguW^X87mI)e4^}{f$xfFz37(?#B}o6IPvcGTyx|$5^e1aFu_?
zyzD*KcS$~I4dcQ%F~Fcp8tepAD@MwaB{x4mbqfTX_nuiyD=Ek~hBcx$Zr+q0V_-Wu
zy}l8}#^*ZkRwFthYiif{VznhHEzSLN47b#0F$x-9*s=q%D&q&9ta9cDt2ZW7TX$|$
zHh7cy0|Ntpc4qE&J<pW)$r~HPG(_<bagQ7p^6F=s)Mm0ZgT@~0+jXo2)8MtXl^MEO
z;6#j7-u$xEa+Ml)sw;fLck(R(J+T$c^BL0=>!nyC<@D{r<Ny?1%9Pg!eL^z_TyfZ;
z^Tv*K$i;d_Y|!))D#_}n;!c8z)zZ}@E^kJ5{uW+t0ESOKhgUc>AM3;?FceyN5xNK0
zQA6C)Zapoy_zsOg1ZgarL5#{sNwn}>S|Ol9Oe_~RaJKIeoj6;(e_<9r{Trfd&A4ZC
z`cwlBCymv(uTLsU$|<eXa-bJ0<ZP!@P&;&|eCPVwSJqKUo$cSJg5=Y?x{Q}kP<>eb
zc-7y>Sf7z4=7UDIGUVr&0FpfnkG$xDT_^6mqyYv3WIKd>6h4m!0k8ZLgtY%AhN#xj
zf@_ejvj6S>@{wx`P_A=O+QJjC{p&ura`5}JXV2bnbw%4dI8>zo(TK_PmkPVmieY59
zj9ZTwkPlFh0`gYt*;#S%)^2GSFdDszL&^mH9A~D{6*Z2GjGXlM^eoQJ&3*s-`HBn#
zc5PwA`jm~3kkHreLX%dis7djSyLaCfx<D4f3(dMkCwNOh`Z!r-X=Nn=^o8O)dOMIs
z9D;r>DT7(4bc^PPch>}XT@V#rHZH)qPB`+wVC}O&6YyRjtT&0{2Tub9B)&7>AV?2;
zJO72#JL_5^K;Y*32u4Dl;*wlOI9%7|-A_KToNF<0+uOlDijtBB*Pfpkb%kDZUQyA4
zjB`1|E9?I9$B(-{*S5i%Csuo{0}kn!tKKj$SQj}B0LQ4W43L+Hfp(VFzS<y16E1fm
z`OC1v!kwk>|Iox<L`mC28j6>p$b}29qF8y4lyFpqqqM`O+p>=c2zY(t>5|J%1+&)7
z0b)Wk&`|j9@dp`pi1Y&J6x-QcJp;mW_;inV%e)TXcDpPbu{Ekn)6Byo?JO9wxpGO1
z9#YH%ZRFomD+g|l#P}nHw?PQ8WJG<A;Z3bH^XDP^UWN9(OCerZFAiRa2#gshwTm|C
z)#zn01-PC74rO4BB68*3%ECw{<T|dI8qsXY{-&vNUb5$0T#{J9%wEY2KWOl)1BrRf
zAzs-QoRWmNc*2?MFTQ+vb;bc?nUHp8s7Tn`-SS=^3P_cr1B#g-mbi)T^_BA|xP19?
zi=7v7!*QmsGzVjWFTUo^`yWEz|H~nPMgQrpnty{O%njYyoQ%5yF=?Q9)wxx_z%!&v
z%FCOv@n4;m8Tu<#cMjq)sxgO5Vt8aOhrt~k^9H?}#mnp(*&4HaCz`ml4GfZUbI(FH
zgmV_%*qM+FTjIg{Q_TZsP)XYisJOTzKDN%#*Q!rWeNi^Jf4}s@_Rr=HthEYs@rmd4
zft~k8jCh*n;o&Biw959`&iq&)U~oe8iAMAd$2e~Zt;^v1QkPT*69mHXGxUXO(O4Hl
zvqE8;N8RiI9(z*JzeVvPzmf<Dq357YCO0ZPYhyOs><vX^r-oOAZ25D`y1zN85_(5R
zS9by|^kwhy8~s&2=k~XA_@%>Y1S*U=+N4)!1PDw=wgzJr08kXz&oZDF@|1e)^SJ+2
zRTaGUYmLL84q(GAQfRtbK83?I)0B+w?le%L`YHB3(~K68kaz((#a&4o`n!HtAz=qQ
z&|Ve{y_VxPji{kt^X?Ubran+SaIW1tmG1pNehnU%xbqUk2JLdkR{OcWQtzc7TG$Q1
zgxryj@YcNT1#hoGLtf%53C`cDDXO2DNU}}@h@+japMG*G`I21}fSRup%}K2eek&Jq
zLWnb+`MLlC+K#6PLksopkm*CRO;y!UnS<_y^XHjPe1k+=00UC^RgN4hY@2fC&eE<`
z^uFD~HdX2K3;qP;>NwC1X#@tc)abCV{FsRyak~A5+zjuo_H&aDn7>okSn1aL%`1ro
znw)A~+*6Mdt01b(2GGQ|E9;SSrH$juB$cF&4kI&Sa23cI8{u^wYo;3;8~dwa0n##A
zQ{*vQb@fLD_8vpk-S;yfZSTz`yIk#fVeekcfUn1`gGWVdhJYs7@$S}{eFxK1gBIg|
zVc)=|1a06l)QftGvXo&$%|_7Aac!(iLo~Y_9~uQz4AF?1WCqxi4=q&sGEoXGFYN)0
z=|%rJ)BgAObM6p>&4!T_an3R^up4nelF_+!>y?-}?nXyP#~nR7m}XDpkHU`o9ab*#
zj(GcYG24jna4uaP9i5v(&2PET5ZP9glQS_gGWvbDZnC`aotTV<c3O^-yG<zFB>R~T
z)X%>;4IX^{2h2SPA`gCJdH9!76YLdDCR)Uy3lb6#ht>v;;yywgk|J8*Ju?OX*En+g
z_>`;pMgN82);jRRVe=sLQ@-#W)(3Y@x+KmpnKIb`(s$XW4o2D;CIsmMUZ1anf{V&^
z!eFoBrKzxPQD8`NW&Lb>PW067yIVPDRa8a>zcn|<A3k#p3OG*=Dft*Sz<+enxgP?z
z{w0f0d9avOpbjz<y*&N&+2l%_dRl-8a@6wwg5Mn6h*h14W2$vePero}Bwn)n{6-`A
zcHYfb*xFsPlsE_u5V0XUx^Q$7v4c11V2@*Gxu6rLc>=NsfP^601lm;&TVpH)V1kcu
ziVS})so70Bf+HS$o1d2s@|}+kaO_IQ735zhAv9EdgPBdR8sy%8TKHez^3LiZbkAcw
zYh>D=5q0#{3J#hm7!qiKM~5?&piMT9|9&`VRmbc12%4+R&`77B{Hv8p7BBx?dbt*$
z_2(|lLKCuG4Fd)fFXYYv&4wunPT)~G_bi46a@x@{6YR=n1dOIR(vQ-k4T>kNR3Y8O
z8^FcRN=WFloxD<KMF)fI5k1ON>`x^-(89sSrzr&?KrG0;9?L%`1A8|CO@-_2WNT_O
zVDS=kjBL`~VsIm))2zI*_E;KK@$0}E3<nC(%Z5js!Z%;K^%iSGl4Giz0Rv!XR&?R!
z5-wyKXoa*MMHK-t8p`#8SYfWE;4A<idb7k078qmrIw`67)3f9Kx-b}fArhs=B4|VJ
z0^F(t(1!v*4SXp*di+6imjbt_c%gIWq6rMJiq~+0PFfT9grH4iE&wy{AAcVNVDqxb
z0^jtAp2Z$y`x(W&FjxgUwA~-OD%?!IHvO36fYn*wg62&N1a~o|ptaW^3O*$qfMp>;
z{(BZ<UZDeE=p3Yw9yAA(RC>oYUEU`O8nC5@FjWAp$UzXb;>H?dQ)Nxb-$Qn{H*oc|
z;pVO_gYNq?{g|Z|F%I&Txl>>XaZ<NfO^_}p37TxGb<7b~0gJD$^JiNyfUh7Y;%5Zr
zYX^CF4OLfkVXdvB*aak5j!V1-zMrfS1!B%aXzvro=laXb?vGvb;rsaN%=Hci7MSbd
ze_ZvC_kQFzfAIQ0{p|uYYmsKa-6lFvx^qIXcMf@yN}jYmY4CIXC%}GmK!Mt<+|dZ{
zY3XD65$OJ3fy_KzNdt4e0=6Jxn1RXka2Lqo<nRA@eCNZ1Tgtn?>;jiQ9T$?3frHYP
z>>3ZO%LbgmJpgA+ofi`l5<c;RWq7=A@Em~91OTeZl*6<zS4PNIcp0GAAX3CiyZ0Fa
ztyes3drZIqFes?F1iefZnh9DRg+i4%k@(F%JSe^S=As%I??nQR#B+mmA{W{sp;Fqe
zI3Zp85n_n2&8MeOw)go3pQsXY<>l6Vje&l~_Fn#RO13^B?=C1bMXotK%%f5D$O^G^
z$u!v?;B3#SI&LY)FG}l!XFy_|Fg|YY^W`F${V*FKPH9UIKmo-J2>VwT>*z9E{yQdr
z!NdY8XvpjAMdc~JMjB-lW-^7Vi<;I1EXdZ|ZU0*80Lsamz7n#UtC3OM6cO=`nT4g5
zIyiU-RKxBA(&?%I4m?(ciKFDZiIr7`{Gd~N2}-H6@ITqLVJGCBEXCs1#5>B{iyEXI
zz!d^Llai8j@7zf%bg6IC5ul@^(-317a32v5xVcS9j%b$Z=U0FjHz;{IA~W!v#lj$!
zz6uxF8f{SRgoV#?L5zQ;?fYPrkDg%}uZ-*K@u{hxN$yK`9|J;f7~j4I&ap_I6N_sS
zBeH%9Vy5>&oRseL<XL&!MXnp_1t;pPlG4yk3m^-(WGD@QG~!*sW&CjnLJHACK?{V-
zVY|T>0ELDsT=&VfUE~Tkp_C+`pcY$22>nK5k)@@jNsQW-P&lm~U3iKJfCkPIX=fTR
zHWY0^1d_!Ug;xYDSYa7PVc~uDaO{zMej7WGa3tUgAAvIwNH3=JxCbx<;4gn)+4m|=
z>W?hIn)7PtSWU@_n=Fza1nC$K*#LMtlmq#T3{)GQ!7TS!cqIUrPtk2pQw~W1=lRle
z$Wyy-Dh_>kuyi`;Ak39%|Apn^7L{+<uB<L*$-0L@oC1hLiD_vkp&{R0@+pTP0G^Ip
zC<OJC8$b|o2Sj3p3&rPM=`oN9z4wM9Cu)D>PUYOPvgu$pm@6|lQAv$J$LqFVo^0(X
zcQV)jMeROa7{?fd0z6adOK@2x@HJEmH^N#eRn6q3-fT+&xiz5U-|nb0!Z<AU(O3v~
zE`VVFyt2N7VFB5Hl59hxI+qQNc9dJ%`Q;2F3yfo6|3)nU<l}#^=83J@Io<uMdVnY7
zf{<WT8yW(oj$(J-x7|rKWap-Z-ECMwHSXhE%(o0BQC>OE*PxpB74TY@2zuD1)A?Cl
zk45=bWPvYTgOuB_Br&toAQ_GCFxtI9BX|s?ggY!8CFtaC)&{6-oDnqt3RH4+yuHhE
zQK+w=zC4ph1G~G=2i~@H7Y@e=Ry?W*TK6==Ilp=?pkf6)rV*U<^ZQZdd`_?60odOX
zXcN_=3>e^4B_=SzC~!93O4|S`8lyx97J93?Lm9h2uSl9g-~@3gDI$BT)_X!AfH_Fg
zs6KDoEq-T3bBm`$;?8@)R9TP9PDg~#o_!NV1^MyI4}guY%(204HCYilDC_{n&a;>j
ze=aY#qI~jhCZFb0@P*vyXc^ihXUe|x5}+ED^gwjv38IJHJ=85K*hB|3+BI+l0IdjT
zdW!_Lbr|e$VijTk#L>bujXH32#@Kx+*9bHFo8dqN;>m&iAP4399DqOU{|i{i{*8}-
z!GH*;J_d8$e{aY9i9eSP#3ZMB(DwY)3v@pOy#|W;9lB%FLf-qjuq`kYdEW`@(@=f$
zuW$LsI@yq!`+r8fAWx6_GiV&}!d-fZ1wH<XwwlSp(?C<P{pTUTO+dtm0fFfT5IRMl
ztAIlNApzw(M~)mh3!*_;SsCD-;j`-dw?*F0*Z<mAYKH<xpDPb&%({r;I~TOHw91^@
zPlKYf55Ph6MC08hIAn*Y0+jKC76HnM5}Z2R)YRE?YH||L+oupR@!@Jk_wN!(1A^za
zAG0X{Qt#DS>#f)-?}?{pg@vmDfrRS;HZ+y+hYbOG%$G)sz<Ul|#Wy!M3rR?P>&Ds4
z4HHryK74p;ZuGAt|Kxiz-~Y07k99o(R6!1!!hnTg(7`ZSVC2%>)C!QT7@Wy44qzOb
zuIK+kSm9q?gJh6wPEvrnoM19#IVSdUWyQD3cP38EqVlFADT4|G3S+K)!zXDG{{EGR
z_!NwPjE%LLMUdAMpb!H8XMcqB6jh;Rqk)|k@(HT9CY?-MGK;b9jWbYrowgL9-Ch~c
zw*-AH5(_pv3w}ExeM9G`qyEbrYN&fuyhdo_3r65ZhVsAtOU8Sr*z){qA8bpU-F-Ra
z$8Nc28JET&PMBrX1rn@CKhbebtYe0a-`cDCytsXjO~}hbU@`uPwT6cZZ2Lo5>J?gT
zRF*6BtTI$Be)IO1h8z)H>bJ1LbDQus9iq|U?=Cue`p3MpYX1iDR#oG+Z<;c9W>EL<
za#1mmBWZH&W8PmfxN?Z~a`?@4ixTR5Fj;>d=X%yHI^vHAl=|HH`whNNDrOVB6bn1Y
z;+&lz)kLuRZ=Ka9Q1AK6O3&r@mCf;^udjtb7ZYS{^8dU^2Dmh5$s|UBJE8fy;y$;(
z^l9IVa}NHt<?pk=marW9Kc6tph5wk{@+@!mkHLR`a4z`ga!j_<A%xTFQ-1`s9<E2J
z6rHUP=okOo+I53$Q4>|z?o)=A?JKev^;2^sn?bDq-C<~!yEgDPS@^kVe=t|D6yYfa
zB84XA=?aPyR%A2iaKEcUqmd33<z<h+*wCr(GKJrQ78bhO9Cf+S1S}d@WJA%pZ^ZL^
zUR3Vn?WvrMdt5V+1-~Bvh;C19q|X~`dnl#6ywc$*AZ@ROMrtXFLeL=dR2G3p-v((+
z5c)PT0#S%-TmzK*FxBw2KLWy=yBUalgnN@zcR{WT<H-hNkbV7Z`<PR<y*F8ikvag@
z8z6w7unWqCGQ6BI`}+2qGW2aEBI}z)e^O2MZ%g02jo!p5pjg}K;Q2Tts{2BbBb@8^
z44)v)T{@zseXLcuOHNh8(>pXm$irxbwr`NDt9F&jY2pLozbhX4Rh#7?qls;reXXKT
z#psl?muNuFYOI7GI_s?ATd2ULmqs?@@(7CN1F;2`<?8I$G|aJs96D>PrLkhT;pRjS
zO*cWryjuIo14CbDCoMXE=*nRyzxXWH_96dxLrd0njX%qh03IH)_S4~gYjR!g;HzuD
z7whnG-J!GZQ3?6FLCTjS_<wc+Iryd2t^~<O<>-yyx172kL{JWrJJ{XNVL6~|rl!pp
zWZ0A{U(fk^E_zL!8#pYmu1-d7=&UJgyJ$`7fgpH+^MFDv9K}gUiR4Q3y&^vzkjI+9
z#*=}&?7&LyY2smmgMCmHcY<eP)JWeubzaLjYc=s~SEN2QmOHqHHX21A=PT4vc+C5H
zr6ir}weOcqxmM2CE7f6ZB?rI^vyOEd+Og}by|hn9IkE1tjaKo^^-_G$`Yv={VQ?Xj
zUwmKDakBjQM;-mw8McZ<?$2<Chex{J`!~(F^p>Ic%3>;49EMG{NR31+XGGmoH;R6>
z(EPGqx8<TwlMZR|$8E2s+2fb5HV~h$kGElx9k2Y%S3y29+VzROhC|!?*?u>Mi`-dt
zLhAtaxzxD_V^-!pp>sh*Bu?wuF>P~m9$xxWTe1th{h3wmQtp8s1dP?2QSOes;-7~k
z52cBbR)W7*H#Ge^`*n`|b)n=`cDZ|1;j>_J)h*4B`VJ8JquqaV#bX4PnPrcBQRcVe
z;W{L{s8o&?Vca^Ei#|CQU6>YSm%}OK_JEyq?;=sVB0A{?+uGAxS@l+WKTY6oZRNnx
z5xJqG6IW=mM`k1evE}TgOQoMN1NHftm|NL`h$wOGbft#tgzBbmq4zUJ7fa?dMxSxB
zn=nc0M|h37h0zfn(}A$y3i8obpPCOJ?)>=iLmim`WQl7-i@s9_db0(~bsJr|Gv))s
zDh?IUO@cLiw!==hE2e=|n&IADd2qx0te%`kGym;et;UBL*$$~AS`)iYHa1M5z#9%j
z`R=}4UV?iIL_Hv`H2h2aDY*p$YSXEc{~mN&uL0>TJn|lpIh#TDDWt4CoObKo&RtM7
z1}ExI)fj-!pN}*wOds<zLtT;SUVSCmGtCsBXRqAsoEM($Dj1V7#r1AB3WVK(x+nvN
z1M`7OcxDo>mF35b6Q|Ydj2G~&k#%m%`nVRe=J8;6JJ6-K*fMgdS|5_4Q@x00^VJlI
z{@Spx$iUsHu-!&C#q*ZyAkiu(0x>lS5a;*gDB>9CZ{zhFXmbgn^U$yy0jj?)kihLb
za<wPt?Bqz?(>q6JLkq-uEf8Uy>O0mx<uB?zJ5@7d0fNx@%@3N%dXVjvzk_xV72Vp<
zovWR`+n}z?C$J8fbxQGhKq2fwayi*7-a~JmuR3tLO?u~^Rk>qKKN0j1$_R9nmaxWx
zd`Y3%Z}aUYXatayB>sAP=l#9<JLB8CTMO8Wq;MKKk*k%UNLvQVOI5)eWgkFe$mM(A
zRZRxkB+i`Cm~2Vr{9`}p{1g5HmCL-H937EGx3i`Wt%NfB)fy+NHuE@}zuR;3?77tE
z!85&l_<&fQ%uY$KPWVLCR7O0g1t@+iv`%DX>%zGGhov=d-=1C;l|NQ#3)aX1G*rH@
zHZ~UmeATOk3e`(2g`3bvoFDuQ!4wC%xD-@b-nrwBrmc6^C}Qwi7#=!+b0$aa_Q<u#
zepv0XXx&TgSY0CE5^Mi4ihjg_Ra!i4uR@h_qDhu@WrK<K*mrZ#Rwa+K;g<K#-H_=8
zJr2uSd7a{|sd7o6=Q70wl1k#w8GPQ}Wc;(7&lsM9?i<AC=iHo}18vnJ4?B}y@%NNT
zu%I3mfEqp*`T+9XxAoFZ%3cJ!^2ONxYQI7gnYvcl;K^jC@rqt69|8$ohMd3=A68~d
zV7X*T>53+!&jv<(7?3KF)z%`Zon;Iu$G+{EXZam+NM+azK0w2APp|f!tb5=0s*y?$
zi~dTF)Qz@bP%^AK`EnvJ)iW+X1KG6wqf<j_v;H`R7HosZVds?U2TN~p&h6^6y;w<*
z)jTiom|k(P_o71`m+f6$EIM*U$sdRbc_A-f^m^EOo$)1jyt59)kA&9rBRtp5;0Wxt
zhiKTCpL}nT#W{L<`pco)4|)eKwrySL+A&Jr7I({X0qth==8cAUmn_nC5C=>EA%<#g
z3oDQy25MYN>lM$7J(Muk&703I_f%P)8}S(RPpPbM0ps5E(8!m}0SJ=9l48+Zl)yOx
z7SgWbV{U?IA!}monwb8;Ju11vdn9B%@&iev2Fc}K*P)Z@$!<9e6uk$0iQda;`V0An
z>$>noO9a02(S|h(?nSoeZT$X8d4XF|a%ehAI>mBs^I0j#kutWR+TrV|RhDw$17di}
zc#Zg=ey7MY!q6=-cgU2-j}Jga<S9Z9#Wr(f#LQ|<!<6VzQjBM<putx<G5cl0C)cWm
z%{+Qpq>;x4Jn%!ux_lG}nd(E5@cIC=A$^v~F!45psA|2TP~}JA^u}5Fr(#cB`q=rs
zN1v3{-k`9l24sARWLb|Cr<4p-u2c7P^o!kD9|gM$JqP}{md69k*oyorN1|2!<;2SD
z&g1Qz23Jp!RQ5g`)CLK3JZPxs>$YPA{l1lv8Lv<YV$`zwR#{`RjRpHb`f}1+TZ;`|
zEM+UHc3TVT-YDPRO&nM+eK>58J)hKc#Mz8ak7YHim8!r{u16OF8F`?q)b4t1?c55B
z9*Nx1aD4OBZBx_f<UH#*;PbLVNDudv)KuPOfFcU?<YN!>W|Gum`IT;-aU`7hl`Q3S
z*OgZx<kpN?5Si~$rAfQwxuUxFftYUgL|I}_?V55Vt%n9Gw!NGwqTi|gWC^6C&44EH
zf?3dp(SCm@ji2`q);&y=X~P-r^{TU)K1>v9n*#Fses$r0?ELxnZ}$-%IN^T<{Qs|y
zAXq$xD!E4a`g~?(_S(i`r2cXz6evZ`oq%%7(n5nwWvJAZEbk-C3&J4_>|;gf4wAEY
zIB<%OTh24hDL62&iW>_r0?o@`M;oFE^G={%1eVDj6jdid#=<uN<UyHO>R?rQuiFPu
zl)QZR?<dSy!rf2IRRFM1K<NP`G6m8v&~njnTd%Vzg$-yH3CPu1Z6FFOEr<LXjgEWs
z=6npVT;eH>s2iT15{gG5Hnmy}vckVVefkPo{Kmi6M?l5SpuCCk@f*NvCcvKx$SiLR
zn}Dzo4|oYw!Eyj`%dxu5<RcKwa)Z|Ae|HXz0Q8dwvQeNr&<w7QEr34;=*N3y_I?1B
zRH@}!(CIQsR4xXGsmx<Q7Al+o6xVfi6;b5cH^RKyw_qD|Yb+i(5#)Cxq8W5_yNH<S
zuXh6=9S02_!f8c!s*IqTnAC1gtn$y6a`*nr$;u(sV-y3>mjl`|&NH%|TzoDHYPdi_
zNvZXRoY3~$TU*zSpA#8dppGLPP6G{9(S9%Y;WPzXyY}3zBloWYh6_rXPFT&2VNy%W
zYtXpy2HguXalP)DdPV{1PTZ?%5iv38>^V?@e$fn2MaHbgzo_7?S@eO5`VgSg^ah)!
zr${-y=)IzZbLLaVF(?@ygtolf5imL~+NW$i*&nV8gcuJ8FYA%EiR-IkwS=H`<or5y
zpcgk~M4r@{s=%XuqPm4yZ4iRxXajQ;D2*<+Kp`24cJ~K$1L<gC8o*u!MVy1spjq0O
z={(uSvf)+78a!xiZt3PS0ZYyFpC5D)v4vU>4>}>=+=9BvjT?d1aFtpSjLOY@)6@mZ
zT4&FkX)rGB`n5Esq(%i2ooqBiMaP62^j9MvStQ>yQciv5S3*AE>4!X2H6ds^J9@kb
zKa9S(TiVDU5At;%ivhcScIw8kH6R5bK72e$+a;2~Usg_=SlQXp5Dm)fYc+>>K0<$0
zAaaZ61;*bL;INd_IW%YlNS!J*>6?ocxM&leTs(S{U4|AKB_=nf6ZET7`^4!WMMm%d
z+0csj!_?Fi==%82GYI(0|J2C$@5lLHZvNj-w@lL>?Q@PX7Ur+sO5jy6Z7qGxVs)EG
F{|ETbE;axF

literal 0
HcmV?d00001

diff --git a/images/ScanPerformaceAnalysis.png b/images/ScanPerformaceAnalysis.png
new file mode 100644
index 0000000000000000000000000000000000000000..58503acd8a86141cc2d44c4139810e74226d3666
GIT binary patch
literal 22870
zcmaI8bzGF&yFQEsq96zsEz(Fx!;k`sbP5iwbaxM-QcBm*AUQPB(gI2iA>AO7L&wnd
zuED*}IiKJ8p7)Q9I{RU*=ULCX@B6y0`&#o!NkIz#7U?Z4EG&HKSCT4NSl5)Xu&y}V
z#0H<tcztZZ!h%vrOFma~9bcQmfvGvwT-a@1z^6PmhbLS%i)wE_t^e%9eI@JWb=2cP
zHC!E;W!9U4D)&)0uXEt0Nf63qUcakEd#{X0;^DJWu~(17eSf7i_V#)h_sSX5M@@@t
zj;tPZb|rCfbqEmi&zz?0CNW$G6Jz}@V;H^si&)@Q%)iC&VSW;(V}AM&-oX6f%ZT~;
zSh55c^XLEb;T6nh)R?Ejx(S{K3rj5U9Wmz5|L4R1F!)dU%j^DsX8b$&XZg$P{=JR=
zFylXiCthCn?``~t8U2XfE%hY#mz${`Re7KA9R+wF;vA)398tL)EyU9C@(!;bzkU05
z=XAGMaQI^8;!F=UR)$CtaA;jWcG;Yc@ji<6j$lY}6+hq8yBM16-D*008y|YKyHtDe
z`+UaUW`A?WX4q|i%!Fdqgcs(ye)TMib$&)qp>ebB^k~OpV(OcngxC3QYOQB4d&8l)
zW~C+51sI90@pz~>(|W3=)S&GS!im>rn#E~lkfTwn@qDki8=_TZ?Zi^7Q(Nh_t|)pI
z?fnh&F4Dfh4rc=>ueJ7i?Q<O+uNEf{Q*pfWZQJ8{{6b2~#5F8DoDi`$T&T6Qt*@as
zH(}G*J>2va`?-$E+3}t)qqtgwO>KEOw^@JYr-_3>pJH!Y+XE8qdiM(GQvJd7?xBEA
zoofkH%G(9q;57_Zoch*{Oh;7z;up)VI1c){$yyi1^PSknSM~0DU2|6B<#rIl!M5}B
z%?sVu5Hg0P-qct@myPx!o!a?>#*2Drw)YE{g{37ExYPRh5X=*m6)Qx!w&J?|^I;k6
z84T4=cU0SWB6!q$ajNLH_4_$IMKSP+<ig<lYdD!ISu%?*EmIzvSM*F=FOEkVI}5d{
z44Zv%7fZnZigzlQNh>jE>+DYCqhn&~m>h0Pf$d0_g?d$9oXuQJ!G?>qtD8mjF<V-R
z(Cc_0HQ{4<hEy0txF`#De8}#7B->^%RpZ1J7D6Q|(y~e}0((QsYssjrtgH~mKu_N(
zdOjzbK*S)-ILMjpeT?wt4679!9V!(&%PZ4>3Ow>Um~!dfIX^owInp23%)Vm(>&x?<
zAidLO@|=CtfRy!2L-Jc;*6M!yd~AGDez=*mq2I0h^9-U#p9JEj8$4?VJcQiQuZ+9m
zsJ+3)=!P60QwTaoBV*YG3lI9FsH9_<Uw1+7KUL>0UOlc~z2e;HbvEzPc#=Hk?M_&f
z#>>OQGw`g$YJzvyb4BE<?#ydr(V(jJ-`2vO!k+A&!e?XLjwY2h3aKKj>*Ez%bXLb>
zeb2o2*T(QRx3}A<WGl>vx_UEKd8{W#&4forhS&3F0^ozmf-XH4aR=NED3r+%7PyAF
zYITK*4(-AuA~L-lcYZ~DWMFgZyf!W=Y3+@asP}OkyhRi3kQ>JO=BtnQ_si}1c)1{)
zGTbaz8KIEeb;ZHmy=KDc0*w%jciO`m(Riv}@T?crml04sQ)Q#);JwfpV@;sTqm2@P
zLNcPm!+$#j_KT$>`7B4n*9nKRWMlDgx=GcwN6L)J68LPaDKA#?i#emsQ4omW+js$o
z?1_)|tQV!rax)hv-WTjGtKYmfN!cdrhgXXmQ_R3n7T%#=GskCIup_9D6^`Pj*#$|#
zNvh|5e4A$m7Yk{RwztTc+^ED-M-&5BU1jJU3dlE4EBtWMH|26edtulD_{zOPyTN1L
z4KQ_9kNq`{RkN>ZH57a2nbJ{RROD!vri4%Z4!JC8X=#fbXPzKw`ZC`0*=)Sf%~LO2
zar}}~_Tn1Oo#@*S+4u`B&ax&|+wG-Hu+ah#gD?B*6DAvtTg|sAB|>{_-;}8|_~#%}
z+&eA4@6t)~SPXYXGn(fP6+p|n3?K&cHPhkL5^@fBIvUVf*=tEX##UpcbP`ONuX%Hq
z$|oDWXOaZ751jUY^ryeLEhRALGUI9D@1$>aF<sbtL(l6dYwTfDQ`6$PjrYlfoJ2G{
z#*DCUq*A79Ev+Rs_2+=|7CMC#%MrWve0Nmh{c10w>GdX``CvP&7*fz1(bN2fTk=gR
zG5+MZPtz@}qT+hHxtGL`og^hC=hsC`MSL00;?ED;L=*Og3!rnZ1;*V8Bp<X2H7k;g
zzZO8>opoKq6qj4=Edd1GO`iGch2+nr+e9yRMFpL%lo@lNe~*v&WOF^e*rvLe<yVwO
zj+f)fQ#HEp<+WW?6#hDLQtPt0kNU2LY;df`{<7xJ=;87_e^91Tab)k$pFc?{Hr>Cf
z?<6ai$x2IeaCwd=Ng(GPDTJ$jzUyunMfMe3Gd?-6cA^^GHN?hyq<{58{q?SiUQ>ej
z8Q5-!n;gMn*-n}3_??vL0bO2`Goj-$_i;W_?7fDRM3X*jhT~BiuiZqvnS5b=*JH{8
zlBcYy=mn3S6*)C^@n~z8DVLg_{Njcc*VDmV)tvy*Q|cCv6@z_jc8KhPrul75VPq78
zlzqWj=oLOl5>U!l&hR&g_owpgQeAb>*sR+P9l54*B0y1ulj6Qpk4+;yBh|atvG#os
z@@iNtZi>*z=GFG$_8eYs$wqCZ>4<~n<QYu!fyr2{OEJx|8|2xD3fD-y$ok=8O^Sbg
zXUtQ<djAGzS6A0;oc&|>qGGG$sJYeNKW2ii?us7EmD8#-Z37J@l^<(2Uw^Fo85^&B
z(yL#%iFEGFCv=)`zspr?c7yT6q~|z!fJg*i#(hIeOw7lv%WFDbq|GT6R9NwQI}xu{
zGM8dUq2BAm*A#<z1T%GhYNLW<;Cj#{KSoxG9cQsTF6QYwLKR)oRAj>Lj@dXRnje<e
zzl#V?9SQj{Cd-$V87rVkpQl8#>rEGAggh;;e(y}|=;>);{8OaGp!-4f$vFr@!+k&a
zOHHl^@f4#I2W1UmBH8i}O8>s7;j-TJWw|(!Y<ylJE0g+-xK+96>ESl+_F6CJsfr&i
zp6jzM0m%L=*={S=c;tY$q3{|zYvW)x-SB2Owv(Vu2;Ev^0BMo7$u4*z>RU&zYR6Dl
zpnEGr-5vW7i!TiOs{+c$-{8qmbRB&@H}kV+zph`wXLWB<VlC@8a=)vawbb!uL8Ay~
z0-}|Pvr#h%+3Xy6k4TX)uyG8BzUuoGF+$xLGqn7?DjrU(xx^@Zh8_rYLLX}!$MKr}
zvf_2wn8f4KA3l2JZVg{`lie^jFK_bcX*P}PT>CQaj-TB3%c>|V+Fdsi+(yGG3)D)d
zXfv126H=Q)m!V$kp;(NNe}!&H!C7!uh^{|LACmhqGcyA#cE4*{uUDj9jaOXw{za9;
zSgBF>S)CAj=hS|+^LoPRf%ip~8|)a3vQ9OLIW+s;FZym&D@n`hR}B1Yj0_-B%)5=J
z9Myc^>a=_W8J}<JfuLrlei0uRj$N}_vf`n#ZM$VQUePo0zPg9gl&_-e&g9;)U<%uO
z;t2K1@1~E|wLiwHlJ8TlwLow>AttY?k}XVxJotoVPxjZRti6Rrnai$uJoOpdq!M&y
zkrkCymx!(n_1Pa|8W|Z_f7?C!EhRQ<X$%@lCAzWiG30!ZqB~(8oyOX>%O&Yn`>LX1
zqtpl~#8%}}R{mlAX>r}ZbzKQfPL@pat1)`@N)hGcD&8wYLqmV3J@(^#jbeC>(`o{n
zou+YS@>026_jI>n@$F0;_x;v;&cl8lh4E}QIEz6KSUb_*r!?E9``8=Bqx<*A#ut=&
z_xe<Lrd~Qjb~Csb+&3cc;0vjjUH51cNM0YXGSO+1mc7uP(LmOt|FqXkIh|OL%;YF%
z$jyE3y0caxm~QRh>6z>~cmh3xmXfBUA<FJ|V)wY9$)xr5DLsrU1#!HJzX%Jfrkt(}
z?j{zbN+D0U>n4!%ll7He&V^PHdeogY;nv1Wny7*zT^o5(8qM^)w~AC{1HGXlQpM7s
z!rW9AtAr+FIaNL>b8wQGXZLzQO7mr_-zR6O5M`nxd;Jo#wclMOr%FD;qR!(VudvYY
zUv&l_i{A?efUT*5g8QcO&re>JPNL>qcQLsAKLF-S{Qp?;|AyRP&-_Cc{);C3-xuE!
z*VIgKTpjL4mH7HzkB2zrm0L}ypPrr?j+dL+?=H%hu`n@7CvclZzQv6DSn|FH26o%c
zwHn=gUfg(IV>w>l!7{RaezJ*N?#t*djbc!g5fj5ABe=XeM(86B0UT6WLr7HS^E@LY
zd~v_hYQnH1lFm{HT;W6bdWT%teGs;HFP&1<%d+zT1GNVbihLO4BKCxaX3P~cFLmDh
z&b@Sc#T3h)PyKhv$Sf$y1ne`Ju2{}A)H^Q!YVu_kF1{o@)OkMw826U@XrSe$5$M&C
z-pP@za)9Bhy)PPY6(LV~Y^Lih8(kb7xj#1PKYN6S-GT(~?FEZuE(RP2u{SI`$NT3x
zuaB491&j83{`6?KAK;-}?dno)(_dmDr&|(;g)EsEd(zi=Y8?1o1x3GxAseplNrZml
z#OZ)A#H8WZyfDeoEH`a>2}qnz%iiip7KTU|As-B6u64z8Eyi)s(*7_Ylu=NC|N5mw
z!fAMu`ZM8cw0Lx5W8>OP<4hN4R(5tLs2WB9AsWZS_b7y1f3bjKo8lV~AlsWFJQfI+
z#P-)}Fq>}OD5_+xElf6%*QySiTDYM=Etlx;XoDE2ksxI%@rg~R=9Q9CxDf0RjAFm=
zIhaClm}Nlk>iRe$46`%fOR3(|(Yw|C8@<yX!h1A_@?HlKzPQ|bJ0qoAuF!_L6Co;0
zVbJX#7^wFOD|-H_w?(hyo!@nAY@+l_awm44H%pbw-V$}|KC_`a3Au;rCy?o7yAybf
zP7k+@c|ZR<U`&tXLfcj*w9MFke+`Og<5oju*_RUe=4lkCPzR#~PQdImm%E!$1YPGg
z(n?h8ydJ5L3^8Jo+}oJadiU;K66L_jRILlcKUbA+$HAA(7?z@=?+Li0a|ZJ@6rDGx
zld}l3dRHf_%i@Rndpt`@O6UVA_-+3(<u9&%Sc46o9u8h=bFCpp;6DYVr*N?uNQwP9
z$}~(`l?6vNZo7*_)xx;{5a|Ca5dSjZ|4gjU=~-FjL9Sawj{>}GIQh-4KU<#6Y@{f;
zD}hILW3t)+K2`6b0d_TumzS6EQ7{P?Efdoxd<>^2O#dv3FG&gqk@pAf3Md9GC#Q;v
zsw$m;0Q3Q?Caq2V9vu3BoZNE5;!s9fIs)(!@Qw+|FgzawsrSEOcT;(z8QufQecR&S
z0a!5wvPid{8IUbw1Mo!Or6nbOqnT7+%ET}my{xuhm<I(zVf78NKsih1KJLw%;fZ`U
zkixl8L|dVeR;6V}ze8ymC3W6)2w3N%1ZW_5IJo2H^wi|Wue6Wx?@O11)!ITS#^NyB
z^On+mX0>N}tP_=1QD844BWR?A{O=cjxP^}&LoMMy&o5bF+SiQwR`J!JMqKS~3^Z`O
z+5wSaSPT|^2Lx~%XMN%2_I!~1zJEYM8?~l1kS$;DpWtz@A&rSZ@^nlz#&en60bqeD
zorsv&s6SKM{^H!zp%H8^1?rXUxi<O*6OI2F?2Mm<{O$`o4~EZM2@A($suyYs+)*Z=
z65&Q<YB#{f)*Td*_}}IgFsm0ZR#=R{0fjYrQw*}*&U)2M!o)aCe)DNE2N}QZ7qvpo
z*T)B&o2Jb#0WXgKojG+tL_|a$hQg7TJzQH=>cPRnQu;OtyReeh7I@k#r7odnylVES
zuhr=N`}bhZm0xKR^lRTdLVE%|Pq*9X2dzfGJ~toCiFjL|tBOcyHJ52z@#L`@=l&EF
z6oo@T`RdJ^xUM9DC=f?PM<CmF2RtXPn%bIek>|oaksAuUOEZee3V!X?kPA3_%ZTm#
zxLEVl9N2j91Rje{09Ly#)vSFPv#3|VFX^Uc5ML{ri5+kBZj3i8)is%E@LY5TI)uEB
z3S{=z*S8YlYSIMC<F?H+GkQQWfWMsr%h8DeZ}*G=bF`eQc`Yt3{&&j2%aG=gbkkf!
z2EPV?EtxqjTK6+Tv%*}YJ^;RJ22F(@j8Tnr`1sv^m|%;Zbm*-<YjA|i$ll)jrXhQd
z_Ka~REywu|QY2BjjC){z(B_IkQH#v@cz>PK>hR)+TK8F<6TQp)t{6gBP`L!fRj&6q
zfXBr>LbRb9hJ?ps3HdzsEmcEJyz3m6da`%SH>d0EHzozbW{VV4MY5&D!YGBw!-jHI
z+xoa3H(p9<KJU8B?W_q@+$Sp5tJ$e#@-w-&l7u~myYPOtw#opGJpcXuHIV?uvy4Vw
zi89e5d1~(9sRmE2)?ku34oNdQ__Q9-X68yh5i=xgN|@x7Gs~V}{}t)x`CpB(SLRo(
zU+Ekn%&N4RVGAMU;WTnM9-5Z!jU~)N3+%U5<o>wLUZ-yy1GeA-7*F8K^vD>qtcpsc
zz}X9}5(~d!u(K~yD`S%QzBchiHG)orIyvM$ksn3^^kEtJJ!m_Mn>$Ozs>~2M`uHy*
zm|n(<#?FZd>Mh~;3m)olMWgkvM)ye4A%qM+{!M?b>1m%hMgHC@)eRN_ldEct0(OzM
zPoA?`*SEjCaw#3!N|~e-aEe&5l;n=nL(hNMf4cqIVD9e#qhrX!@(MRc{c>C-YVVs7
zXj;vrkC(zEKQ3O)vRW(Rii{LYO^6KVGCh9ZFx4)d;B1g+xl>~I_qNu`gL`dY!MMuE
z<~gRhYnRWtWvno2MEpfJ#rZR5!xNS#PsBT;nP@<yb7p8)+uH*T3gJ{>G@PT7_4)es
z>+K*klZWlv2Iem3h-OqLNe%sm%#Gf@Ka2G`P5j30P$>{$Fom03!2W-gTMUZQQ)<-^
zTE<huK-0D=%dsc&iM)HHz8h1u3_#;~B6&CcRxuFdP{W0Z0|pq>1GI>s)YQ~+vw@cw
zc}QAXRF^`#k=LxBwgn8=&V;W3W+zCw+5;-G{HvYH6w09CzqOP(34IM>J^2lfnvtLX
z4M^aISJh=?J{P<x5&!VvLl*`$B|u(-*E*S*<pG`qj#h4smFRmf8l3AUTKXuRQ){y)
zS#WWb>)Eq#kO7#Jun8zx9<ph-6Q=v)lhFfl&t(!r%!4U~$0vt1hv{VDU$+5(ELwrA
zN8>7ut9{^X(EfV*>6ApopJoJ`XoHenr>1<c0IJ#=MrCt8iqZD&%SeS$^62SEs0G}i
z=)#MBVUh`PUNg03fAjUbmFH71nlsc0R@nNpeWABlwKbNkOHNG$k4hpMVbpLvZDlAw
zaZb5*a8NB*y^s`WlWjbb0BmVf3cJsLE3Vq(;IW^7rFwM~lwIOVZnbK!8~{CFSr7Y%
zZm+1cYSg)!v%IYk?v)8#nX0Y&@#6=-aP|R!JPLv0v$)CtMmXG3cE73*XhD}1zM`P>
zTKLJqX5v<6Bl+%PH*()YN=k|gpt+Atj7=F9zr&WEhiKZWHJ|t;V%<k4J{BNy@?GEc
z&R{InOq%!@J?(7eu^}7Szmf|U6**RBBCq;+bo32sFgJ=EgAx3iiPIhZJ49+T-*+%C
zIb<OLQg6ecIp~AZr373h2=NONz3n;o5}kT00;L9j#tP39XETtyqgl0vVN-Q(4xc7c
zd~?Jp)BOpktP`Z)U~1Ekz`NF|`EQX4S)lT6#ncD0uSiB_1S=-WU<!6MVTJR$CbY&e
zxB8vqe<#?kQm?b)j;4<|-FVRo2><_ve~)EPmr{7In9u)l2(^Zh<y#xJVEN{xlca+p
zBqzHIROZCn8!LV;g}hN3McNTSj)k!O5cE8D+<gRgS+V0{hYm@quKvTn$c49qiQvD&
z@b&jd2YRu+L}Dots>^8g;oIkIh+B_k{5Md4=(avAT^GbXGPr33`#VBP7jEqu<D4M(
z8le&FXOfc@qf1NrNO1qE2tFxyJF2pHBy`6~*an2aa}2N)n|0u3i|1@00$V%d;Y>(y
zFn8==$xM$TkNMzbCi`OB$0^dd%|S28s^<c-m3Z`olf8jDQ*ndhWpiRD=5_1APPuCI
z_TBU(xCirIndku!?l|?oW92HPeW*M969g80ZeKVuD$3~h_xCCl=C4sRjg6Dl4sB-j
z0Cr<umq9CX&*SfON?$t<9bqN2PmEx6ERsgf3eoIU403Ug0V{~c?6hLi%*jH&|5c6$
z%<8{?7n248*OIPT_zut7-E@!%!i#GZ1i==;y`v0;whgSCq<X3Y?8fB@UM8l(;^N}=
zgA$9_Lzi?-2VJJ~s}(Fl)7Nv<=iV{S(MTEzN}>w-Ko$YN0$^E^ac%iPDq{0*<`-w!
zu+Pf~wwW1sz&w2^MLLK*hJ%eMB>D)`q@V+uDEnnnya!PynVB4Vh#7K$QBpph^F?}k
zy4>n65VT)`P?{{_v->0YDI|nv)z8=W6$pFSEoI1n)7i1p<s#n-1-sPzmr3+?%x}UN
zvJkp*!Bpp|e6`%j!=s}P08=K5VxyyJ&(F_|>%opgf{FzOkO;WLlYH^FbP;ajq82~Y
zL~md5%^{K!{L+=krwD?H0i&q9OuMzAr#1dbtci`+|H-RwBSpa$y_g)J7ppHhWWnsP
zJVR);eHIJ|``PlD{@EBPa!EFS|JKLwyv(euc-<4AV26MC@|c$t3yV&>J;j1v3?+B(
z^0$AW#w+p%Jn>aDwetQ=mn^j)UDD`Z!Sadh&~2^SJsY^Z$w(>Wp<{MO`hq*iIb2m0
z1D|@tppL?<M?fm2i+$b7=Wb2@_l^Lnf*0sDPG6_RS8{KZj-oe)f>gB7mmwAEv{xwt
zT8J{)ImFVKQ5nImlQQl}Vq&jHM*_U81Nfy8sWfA9L}>tH{fF{;J#Tf;BKjwRrO$m&
zGtCv9Zwp#sOQ@SsZasi5n^>l5lY@1*331s-!c~<)9<610xf_{w9${fI#$Saeaa}S0
zjfn;@+35O2mEtsPSKh(naBDU@-j|MpL-}R!qo$WvvA+10#BRShruq_0@K`d&((`0L
zCNS_O7ZQzux8e5yv4)$~?gG%5u=+9!fk1+{N=HlU8-k4`h8vl*^Q$k!X1z|;5t9h`
zJ@yOmD1}CoRsrK;KUyp6B}ZN+9|tS9q9tjRpG(CJ2)H|eMPHq4%yb~%e}5=77b)-4
z|D1$slIe9`blY3jUJE|!Nss^^=)t!A0LA`3sS98gK-WWE?WP@MAXV5Qj9^}K268@{
zyj-o<bH3<dE4ShlzweA~v)2N+>ZY=vAG~UPvRd`e+*}rrxa}7@?-OUcA8d5n+ywLQ
z7jQOcF#O=}JbX9(>21rGUw%2Kt_0%IVStpFBrus8`0-7<wg|x^BcA{gHO~jq{5=bh
z@WPH^=2z8RTWoppO7Ev*KpbfGm1EcvP$iP#Kt-1U0C!>kX#ZsVrhMwfpej(v;j9Zt
z_D07719mD}$@^blhLCmue3)rAkeyww2ns{l8-<4;{f#;$J2Oj==<WP8<dvh|8;*6D
zU(ayZg&Fcm$|pl!gIq!JyuE>ipMR8_3&|ph+I5@?AfW05Ks*z05#5<s!q;LV=Z6MS
zaRGQFPr|4~d9SR19wFD%3dla6^NnV=>BTB2>_E|f@&^EH2ECWg5`&;eH(8WXRfq+s
zmiyk2#zMu2ZWQ2&31aZE6QcB6xPWH`^^S{TTF*bFCl}PDNc7%BB?Cxv7eX9EMN>=N
zIpA4e7<Ip)ApdQ?Y%H5fr6ttCU0zNOk2>#bKS~@#ZDcd^oQKPxa_3>V(HO3B3f$~|
zT<yrEbm8YG4b}|2tv-+d<h6Fe!*qf^t|15-`<;1dX@x~9B0!l=N0Eo>7lbK{a}r(w
zjKZ7Jy@~zy^{4@aAgj%AK|BoIC$$4uD&CShYJGL2m^l5`M<6-017<OQve_7`C~_pZ
z*qh3Z+1X&8T{5uRpJNVv9nJXHt{cG^e-Rq_Wtb1;#nTh*FSLbG@#!3aq;|iO1(UVf
zHbBw-0{ACAX0zUNId@P@#M&GFMRS=N)&?pUL2otk#}CQ<Ctzb$0$9#<B@g9e+Ifg2
zuGX`BFWvcqQLmwnX-?~#Z5l?&$;GDu8(7(xeeSl|>0M0TU^Xc)+5w_c5-~uapIP&R
zZ9ZQtT@IgQF;Q8VB;uJM40i43tbbBR&SVAX={P8;*;&Lc=YcFk;$IoA1`3XK>@_T(
zbXI|dw2a`*k4w%<tvH0~_5r$gs{xr;Dbf~jTdx=~MD=Ic|Nef(VYc{>B_QIZPOIt;
zTE#*42?@U=9%1>sqt^%CgD)=+Ad;9`->Cz(65OWoOdXS;*uG8Fy4WD{X&&+c`GnJH
zMGYZVVc0<=@)N8L4TzA}m+8iE=IrDEQ)2DsTJhTqZa-iNZ*PCadk1VHU-<S>NEipT
z`RjUH%o^RZ7neOOH|(>XZ;#-#p5!<CSG~&vFq`)Q7S@Zwq_4=!QRn>u7?rNFo=P%K
zi}pu=dJzX@#{Vw?Pw`()AAFURdbW>VY-rs{a{6LShB)2%#@f4yd!<)^f)Yq071|C8
z1(%LuiyDxTM)kp+bAUTv=(R=!6I3e{7w3(r75;B+Z~VJFS=?A+C29^xdy|@#K(}NO
z4j_zaD=(3h-rA_$OrR%<?;FbjKz^$j#LJ6dP#MZsuYhg8ijEWmq?PCGBH$7Bi(MoR
zU5|)}{%{P^GBC)Rn&#k<aMHF>%gj8bqw^zt{m9haYcbv=6J(P9dJmU)L6@Snu`&jU
z4lTQ1#d@N<Z(R-!FVWv1;JdU!LfY>8YaNZi4|0#%E>@Mo2$t_vl3)#McLLH#)X$)Y
zg2K+Hhjt*{gp4R<w8a7%(`gsjKj*xjDIdsu9iwUhvqcox!AIx;MWfkfKYBHxleMy+
z8y`1;72w?b_X^00oX%@+%Cx<4vlUaVDM8(PAvI!#0P&dOetxthFOd4w<8^E;7(R6$
ziDSekDGYQ)@_gM(^&~PfQZ6?QPPnqCXERl^P@d8g2oT*XK;%?SA*v6@2={i7>_`x-
zhlL=^ych=RB4B*0UsE|7-myTQX{I9<&$cpQM>~-zDI0qpj`-rBEpsVu>Feu<N<>2(
zm&2>I!)ll00G0vFNv>lC6m-L#`3{9u)WH|zlP6E)!hucUJFq+$jedQb-3kP;FFBy-
z6=nt(zZvjMr20Q3N`)aM0bFGni9yh$;u0zfVJjG8z_)Qfho2n*xF%Bnkh&Ac^BBz`
zSOv&vKd5-BOSwj#`yqHBXT1TuD9GG8Be*z@i%a?FnUERCR2VG*#ex6YJvXVqHwr*B
zlbZ&)xw+X=?}6BWJSs0xM4qgLt!~$eWTW#vD?9d1N;f7XsHmCAFcKX|nQ#n18dMoB
z(n*|A1GD7#tyRAyq1p*a;oBU4^KPU_ryoEt7QdY7dJkE-;9bky=@ELH246-VAcf%G
zx#R4v4Jdp(<NB=}V!C+0oDb@m;%WeZQdAwRPqY<)g<-V+L)@P=`;|C)n|j7{jsu^5
zyaU?Hic$AKP4AVHG^9&f-UX1u(zv4BLC?~%0QViv9r7&!Ni(-El|ogbB5#|oBOKB}
znR^k~DZjs)TJ8|w{AYkb?Be`P-lYK~2I2yc0Miyl56a{H5;UBGaFy;_JsD+ecOdl{
zud=b}2{WJkR)S&=Pqr-u9BP26*mA6NadojfvA$??!)Xr)C3_zl-19=6XNHk`uC?FU
zshMN7Yn|oyH>NDuUdakjfv4!gRQS_<fzHGJsQ$5MVt041V{Au{H-StseQ^|K1bbMe
zi{VF%;L~r!U*|6o97axR2!upjW<F3QeApvZDHAvwUg{7acTxewxD-f!1D?T$aC~%$
z`Sd+6&JMCG+<-(aFDRMy5FZ2wBMVSTE|x?tA<liFdd{5>H*VAN@C@~_>v{}rj+T6^
z2Q%GDx=e*>!36F80B||5<~{$2Eg<X#Bq|41rsP*{$0!8d<HusaoFX5%6Qj#0S8QHT
zK)AOMt0z-t+<iC*aOzb)hBZzjm>6%&UkpMgJmt1n`6B2+so4O1wZ}oxWQ~*TwCfx`
z3CFwZ)SVij+C~D%GRP#Em6at8XvE)9oVeM>uIK1FIfF+u{OANrjh~-4<a+udaHkLO
z6nc!S!q?X~E(EqYEsWu#b*DSXpDWigMKwSV0d$JwF&-&Q=STaSZ4=ADbrH86!|mPO
zC|;}a_J0)Y8G!q4g{zXxG!~@?6Zky|2RK=mS)+&r*jV78&D6#z?7TKnRjih)@<P{R
zorkM71I-=3*>KV`84Acqu^q@^4i|rZ2K9flGmr`-0dgxY=XmjNz}6KuYk~QN>u5F<
zaWK3DrQzbUnT`f2fGEB653rWNuUx}^1r*3EkV3LW`p3t9{shI=2(+8**T;E?b1JQ;
zm_Z0|AwPWlXw;Yf!WdgYmQ17I&D*OF!K>s4bZNp{6Y$<!@`0qF!GtS>X;*R>wDQ9N
zdHP8%x>7O^ChMYFj`7l|vQDl(14?Y7su}v5Y9X|&RY(yiNb<n@Fb{Gz(Srx{TqZq^
z?s~$y6#=}0iknu#BM*;-SGGB+nQv19Q`4F#nlw&`2l<HCGA>Efd)n>-WC>1pwCQ;k
zNLoHWbQH3{>Tyb<)*|}HQbCCjfb#%=%yBKV>=mZOREZwV6HBQE0KnV<s)oE#^vVDt
z4E(KavPiG70ar<;CDK#<)y#;h&(8idaIui_S;vvEjO=FLRMsufsU4Oh19krOVplv3
z(D~sQ4a!$1$uvI2nc5Bk@KER?sm!GY)P7lU!ixqJlv@MDNzx0xq`j9)<b6|~>chj4
zrdMc0YHmJUU>3?=aXZDILU?~z!4-rE7b50OZ&mD!nUwI!iHO(f=-j~qs@@Y<`FMBP
zj7_ufHQ{GR7ZG8;SH%yrq@jrI^6XM@J3m(>il?vvDP$FPM~BDix=T;Hud=oURQ}r*
zsBzb#0&#a_19h#7_jBKs?mSdF6pvPC$pvLC7j%&f;(N~Dls$)#q&0N_!TKSz(lWlf
zJp72}`ACrhmr5S!C1IKbVVkQVRR{a~lK{zf07+a}ftxVB?$=j+o;Qp=pzZR`T-J$M
zt@l&EyK=Hy*;Tl(q*?z+W!Tt#3X1N_&LIt%fyF!rg0mq;REtR}J@l*9=UK))YMEZq
z{xLe?MzfW{+)yK8dO2GNI}jU`LydwSvh&vCpif~HwzJ|~5ot}GoPd50xQd(jm(M1u
z%N&uW*VR`cmMHmczjJE^g@v*IveGn^7<{M)d%MELBmdBZ^mBo45&BOv#yM8CCy}RG
z@Zjtz)&dL*YhDyUNfH2XGpWsibxS2zg>L)czy)&lqILo$pn$Qf$&aHO=;-NNg${r-
zhVvkdLeO}_!nAZ*K>ax3cpR_;IM}X-<bUsBMc~c;&U3xm!@KF{Va~_D5@gpq0S`+E
zKG>Yu+?%gRf2CD9VUk!L-3t_h5HtC1X8h<Ib|oBu^_GSUj{vlgMxgvyk^~ZylZ^U&
zBA^VKY*84hIhT1whRmD=Xo@TY6Yf?lXBHn6(#%gBl3xNqd_*HctwVZ8@Hrolr$Jj*
z0$|n!G-}|d7Y+*7VcboUT_yYBP%>cNOej^zYBp;(K&7!}HlFz?fWq26Fo2!2f$l<%
zgzBcUZ_X2aFzaGc4&Vu853gW}HI#K8W}mS|bBchzGq)-7C-dvPxbq$N2v$~$0c(nV
z;(kyQcCKFL`u2YK^o-X@;o5iwviuBSxvGKtaex)<hy!`-60oN~*CN#fnv=#FWE-UC
zW}xR0UH<Cw*VKzlI#{pBNkR1=u+`3jtb!as0e7WE2xSHni1pn9Rz_tKN`Occ)~0GT
zracd)-i`es2dIt`WT1DKbVB*L$4l@#N<ehG6ydfa{;eQleR#^+asVyQR|&k0Wtx+S
zcyRYFwNYm@N811d&G{TOi@IzJtf<@t(tLcd5VAMj5(c+;$I_6MmSd4wONJ)G;?c4A
zZ-5|%!HIIIB07N3R<i+6*{+JA=OlW+Z6xG;AVA6^yYYfe>~)S(6RZNz2YE~imkK4{
zexwdmH9Br?HGe#k$T`9xU~L18gb6*HGwPoMh^ma7TyTMQb-&|+2L{}NX)qgo_ibQU
z*b*Oj&GWZLI2*!6eU(}Ro=BN|aolN&>A8clE3Z;=07WMkl!Z`<!2l{R)1p<GK;|!m
z3q3$tqNSyk1aj(zBP$aq)=9R}+h>khxXRngrzH<wgdq%;0h>$w+t$ne+t!2JO&>Ch
zW!G~)Ng`%Yz{p#f?|y#Hp4bQQf~#Nz)Rv?D37hV9kO1OOWK6oS?~t1^4?9LKfI8!w
z^CwarY?(eH7l9Z~k@?Txmyw)2$1*8lNt6<`MTobCKR@3mdh{r6jxY;ji)s$7U0Mzv
zZKLwG6rTbmA`@UDlHo+)r?`%TlQ?nwdNUs^gS57Gl920`SaWl;AxOKvjDk~JV9On)
zt(L3)(W6NM6P@~a9L>T=8veITzd1O{%0Mk+76^eIejQl?-a^rqgDi}}**KwKWUR_2
zwYo6Il=O?5xcCQdVAI6tis3VGzc$&jJE`$lFG#5DWlYj{3=T=tg;;luTJzlZRwCi>
zMf4kU^E|bD^=`z$FMAQz)qx$6letfyK9zzjMI4&qu^~`36WgO=X7(27(o9DK2d~G?
zeo<lptwT1jdB#*CgkC;@e}jRJF8-tlBxb`@fS7h?MpRk@-ZiNj;O4Kpsf(+Deq1+4
z?ka~l&?!Cd*p->|@-DdUw*h(8vU3Z7xu<}a>^|B6MktyndihAuHQ=YrS4D)z*LNy{
zK$a9F9GB<^{TKO7FYr_zK>P-P>*wd8Ka-T1=t_$T2R-pYAic@|767tTJjv&fkQk8X
zJAhjmc1Ky0GKaNyJ<LM&CcZ(H%?zfXyW%NZj1=)4XcX(NI|dib1oSAGl?hlWJrDel
z#(*?~R0S|vp&9_&#SqzQTEku*P-ZMYMxVW_b)TU80>f7}|Hmz$%8SrjPe#K4c}O+z
z)=reE1J+Svbu&-_DS@H$+KOj#VX3JT9GE-IeoogoSqxMs65cQXl!$(NLShi0#Yu(k
zt5`k-L5i<p{aX|Okq6m{9H6V`FT*IUtid(y5i~{^_W<afa9QQ1b?!+5h4eQW$P<9%
zMv!nBgA1fMeHkwsBhMK6&0PDTxu9Meop`2aWRP68MIsD_6AToLV9LmhQ8v7)Yd~_l
zGUIuWjPb~5E06O?R`)*}D$)_e$fwZoq@8e15ztWhBiZY>QxQ_#^U@3f2*dAMAG)Q>
zjKtitc16Y{=MJTisqvTcpN6ik-_UDgQ6bl{e8SQdX!}A4fLclGm-AGksC~4=;Ad}d
zulA7}c)g3DM1%vV{@0>Z>VugEgUhKXLS(@!z3e7@f2i5I#3$m<*^u-(j0o3;mS`x-
z>Iz1Z7PI5M1i{sJQ{bX+TR-|WMp5xTnaCo13e-eje}9>bmm!&e8!nEg!!t8!QU3#E
zRs*ksVz0viC8!3mfaS`99Y;q^O+9e%Yh(y{lmi+-yQCOJ=zv|fjxmIckGCr7fA<bh
zo&Z<V0ciaMBN5Ht=sdJ%7ot-vVv2=?L>=A@8smNOSn>uowhZX*0UK_dm|-6hb^XST
zcq1}i%W$xPPtZaxn;f7QM(nCytjlW98r*>vMy~=VMc4YljJF=MTFzr2&2t`%6hIA9
z5ZUsH^mcZ3K=QhVd;4}2$b*o28(Z72s-~AFnR%kl!%`HQG(vtz&epwriy@MK=SKB1
zpL!49k)8I+K3u3Ks?(Wyp1PBg6Wx#nNJnTqb@FVkR#nmET0lH99T!2vPBXrtjUg5G
z<RdmdXO+j^3LOYgIB+e+p8(DqA?&dqHvxQ1d{<;p2LqsU5jI1EX%atv$a*^r5zL-H
z%QPP*3SaBK$f6Ck-ji@8UAn2bO%p3^FUdWT8|cfZcz}#~%7C$1RPAB7?!@k7y_EZL
zSfeVb>ss*~N|;*-7^+qK`}^lnh*aL^va<Vt39*6@iULF!l2Tl369U`;korx~6S=hH
zRI_f_GaJFi@DxXI9G$N-JQd1H7V33orl*!M@hgBnVf{Iv6g5TYw72rwK@jNQ09h{$
zc!1*)FW{_N^uRsDcL2)o3O7v_fN3-U)EuBp{;p``CCpt4;q?zpS-Gib#+4GC@2P8d
zOL4@wFc$6L+xzE1I=x)nZ^s7U70LkJ7c@D2vQGbQVzxr^%76!pZrvN;Wnz<svv3@M
z4y|cVNWZ>OJilGKnNS*+4%l%0X%aY>ds(+McH8ri)(B?ZqWY_te3q#}su6D%)ifko
z`I-Y?8892}C92m2Z<K-PW42+!Ckd1)6#!W-8!oLKu?K;lK5_J(0poqwnL%4<{0V6S
zi+gBHLw1An>Tux#u$qZ@he3}>E?Y6;B&o%-Ol~l`>Ot#oH2gZ2#EhS)VB#$|4Fz-V
zyI?|4$?~XISe_(RXXiykON+c~zk)~6thC_z-4rp<9R>)8h#90oj3~T-PgfhP*rKXd
z+*rXxrLM?UiD!FD(Q*75aGrspBl8ubw@$2wX9Tm)N{V+(5>{?yChrqri?Bb`3UOX3
zcRBby0@DY2AmCi6H6vKxdpcWxx>;XU*P7`nI;+kr;%d0Ze9x$x$^!xHD8w|IKyQeg
zLLPn95U>>9u&Tcu__sB&;I<>H;oC8c+saR7L(Ye@>!buB>!8~dxwJQ;7Yq1U{P#?W
zlMUei7-zYC=MEh3<@kIdi<vV3iQ_0wv9O}mK=V`9m?V`|DC@ci-F9)^%Ai@;)^);k
z8E$+PR;^0zs({ND`-K&=ZZVP74Hoc(=^VR%WI&&uRVZG;!wP%BB5`N=n?vdLFFO%e
za1zMY{q(SeX=nln{s3Q131w?o43jVh^}KRg8;uCLfyEdBa%4xijFz0wt-?25$U}wV
zySPUgsB#yJK`sT%qEC&VLR0(@#JDa-TmGIqCodv)e(bdD)ZP$0+IkNf)E$rm=>Vr2
zO909sft`zdb=k@j59seNk%thc!}7z}?Xl)4Gu7#Lk`3idjd3u=?6nKc6zzuI>kJmB
zn{`(GHs|JU(Xb!_YT$%V;-*CjC}DW<K_ZXE;=Odo$~>@6V_s*=%ch{GuK(=w{Icjm
zVAqjbIIhy{S#!`-uM3BLUM9}jaGzN(Wy+u9?ucTM(UjHA>N(r;;PJhzXq}P?CjK+n
ztTjqtAAbzpGhx5>{ha6k3OYwGegPd|{^vtI?y8C;McG3Z5Ppax0xYFJ<RP+bDMm1q
z^pif-?yjg>-UST=EPU0fGpe7eGhtvPYc_isuPOIz8C7aLtQG0L#wFtTLg}xGtyTM;
zhSY!Xu-Q8LR}R|+1g)nl)ne>w!0S2**!MRx`nS?@a?y8bUVe=Ly*+>U_8x3Of17!(
ztQkb3T;k4Qk<M<peD(dL@t3UvHy9{LlhpB+sjHgdN~Ib<uBm}TLtPq3U}nt(4JUix
z(hqyi2+Von5)wx3;nbM(Tz!8wH`zh+n6FF@2!Eya3o_7J=R#<<UM!oAxyWx63Wd?*
zfx7rM;|i8caCJUAXi|NK@rh_*VsHO4W*!7AnY)fVZ)c-FLlUX^dE)u?j2p+HJzbA_
z3RF4LxRfFyB1kA_N{xcJt;Po}2y1{#R4q^K6UHQ>*>JKUNWy2GWX9MBc(4Nn2Ad}s
zxl`*}nPGrPnRcS0>1{`_ov(V3=-D3ay*R*;ZeX-`{YE3C<8CIFQo&U9VW9X!DE|$F
zJ=aHh+s~-e0*s^0ZR?CqME_?X!Y5;Cz~a*AqV<o_1qf*`bV?ZK2Da`EAusnvfr1C9
z*5!0ZTP+W#uo2Rp9!P{d5;??C+&-l!`sZVe6!%SrqN(I1ntW>JvOTo+DaOmFumAXO
zGWlGyu*!CSic=(Z%dzC=S8W?r>l+ABe{$rnNZ9gsYI=UpiK1I&3P(S@6tr~j=(R*x
zT*Gw<11qcvBnc)^E?n{)F;*Uc9q!(95vVYQZ__0`o9)m+)E`D5?I+C?ix<$=T?Z;w
z1JX;s(Hm0z4x{{IeJdma8cQ>APRv-w^vqQL#h~}asrNw%V{WUFcq(ku2;>+{()4LI
z*H3MEksr)1B12mjk=c7(jE9Ne1zI7uTMCVDDrX#r%RUg7DbOV%T8Y#rb_;y}>a}vg
z0|xGmz{~h|ly==#7t`k07f*y1oD=O8Sv$N-{&1n58KtnS_xE3CFizGdkRAVjz-|_>
zx?xPT1JO@-dDS6KE3`nIz3j8z;{{C)f=<8t$6L`Q@<;bn?PHR+=GQe9*xBCLKvtnm
zpP&q`w^a6n)>o`Ne0F#wb3xBo7K5Gsm0x8i_h~UX{|UAJ?}%odRu}h>SM5|&<xHuO
z>%0ponvqq<`c+*NoMNGTut+Gwr7tX8xxI4pmJP`a!7NJomnw<ix|1iDR`P!OADdcy
zh1VY%!%@2rIy=<wQ#7H(qeP#rf*cEwU(!#8Ok|+>1jvQVs)3z{UN;p9;IF#~Q;H57
z6BoATbLre-z8dW8ABWA`Hu8r4&YY`#?-hBfe3R<VKhvf$&&etheM&KJR#ljYwlEQP
zX+jZ*PEzgkDUY2D(^mgNhbfdP@J*BS77+g>)0Q6dL(QPG?mf%2zJAMkA{vnzbRfWA
zZ6RIMgxbsD7bv%i(%#r6FH^V#q>opDHv9mF$@fN8^3_AoULO84&gDRKFytv20Y$9E
z01nqbPh)S~ADD4Nqcs+$JilctouVyU<hZt1rQlJ>a6D+%t14^%l;7%8{gVzsiFl{0
zm!-MdVDtTIC}%?sXl?Qc2_JuR@#kHLt+{@D4}?v1t%X3vr^A;Y{uCiAR5`jJ)HBc#
ze|tU__io1eje#%EKPFk9xUVznjqEOhrpM)OvRrtiMKbfbe-#X8WU6|;gO(FqcdLP`
zwrmy4+t#>oML-$uxdwIy>%#betr(cPldYE!q&()A@1u0CyQFQW7_*}(E!UsoUQ2bk
zrMTTvSH&~}pWpbPIuydNkQ}!ue+@So`feEa1)b#BNJj`XtL|6?SGhg%zZ`Qw5&(YO
zC_GG`awRB(Zx?~V47R($R-N8A6;sBeJ!;@l&LBFX`k{!!=Y`3}$!v||KH%2I2^R_n
zd(S5)s%(%xSFUA>``z046U2^@6($Z|0oy#Fbus`PW_e$n+b{J{Aof7k%~H;I8A`%F
zve`6ofZC|`W&GxJu%QFepSHh`BWN%KJG1_^D_Eazu+EX4bU71$QCA;}HkoCzLdn`!
zNC_?}cyNh2PGnD-OK-68;|n_WU4NRzCCfLR9R79~HD3Na(hK6B9CVdHIX;<q0lAJ#
zOy3T4f(3BSbTJ>B$z}CFNWYrw&z>o%sHk*RYmoYv6735K#}fMC{kL@w6c2iU6W?NP
z%kM~4Apxu65b>1m=$-vW!{JXWdZDq2Xg%}^hfsAT(}5!^Lw;Gx{Uo`qUCvcB<Iw}b
z`+oG2Mn)8hRp8hpR9arX8-4T_qyx*ws}_I!<l%ufP7ij)%~=#!4nte?vhwZ_k0dx)
z@kI>5aRsZL6=aF}_igr@eu~8r^L(TNPU8bx(cd7GxdSOfk#)+4Bi0`WhJ*MhRykLF
zBT3U87ngvgI$op^w7?X~bjDG=0|${qgfT;@LEyQl%|Tl?yQ>(q-Z2oDI1fDul$y_^
zK$wJPg;ejjhba_v5~i>@B`{X;o)*eiBP;}<tR3r3(i~uP%KznJg5rz&GR^~=-sJ&~
zUFxB&%rccrx8Lf&Zoi1lx$cM)FP6EJ4jF;EIonX()j#`U)f_u75DFek6CqKJEHi6w
zOr}%Vv-Yyt=a-%)e^hPx+G}J!ulxzJQ#B&E-Jx*g4$~7jIo$+F$#QN+dhIKlz5Rsy
zz8)?)oxp!vrW}N^t@_gaCidtRk{Cfd+_)Z`=H6}d(gO!39CaGKk_r9l@Rf_W<$yOS
z6dxcwP6ba-t?3g)487!fk}bCfdt?eNfiq60(?w;ERVR*IOf60$Z@w!CflAsD3jtKY
zy)p&HBK!OjU+1NPA`j5HB@z`C6>wUKp4cn@SPs+!XfY7|F&*X955ItUTz;u>%{Qm(
zs=74}o46VWkYUM;E`mTl^_xmu;5*~L{aS>~2v)f@KbU<Qu$5`mDO^EYrHAYYbw~!>
zTShE!Wu!Qj9Gooa5;OBO|A)V0?wkm&c(|Qj6XaE@Qq*ev)_EylE4uRS=O2wbc@Bv?
z-*4;;@oiHUFJ!WI=zNT-IYB8HUk)e}So6=>5;;UAz~}#TkH37abv#!XMjl48%XIFX
zE6k$aA(icCyXi{bd29Q_=Zi+{O9!BcA2DU~6V9)bo1=OlS(GQi6xT0v`>j}L4DX3<
z>w$!;jPA4VxdYRF>KR5O=z}cX_E>AJNU5JQ&L=96RYxaF7sPM0RV}mqQ%hWswK0kH
zi|z66kSLLuZQ&YHhALxx`&){L@z5wf6PpM<meax2ilntTr>mC*;RPJN&3f7aT7_CK
zDeS0Hdc2-|8o(BG8V|DOl7<B9rOs+9Y=FY~U)QGq`(cmjDi@1~t$nOE)p%Pj^oM_u
z4YG{O`H(#6zb@;E$oNz$dRS+vOU{5ip@?3X+DD?X1sB#u3mvptW6zKF@n+4SVJ_se
z9iTD@UalmjVG6ufN+J`^W4;*#OKl1I<zELx+{zYt<Fz1i)3BX3pLrzkEA~Gb?nI@u
zBsCALHQZis**!SC_g^y~v58PmU8kWyO2N#U`z9+r<i?WyGpa6jB~n`=c;KgwF<q?p
z={IAh9wRlSI!j|S3{@{amfEZf9KCCKQT^3Eg52FGn1(;ul0%xF;0;?vtmjGzT{Xo&
zEBkmP`S`dJ_hqemie2<zx6OmMA0k2pL<u_W`Q0~1Eadq6E9Xgr9VP3WR77+fR1|t~
z;eu3Fk>#FRUHmo66apM)@<*p3RfemXM?1>j<;EsFKf})Z4G~-1#)mQ_WqfP{zcXi-
z)kjtSU6A27bWZf-XN19yU0%GWZO{zSLZtn(@vT)CBb}cIU8C9_X=^rT+2m#vjEG~o
zh;LV-7Ip$Th-NIlkZ8KQ<h9)tm@@vRimR*M))afy=v?bLrB>vGnOF_4r>#E}k+|7t
z1)OxQ8hL6=VJ(^|Bmde|t7UunN@Z4f<wO>5N~udvtzDe|vN|jY+nVW$naY}W4i+{t
z?)-E-*L^4()n}jQ=96Sb8lJH=XXWdhyv{wn$)~s&rb#RNvXMcHzKg?PwZ>}aXt*%m
znn1BkL8GniiHqo2AOT+ZN3jK@L3JUJj4|c=cVglU0@B=<@I1gseq_D0@Q4ViffD8t
z_m1T_UFO%M`DF&vv3b|vM`gA4Y;Etgf<)~+%9M*i`<Q){jbfNG5=hm?rn><-hZDxG
z7FTC)8z=kxAxYnv6UGF^J>HIo6idg;-@ekSHISSeR8KtgdT&f_&fmwe8$~s{WP7k}
zyyjt4y0)_KU$B=t$8q{bqIP<WT|Iv;_PJE%+rtrKQ&pU&<j^L@GKU!Z&rpUhza<7i
z8)N|}H*ij)PH@sQbD;EfzPdCxP(CR#<0bm!Nwd&JE+QooNH3kSdS0kEZMq`Ms1wXd
zAn?pahm^oJl4&#30KPopKE}2*KU~<{C*%*b1V)ZoDXE>Ej!1rs{+ZVDrcej39v4@g
z9+asFOK)=+d??vMbTHUPkMdOF5gB{iOq_M=@FxeO)l3(ol^rWi{U&Fwgu441yr-^Y
z`}%`iD+M%<Py(;i`I$|-AZfI?7Z4@qq=bYe;B7MpI#6Un!pcqYeIsxpKQcT#9DGf|
z5~>EMR?#}O&eEWjRNqj%x(d#`0dY^pfAcMnaEb2SGlXMK?tnvFa=_U9UAh@JV)MY{
zrU*o3SfPW^tLXT^;re3=4ak0H*_K1;zTu~$yQZxr<HQTErkF}M<N4-y)uX!kcXsdu
zMAolyy=wulN2{u{shAB}%Q1r-Tz<-Vy7j^gEs@i=-4<>Dz4c=F>j&k;KpXNVM#haA
znn!e5qAY5)sx3<6+aDD^LK&hZ&&g8SV<W&B_0*}7;{W0I>z3;SZE5+($Td%$SP%D9
z%(q`OGy(<w75K6ZAgcMCMtE7KPUuIzl`M+Ux~*+&E)?>;fkZrbqHiw1sm3`bh;_%>
zxou=CV{SLkrhP-jMj(XsLO_rA-2J_;x~pO{a|6TE)bn3`%^odU9E-;<Yb$jl&t_(L
z4Z2aQ^p8;BzANMz%I*iF(@WL)JA-zEVfcK*zk)_;$RHN?L~|-8-V#VQ+%Zm8id>dc
z^9lxED4=+-w+|?sr>2I45}<S#cA`@9?geO0bf^UGIAU;!v9l~n<Amit^{p{`fcLnv
zP)kb;;4m#l7LTh@#&X*PdYbgfN?oSsgLt!N($j=bK5eq@FvV$82|oYhLC`G}clwO2
zk{tRtjaIZ3+IV-TJLpO_TE49Vd#<~ycRFui(x1x0_x!XTPiO7H`GAar6%B<A&ot_$
zl;Di0RdZk7R4nK9jLHbRP}}HaeRM#$!5E}B=b3NfBspnx1KIKtH>d`;6r9DuISC-?
zIi3J#>QvO%ug`Kpj1>7YCcBjyr-ObP#<~jdPVjItn`ZedAce{$FMq!ORIZy*$@E&=
zQUELw-%g`*uMb;VyR_f!kW}Wh?Sh{Zmo9c3pS?0|US{bz(Tu|v18tPZD>i4?l$~{`
zf#V}KJ5Tz~T#=}G*9kF!eoZn4L-K$``3TPn@0%R2XJWp}Y#KdUO?B^Onp}RfM<81Y
z!>6&C>-N6*em8Wna%|UtpLE|3_vKTOz^HCJKBI}BiJ|&~Pccz+#=QIr{;`i;oiY+T
zO*C{P@lMAN3Y_knUfx-2uHMxoF9asvNSFjnhRlbFce%-JVEaVgO?Q0osu%j7-JCp^
zZcdY@lJarSnovnVS$%moJ)8@m*r?s5Ucn7;*6KBAhjjaQ5L~!S``2#&&JQblK=@=t
zX1tY2fu^OJ3Q977E&C@^qif5Emu6rr^eS@`^V(d$>@~Shny2|^NzI>X?W|teNGDB7
z5zQq0=4QJSPiuF^0Ks2B+#e!CF3h6|X!9mcO3ThT!)P*BWE}9RUFMQ!{O8T}JJ!?6
zBvieLpV)|0Z`eF<=bbM4CVe&WWxEH(J~+?TM8-ge{>Zg6-C9<<`Yw{@QGLV7Q@4!(
zrHna(=K*Cr7U;FQXIu%rx-=3vcQ_38^ONZ^b!fP5@&S}0TH36P`N|in-E|}|Us~7f
zn7N2NwS@ZLp<o8*C)?En`$>vLJdfjuno@*45>6U~dIx%C13zF6J!jhgqbTCf$ztDH
z-k!Vi75Vttyxs5RX~BW-vu4ZHe4mJG1PEf4{#etpr_!2{(O>XC5eYA^Po$XZO427*
zFR)t+xQ1enwTkJTnXxKbB|aWE2@OiAA=`|Z_|5TSxm_kF4t+vE`$f(+C2ZJh!i(Ih
zQYOELENc&$I8Wy?7lYrQtrzD={#6%3(8*tehaY7<Cy{v&?bPpL9yeer;1DzzSN+_)
zTbH4?2g=~IXymO1bCIq5pj;i_q_P_DEU)F(%c$dh=j$1B_^Gs$m?QLb%Ky6PPk_-w
zVo^QBlFp)SxHqcA9p>p~vf}_H$4_ouV+t|qFMnwNEFq5Lci{tLyreM|?E1cO#H{EU
z9ZIC?qd~cQRX(@pX3P_Tgzn9Vx$V>D6cvMYi(v6*E7(pkOBxM^FIThhGp8cQ`>ow{
zQ1x|@B-di$@Vl~JbC0fAAZsZyMl_;0v@B{V=A8LVo;`w+@7^Jp|9%yGjSPjRhdDSK
zDV%kwk=6s=938j4(g{ktbu{KsdGH^hah$VqNeT(jL3^SAynep_Ums^4*3_AW@jA5+
zmZ1udEIJ?v7B@f?LCTWQ3Jws8v7&;qL@l6zfD$M~HpPkxEu%niB@r+zvdU^85NItR
zTTl#JASlWbLWq!%7($XcH-XQqF0pL@AC-~GPtoO{mieHjRGg24KS*57{pf0rLm
zygxjGR0mCc>t6`FuvqL(05UKxE~|7wNB{z%mJN*-)wPxYRn|~nmifhanm2=s$zM2s
zDbrfyZkS3a6S;zFoC4VM0$`tRU>-8k6wfm43rhxdUB}K$zv>t^jc|~j5WfxZW$Nj3
zK0bQ7mgE?goGrRr7mz69;*=Vi(qmT8oKFYp-wObv9(m8EZQHg5#tw5Pbe0ymr)uf)
z{Y~;EZXlVu1eoUrsXOAXh0J7Tv8Oe??Yuh;IHSON#wbcY<)FA7Px`b>+RBpm&s9Kh
z-7PJJ9S{KpTrrpqp;e=-EKt0AC7;D)RnE%qa=G&M4!KyAXbZnA;yY-O`2+Jh=^y|v
zuBW=;v{#QmnFk&F4hYpzQX2Ag4%~<_xFhMEiGSOoGFfxoffkw=F70Mnpj`ZFf{8Y(
z`gVo%n{wEVc2c`F(;^-`Wb&naM4~$O4eDhRekzS76R|e8Kc0auVjq67X3v?yjj(s`
z-UQ?WU~4tsim4`zS)@5{5kW+q(+!t`57AJ>{P;e^Y~bjrmZZ<p#%#jNIlO4A2C`wy
zSQ$GjKs@Gy6FVOf(d!g_(9yi!rV_oRW6HgNS(9sj*?h+#pNdxleIjw~7|jeXKH9r}
zl_+`+0mE-I&!J93ijom0=(bLi0@cuS_JEA(iMxG!vlMS~sPOnN8T%Zu03}paGmwo$
zUf<1+5m8yzY*92&>lVvBhs%713I>G2hC8DSby~P*cxS{?cv+q722;l8DI(!}>y4q=
zir~SD9BQe~rhfWqYMx>%*)}TWiz8ou7`je~#_peYKsU|(+B&J77$o)0aZ#w9=YjL+
zn!RWY++!wTNFtSX4&V}bLLZr%7>ZKHDAcIhXq!2GxsoCEAq$?nnLmZmmTX|Gh*nO3
z2oP0QPV+}Su&9Z?kn>Bv-E*f_vFnQK0&HZ~11x#_%!fC>&<mYXfBCXxvR41cpwBTN
z0O?BXS|VRuG-x7OKZ1IC5CEk>ko=bU_h}sMkC&brg}&V5KRvrrYR7-9zYbw2KS~o*
zdjh?xR7F!HfbhDGdrf&yH#MAnl?2b~wg^JcSAtV&>j}d!l46KU{*r}>&C}B@6(sse
z+?J|=Nb!FR=z?-Uvp)`~2Fk{lk=IMdn8=)QodjW%d`o$vdtb)=(!}1HCtqXFGN0!_
zxx4+=uI~r0N@Cvff~2vmaCX)ZK-CA3hT>N$$+Bz*XlfeHsx&X%oP=J3&0I*vg~Gx@
zH3sui5hB%z&zssiO|^1NR+|qZbDR2;RYXU(iU|G6N3J8iEoXT-&fpoSEztRn&OEWS
zbf=77JS0<Vk^Zn)Yq~`-d7fo3G^Ak5u_|C;qTie7zi2QEbOgcIxxr<d3_CO<rwE(f
z-8`;4R94D(QZtiI;U@^FJIjw#`)=uGFsiqbZ&0l1rmH@EF<oD?0qwbl#xwSr>nWYD
zW-M;(_TBxdh{~t&V2QAZS=iuP9UUR{^52)Yl}TsZ`<FZ?XLKkyP;hO}L697Ja&X9@
z@amN<OR0g7p=Qg6i&R4Oj!%$F&Lm0`Iy)>-7iy1LRM7=noTBDNhAjV9F^x-ah~%6M
z<3hvXm@xp-EKZc=0V+x5br2bQ$MWgDWl{#i%XKPr%-`7Q@|7!{6(@eJ6#g+9-5nM<
zMfYN@LuG@aYT^A(^EEamY^ahF^!+SGp{l)peULntGGPy22#6)&-GK8OR8cp46^<3h
z1i_`&3s>rR{7^c<JD+?BdR%t`Y`OP&Hy5LZ#w0qqkqt9c*Wo)}4Lo2)|EX>6caMXw
zx#v8<3{m4GFrTC2O{?O=%oLqCc{+u$uCf+~Lcy+#cXqrET;8pU*PIb;DgIBp;$5Qb
z75Bs1h`1qN?C8Ta2%iWMerCsT;b>w>2D4_?sr+zGDX}Kg1$(_evFpaijnK^C+1mS2
zN3(6Cx}LVL(YHUIIQ6=vHj8~aC_8JM^Fu#A+ujOa;o#X>XZdn^He+>TC^3@2n!*@F
zi}hy(G>Cyw?kqC53sJIf)X>mCH|E!kF=rE!U&c3__s$wk#8>I&(&EkE&nzU$eT+)T
zAL_Y(VRLy|F~-hrnt9Q9?h^%$wu>RqGjjaWquoArud5;3#VDZTK!>i!?S1~6AE@8H
z@?-kZcD+hc*<tY<`ktUqz_s}oX(?{Tzr0F(G?t8y74Yi&hkuWj8=WLTvM38g$_})$
z&ZO*`yzi4|Isn-5=Y!Cx{{7I0i<d9;kWhCK!v+AKh0b#d;EZ2DK{xoW;>oqO98mme
zHCg+&s~gxOcTtex)2jefxcQ(qR@{&xW=oLi<_u5r;Y{!v3EY(+SqQiTn7|r+SOFL4
zeE5Gw;9Wrdhn7PAIcOVQ0HrCZm2jEGHv#zf{AtYw+e`pACVo|cL4C>BMaRX2MN5So
zkJY+3dV*Px?A`pPsOetAP&UoR>dfFy9=oyOml((cI6$EUff~680I4G21~?$6lAMCb
zOak{q?=CIFP^jY)(Z7OaL?4uU1@j=j@+kLfJP3<WPz5YV$>T8L^fSaQg&LvFs0T&b
zxX<!x-}*>b*o`ru&2|A~9RuiQXJ`tgJRPzm$``tO9)S3Df-r82fIsg_VS!WNXXw0!
ztTrFGWK9Sx1_h8s6o87Qz#P}KY_S?(6bx)xjMv~F^hSNHk(Vzh18)^W(VqkS4iOCq
za_B-mLU$HG=0Nc%*iV7TH>t{mu0smf=oVDu%|?Ne1CteNobES#(1R7h!*BqM;DCDo
z0_YY&Nfk1HSTH_xwizLUvB&W+TpU;pK$JNG`4Ul~hRl>@Hf+$(q3e(`4;Pyp3NY%5
zoO!WLh1k(*xZMjX1YO?*0&-CV$%jPx9S>MM96HSkJ8`0L1OW0B^|b>|#NxQQ!kEhi
zSaLqJ4k<e3esAXC$y1xPi6sl}yNvYqfFR1@)G`{fHM5?56tl^nq*;?cH-Dy_J{~`k
z7LL?CAAm`b8j?E^3c1DMw7i-!0D7oN;1&7!1#oSa029T90cjTm+Etr&ry4GlWr*lD
zc;EQLTb<rYB!pb|o#2M>CA_DHdz*ns@<OK_IK;MH$E9KLt%6LI-@xW_YEMi0su)Vh
z3Yb^-F^}wg&r}@PF+88kEA#KUXA=b26x=#VGv~pV!*4Jb5m=HC-v@1wK1jHV<I*6o
z7l2-B;x!DnPH2)tYRLF-`rx{gAVrgWl{5k^=oGw$5Hrx)&v`cPslPJMy#fiTTCI@f
zu6UbTs0!{)d3(M6u12{$n&d$HoS?_e&b2CgGj*=SHRU08HV(d`X+Ab7dm7$C*OJ!a
z2sxQxIPc-NBzv0;=(w*8+FI8_^l~RVB<_b{?kc@R`FVTpF->Mc`sr78fY+nbRGI0<
zZV}Qk&>$X!u@c1Q<Sv>&^yZJz%@e|)tn=GuZ3>~Y?fnxC#u#pQB7zHqH@n&py6n|^
zwWg-d&Grw#G+Wls2SVhHfTFII+sKFBdoUQOuq%w7Y*v3H@GFU*fkAkbzr7lQrB|C~
zuBtXaR#oHqxSz(YTvaVQ>Aw3ZGl#m?inm^KH|>~`5d4&jW7Ek`uM9@eG_T9e9ub$I
z0S0_GG6|!dVsRx_#~z<OQ8Q+;hjjI&rrCvO`RmNp(z4LX3mI3V4g<GeS~27pbxlX!
zT3<YvX;ix%2TBF7<3fln<^HSe@*$N*<)Qy~TzTsMIRB4B@0d92cjL7OJAEG@+qvt$
L{Z3_jk0<>b7K6`a

literal 0
HcmV?d00001

diff --git a/stream_compaction/radixsort.cu b/stream_compaction/radixsort.cu
new file mode 100644
index 0000000..7f7aad7
--- /dev/null
+++ b/stream_compaction/radixsort.cu
@@ -0,0 +1,18 @@
+#include <cuda.h>
+#include <cuda_runtime.h>
+#include "common.h"
+#include "efficient.h"
+
+namespace StreamCompaction {
+	namespace RadixSort {
+
+		// stream compaction on 1s bits
+
+		// stream compaction on 0s bits
+
+		// puts 0s in the front and 
+		int sort(int n, int *odata, const int *idata) {
+			return -1;
+		}
+	}
+}
\ No newline at end of file
diff --git a/stream_compaction/radixsort.h b/stream_compaction/radixsort.h
new file mode 100644
index 0000000..5dadbf9
--- /dev/null
+++ b/stream_compaction/radixsort.h
@@ -0,0 +1,7 @@
+#pragma once
+
+namespace StreamCompaction {
+	namespace RadixSort {
+		int sort(int n, int *odata, const int *idata);
+	}
+}

From df0c98dba75aaace5b7f94773c3ca6c1e60f2120 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Sun, 25 Sep 2016 22:50:15 -0400
Subject: [PATCH 11/15] Update README

---
 README.md | 134 ++++++++++++++++++++++++++++++++++++++++++++++++++----
 1 file changed, 126 insertions(+), 8 deletions(-)

diff --git a/README.md b/README.md
index b71c458..3d5cbfd 100644
--- a/README.md
+++ b/README.md
@@ -1,13 +1,131 @@
-CUDA Stream Compaction
-======================
+**University of Pennsylvania, CIS 565: GPU Programming and Architecture,
+Project 2 - Strean Compaction**
 
-**University of Pennsylvania, CIS 565: GPU Programming and Architecture, Project 2**
+* Trung Le
+* Windows 10 Home, i7-4790 CPU @ 3.60GHz 12GB, GTX 980 Ti (Person desktop)
 
-* (TODO) YOUR NAME HERE
-* Tested on: (TODO) Windows 22, i7-2222 @ 2.22GHz 22GB, GTX 222 222MB (Moore 2222 Lab)
+### Stream compaction
 
-### (TODO: Your README)
+**---- General information for CUDA device ----**
+- Device name: GeForce GTX 980 Ti
+- Compute capability: 5.2
+- Compute mode: Default
+- Clock rate: 1076000
+- Integrated: 0
+- Device copy overlap: Enabled
+- Kernel execution timeout: Enabled
+ 
+**---- Memory information for CUDA device ----**
 
-Include analysis, etc. (Remember, this is public, so don't put
-anything here that you don't want to share with the world.)
+- Total global memory: 6442450944
+- Total constant memory: 65536
+- Multiprocessor count: 22
+- Shared memory per multiprocessor: 98304
+- Registers per multiprocessor: 65536
+- Max threads per multiprocessor: 2048
+- Max grid dimensions: [2147483647, 65535, 65535]
+- Max threads per block: 1024
+- Max registers per block: 65536
+- Max thread dimensions: [1024, 1024, 64]
+- Threads per block: 512
 
+# Analysis
+
+Roughly optimize the block sizes of each of your implementations for minimal run time on your GPU.
+
+(You shouldn't compare unoptimized implementations to each other!)
+Compare all of these GPU Scan implementations (Naive, Work-Efficient, and Thrust) to the serial CPU version of Scan. Plot a graph of the comparison (with array size on the independent axis).
+
+For timing GPU, I wrapped cuda events between kernel launches and for timing CPU, I used the C++11 std::chrono API. Each configuration is run 1000 times, then taken the average as displayed below:
+
+![alt text](https://github.com/adam-p/markdown-here/raw/master/src/common/images/icon48.png "Logo Title Text 1")
+
+As we can see, the CPU version is outperformed by the rest. Thrust is clearly a winner here (probably due to the fact that it was implemented properly). It occurs to me that the 'efficient' version is in fact a bit slower than the naive but is still faster than the CPU version. There are a couple reasons for this:
+- We're not taking advantage of shared memory inside each block to store the partial sum results.
+- Each level of upsweep/downsweep currently launches a new kernel. It would be ideal to use the same kernel and compute the next level there without having to transfer the control back to the CPU.
+- At deeper level in the upsweep/downsweep calls, there are a lot of idle threads not doing work. This is wasting a lot of GPU cycles.
+- In the stream compaction phase, in order to find the number of remaining elements after compaction, I launched a new kernel to search for the maximum value in the prefix-sum array that is used to index into the output array. This could be a potential bottle neck but I haven't tested a different version to compare.
+- There are quite a bit of memory transfering between GPU & CPU, which initially slowed the application down alot. So I rewrote my scan and compaction functions to minimize this memory transfer.
+
+When testing with different block sizes, I found it pretty interesting that at size 128, it seems to be the most optimal. So I decided to use this block size for the rest of profiling 
+
+![alt text](https://github.com/adam-p/markdown-here/raw/master/src/common/images/icon48.png "Logo Title Text 1")
+
+For more details on the data collected, see [link](https://docs.google.com/spreadsheets/d/1mtohoQ4BtD_RamWI2KeV-HhkSYDMmendWos7sQgdVR8/edit?usp=sharing).
+
+To guess at what might be happening inside the Thrust implementation (e.g. allocation, memory copy), take a look at the Nsight timeline for its execution. Your analysis here doesn't have to be detailed, since you aren't even looking at the code for the implementation.
+Write a brief explanation of the phenomena you see here.
+
+# Test output
+
+```
+==== PROFILING ON ====
+****************
+** SCAN TESTS **
+****************
+    [  38  19  38  37   5  47  15  35   0  12   3   0  42 ...  35   0 ]
+==== cpu scan, power-of-two ====
+Runtime: 0.1365 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604374 1604409 ]
+==== cpu scan, non-power-of-two ====
+Runtime: 0.1402 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604305 1604316 ]
+    passed
+==== naive scan, power-of-two ====
+Runtime: 0.0925244 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604374 1604409 ]
+    passed
+==== naive scan, non-power-of-two ====
+Runtime: 0.0927348 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ...   0   0 ]
+    passed
+==== work-efficient scan, power-of-two ====
+Runtime: 1.72386 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604374 1604409 ]
+    passed
+==== work-efficient scan, non-power-of-two ====
+Runtime: 1.79924 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604305 1604316 ]
+    passed
+==== thrust scan, power-of-two ====
+Runtime: 0.0006529 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604374 1604409 ]
+    passed
+==== thrust scan, non-power-of-two ====
+Runtime: 0.0006317 ms
+    [   0  38  57  95 132 137 184 199 234 234 246 249 249 ... 1604305 1604316 ]
+    passed
+
+*****************************
+** STREAM COMPACTION TESTS **
+*****************************
+    [   2   3   2   1   3   1   1   1   2   0   1   0   2 ...   1   0 ]
+==== cpu compact without scan, power-of-two ====
+Runtime: 0.1463 ms
+    [   2   3   2   1   3   1   1   1   2   1   2   1   1 ...   1   1 ]
+    passed
+==== cpu compact without scan, non-power-of-two ====
+Runtime: 0.1484 ms
+    [   2   3   2   1   3   1   1   1   2   1   2   1   1 ...   3   1 ]
+    passed
+==== cpu compact with scan ====
+Runtime: 0.47 ms
+    [   2   3   2   1   3   1   1   1   2   1   2   1   1 ...   1   1 ]
+    passed
+==== work-efficient compact, power-of-two ====
+Runtime: 2.01726 ms
+    [   2   3   2   1   3   1   1   1   2   1   2   1   1 ...   1   1 ]
+    passed
+==== work-efficient compact, non-power-of-two ====
+Runtime: 2.01408 ms
+    [   2   3   2   1   3   1   1   1   2   1   2   1   1 ...   3   1 ]
+    passed
+```
+
+## Note
+### Modified test
+I added a #define PROFILE and #define PROFILE_ITERATIONS flags in a new header file "profilingcommon.h". When this is on, running main() will also iterate through each function call PROFILE_ITERATIONS number of times, then measure the execution time and average it for profiling analysis.
+
+### Modified CMakeList.txt
+- Added "ProfilingCommon.h"
+- Changed to -arch=sm_52
\ No newline at end of file

From 1797595656c3f33fc7603cc11e0c88b00579b916 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle@yahoo.com>
Date: Sun, 25 Sep 2016 22:54:23 -0400
Subject: [PATCH 12/15] Update README.md

---
 README.md | 10 ++++++----
 1 file changed, 6 insertions(+), 4 deletions(-)

diff --git a/README.md b/README.md
index 3d5cbfd..25cb66e 100644
--- a/README.md
+++ b/README.md
@@ -38,7 +38,10 @@ Compare all of these GPU Scan implementations (Naive, Work-Efficient, and Thrust
 
 For timing GPU, I wrapped cuda events between kernel launches and for timing CPU, I used the C++11 std::chrono API. Each configuration is run 1000 times, then taken the average as displayed below:
 
-![alt text](https://github.com/adam-p/markdown-here/raw/master/src/common/images/icon48.png "Logo Title Text 1")
+![Scan performance](https://github.com/trungtle/Project2-Stream-Compaction/blob/master/images/ScanPerformaceAnalysis.png "Scan performance")
+
+
+![Compaction performance](https://github.com/trungtle/Project2-Stream-Compaction/blob/master/images/CompactPerformaceAnalysis.png "Compaction performance")
 
 As we can see, the CPU version is outperformed by the rest. Thrust is clearly a winner here (probably due to the fact that it was implemented properly). It occurs to me that the 'efficient' version is in fact a bit slower than the naive but is still faster than the CPU version. There are a couple reasons for this:
 - We're not taking advantage of shared memory inside each block to store the partial sum results.
@@ -49,8 +52,7 @@ As we can see, the CPU version is outperformed by the rest. Thrust is clearly a
 
 When testing with different block sizes, I found it pretty interesting that at size 128, it seems to be the most optimal. So I decided to use this block size for the rest of profiling 
 
-![alt text](https://github.com/adam-p/markdown-here/raw/master/src/common/images/icon48.png "Logo Title Text 1")
-
+![Block sizes performance](https://github.com/trungtle/Project2-Stream-Compaction/blob/master/images/BlockSizePerformanceAnalysis.png "Block sizes performance")
 For more details on the data collected, see [link](https://docs.google.com/spreadsheets/d/1mtohoQ4BtD_RamWI2KeV-HhkSYDMmendWos7sQgdVR8/edit?usp=sharing).
 
 To guess at what might be happening inside the Thrust implementation (e.g. allocation, memory copy), take a look at the Nsight timeline for its execution. Your analysis here doesn't have to be detailed, since you aren't even looking at the code for the implementation.
@@ -128,4 +130,4 @@ I added a #define PROFILE and #define PROFILE_ITERATIONS flags in a new header f
 
 ### Modified CMakeList.txt
 - Added "ProfilingCommon.h"
-- Changed to -arch=sm_52
\ No newline at end of file
+- Changed to -arch=sm_52

From ca4cd6b556fe52bf2c03372aced6123bcbd0872e Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle@yahoo.com>
Date: Sun, 25 Sep 2016 22:55:00 -0400
Subject: [PATCH 13/15] Update README.md

---
 README.md | 1 +
 1 file changed, 1 insertion(+)

diff --git a/README.md b/README.md
index 25cb66e..e54166a 100644
--- a/README.md
+++ b/README.md
@@ -53,6 +53,7 @@ As we can see, the CPU version is outperformed by the rest. Thrust is clearly a
 When testing with different block sizes, I found it pretty interesting that at size 128, it seems to be the most optimal. So I decided to use this block size for the rest of profiling 
 
 ![Block sizes performance](https://github.com/trungtle/Project2-Stream-Compaction/blob/master/images/BlockSizePerformanceAnalysis.png "Block sizes performance")
+
 For more details on the data collected, see [link](https://docs.google.com/spreadsheets/d/1mtohoQ4BtD_RamWI2KeV-HhkSYDMmendWos7sQgdVR8/edit?usp=sharing).
 
 To guess at what might be happening inside the Thrust implementation (e.g. allocation, memory copy), take a look at the Nsight timeline for its execution. Your analysis here doesn't have to be detailed, since you aren't even looking at the code for the implementation.

From cd9cdbba90d208dd99ce9fe3741d1bb9a2a83697 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Sun, 25 Sep 2016 23:41:08 -0400
Subject: [PATCH 14/15] Update README with thrust analysis

---
 README.md                |   6 ++++--
 images/ThrustCapture.PNG | Bin 0 -> 18171 bytes
 2 files changed, 4 insertions(+), 2 deletions(-)
 create mode 100644 images/ThrustCapture.PNG

diff --git a/README.md b/README.md
index e54166a..d3f1bfb 100644
--- a/README.md
+++ b/README.md
@@ -56,8 +56,10 @@ When testing with different block sizes, I found it pretty interesting that at s
 
 For more details on the data collected, see [link](https://docs.google.com/spreadsheets/d/1mtohoQ4BtD_RamWI2KeV-HhkSYDMmendWos7sQgdVR8/edit?usp=sharing).
 
-To guess at what might be happening inside the Thrust implementation (e.g. allocation, memory copy), take a look at the Nsight timeline for its execution. Your analysis here doesn't have to be detailed, since you aren't even looking at the code for the implementation.
-Write a brief explanation of the phenomena you see here.
+I also used NSight to profile thrust performance. It seems that thrust does take advantage of shared memory (24,528 bytes per block). It's occupancy is also lower (50.0%) and it uses more registers per threads compare to my efficient implementation.
+
+![Thrust performance](https://github.com/trungtle/Project2-Stream-Compaction/blob/master/images/ThrustCapture.PNG "Thrust performance")
+
 
 # Test output
 
diff --git a/images/ThrustCapture.PNG b/images/ThrustCapture.PNG
new file mode 100644
index 0000000000000000000000000000000000000000..862fabaf7d7fda3139727238c6544e0228fc0026
GIT binary patch
literal 18171
zcmbTd2UJtt(=Hw`3Q-gZf^-xifOJrLkxuAE>AgsiDn)unh;&2mRZx2G9YK00K<LsV
zHT0Gn-}kP&zI*TbeRuu;d#&tnPR`=&Gka#v%rnoxRF!2P-lw<^0016B<)qXB02~<h
z<Ai??d*(CM+dk|Uj<dR~1fX=7Y8!h1v=mno2LLLfA6%Q<#U6tk<#e0@fJa?_KRCS(
zh2{W&Obk>?{H?p;Zn{wE`mc(bkvIK?CRAlIj*+-F0K}puVYZVOkh^v&X5kGb_u3Q}
z@K<v?A^F$mS!pbiZz$OW0-t@tkP}^mg$>Gmy>dM@^LewHMi0NBYaoT2e{7?|-qqhf
zajE5I-T$A#d7lGwvV?Jd^Uol=n*_wg4hb@2F#g|R;tzfHcLd`=0{&kA_}>5Pg3pWe
zzE^c!ZAUJ)tNVU&>unb(zeku$)V|%E*zIq}^L3T3-7t2MP%-M;jOlpq-hlDz-v_Ss
zd!6ESARHW=mA)V@5O-h@@n)Id4RVFgV<886tvB9(xkP(=y&sqUbiR71%@^8{ck=Iw
z93O}$ck3tBr2_AAf5A}QUL$M&pg5lFCn5pxzmHTOGOB1QP8H1qYBK<1(%vT-Jq&=V
zdc?oy7UiJETs~Ns%em(M7HQ+r$598XC0^_+evBRV&)&k5!rjV!bD>GXfyZFY2>Q3P
zt@eWKrbb6O-r)_ucFXr><#=-{(`xtUBC&EgpkI0U0z{<m7jEq~z|0LII+f>qc?ijl
z%<6doKe{O&<@hVjXsQ%wjMZ@IqO56y6?msV9lcL(lpn3wX>d_=6vYjbyEgep?5_*)
z5Oi7VJNgL>CbtZ|I%_BKVxSA{>XS>lX~SPAUP&{G<Y4Z!Ck59w2GCz0W=$dCkQI~>
zt|Bg0g4y@Xz)!TjS@zr>gT8f!-5TeO0{I(j)@1NrhxvbCiY!g_iPStIx^+Ik;$V>h
zKjCv7J_-6~mnTP)|Ji+92@od;h#kS4?eu@e@woF}VZOn?^Up1Co)i413%UmO7jHlQ
zPi+cG6kZ_1YTTAT6g%Sw{FhmW7v^x)g&G)G$^VS#y45q>bVs&O83x5KotCW#0@`_f
zZyJS~ea}L>#GKPEPEaOi>%Co=b*tY<6U>j{mFOkv+Zet)Z_z^Z)kL)02SEoT(QRQr
z5$^?`!fmk~LDdUdT|+k^$Ff1CRl7vD)4hX)Tt(elo(I!7aKN&+EjLK_b}m9(ax<Ur
z9>j>scP{^9^-MwYsaRqXnan~)Z2*@r6*1gh=ufkF8bA@(A6+p^|M>-hAcq)jD`kVM
ziTHVBUtV>lPkQ?TaVjv9?wjO2iq2M=Q!fg;=7X(3d%hZ_U*`Rz&WYn4^Z@>+;gIZ~
zBGLEP^sfsQI~D~g7HLvafOZ&NbX8rcD7DO;Cysu>kd?A)X2VAiu0Zch4RR<CNC#2-
zv<oXaN1E%ZV2WxksT{E<j$8!jh=8OdAi|_pS>y_EHn0&3OqS-sy?We~EX5sy@R1*D
z--Q5%dspS?x(#nAWj=Ghg0-s><Pnl73FB5k4@hJ&il*_<(OOOrfW7A`x!c_9j^e6X
zl5jn#i642`&5>N-bUX$$Z;!j2#+uUY2#m>E??S%e7Tj8NIl9O@PYIo<(o<V*O-ccF
z$Yk$(Xig+0O9ehEZKS5rzvHM}n*@B|Ci3)TszrY=-r39j>Q{2`5KCzDqSf6DSz&^3
z2o3<S?D1bU;XnPIoD}R6ni7<%T}R>@-8fW!2S5c)FH_y%9HoLC={>TDk}&utwu9Hs
zORCtZoB;3R-n{bW2Q2gdF&7lnN+lZgn1l3`+(g_1nDHh9#qplKSH5%5N(Mj39L^$=
zx`}<B1muq#f^^{JUA&T|S^d`j>Fc>Om1p(XQN=x;nS^Ddu7LrS=9atdxj9OmQ7`cY
z>-snOjKRyVlsQ3dtv6o{&K?%9p3c!TDe=)cWis{_-u36=1Ua%r@qkD_-V8W1tR2h$
zfo_HG@r^lr&dEOEZF>@DjeP|q0qaRqm2x5hJrW#ouDnXGLCym|0%Gp~P@Fw)Hi<K!
z{tqhp=zl%?Q_%T)DQuajo1OZXjSo+Nv7Rpt5ji0s%UG7sMRa8s;z&-aXu3Te-L#%3
zi|691VJ~L!N3O%Z$N@TaJ^2yvCb#Kl_okkx!*L-l1V`E26b$g!%lCUkgf)PIzee!r
zIh>QHRMxoXHUAx~E&u?}|I<7G$zEzx#zB(;>Z#og$NoHI1Sp%^fVnG%hW&k!XPFZ-
z!B=5Rnty_Y0U2@Lho`Vs8vq>e6no1m2cGnQ%x9$y32aY>DVc^Oq3hE6OPEfekBE-y
zPIaOyquPev)-q@QDbK{j&{^oPWz;HoG#~!@miLn{1K<z!S0GO59w!l^4CW?keI5V%
zx{U|t#rbOq)bUyR<W|TdU*5!Jg-QTGKn1%wfm8xtpE;dr9VrdA#H7~uA$-?VBzPWj
zQC^i(L2&%Bf?!v)1-l%C)VT~>gVo4E@(<vEXZNtD2iH1YTe~z?A~G=$=NYK?w%ddt
zJVsAVa;z6?P6+|nZQ*$h3jFEk$Wn;!ZBQ_X6#(m{AjhYH?-Y`h;*Qkvx5Ay-)o>zw
zzzEh4>nBOWu_8TaZl}k71^@T+pc37PdxF0Q2ry3}9Ey*oZ@&vu3S=x{Hj_K_i5j*2
zaPyr2&>r6hmp}9ZFOPRaOhhwHux8`<0=s$joN%Plku?D(o&NT{M#J6w){^SYkxvn#
zHQA!;CiX@R>wT^^i)(K#<YBAln#2Gctdg3L(&*Ri^K8ckQA6E%h$ae)wx4M(x&GLS
zmFFddZEz3Or5p$Y{jmyxy;L#hnat>`h16i4kT^}52Mlp19kMtJB_-Ck0RMY`pEMp4
zt18iI1<s9?<PB>~SH{CC7e970Iu&X4Sr(LgO|M$Q8p1U6%Q!}lPN_P*Zz&--?N06V
z?IFn#^s7tZ#%g5)_vn=I>}R7SG`)F0H~)z@TnNHG9>w4LPcPZyVg>2)-;40yUlkQQ
zhu~RRoAMD^7mpOIl_hp2eGW!O1`eDBC#fPH)$Ot}i#v<RU$}{eN+fQh5^zPe@rR|4
zy}+Kz;{~)$HQqGa>utUZ)S_$0v~5>iE15y-9JFmh*V)B#TinOI%N5$3pp*RRV5%qk
z{1uVFPj!?kiyA%cC#-ZLTrf4S#ZzZ^t{rb`FxRkct9Uv<Te|g}>?Q+9oy#-E-f5&1
zc=Y4mo8Hadu1{1KCkL(==b_ZP0gFRSmtA`<*5>iqz9K&NL+p0DXCG8Vg+iR>7565T
z0?E$U0IAu(6;iv)j0l^wynZ@BdlxtNA6@Mm6+uV2c4bM*Ucl8XN*3?Ui=-+^gwuqZ
zHy(Xsp&%Wmi#kT&=aQOViV+$u)TJ3}7&hA%HowhG3w`R#(Je@mELANmdBQAdEi%U+
z4W01@@KZ3%D}M32wf8%3U3_`#qN+RGOAYh7NL{-*a6Pk;#StA*<iVZWkhBC_#Np6{
z!<9_EF-vxOiA_bH;uFJ;*7_I2JktopPk!K1C3TR-PFtT~I6(({{Nk1szSecV5$;9R
zF4uP4Ac|~ntIuXi;)-|LYHpIKEWtVeq1d;pRzF{DN+PF=&|s-QiBc1Z7OSF0sg73Q
zm7^~-ht<L(*5HX%9PJ?D<GnAf^S+nw9VG3zK*JLv)ulb{o3h;bH)qzsAf!_CulMk0
zCIr$S>7#V%?{v^_KvsZF!FQj(r{l@8>x_L6&qo28^`vnCv-<&}LZUeA?u%w91!jo5
zY^vNp_P_EgGQl^$zkU&T>nFoQePD$R7QoUzUe-2X5QX?3rb%hK(-$V`Dc!1D@uM_m
zV9*kcJ(~SzdVphNTJJXGxzA%tIsoOtw>Q1zo)ckFh_O^<nMvm8l~nm{%t%$}GI^DV
z`zx$f88|sQeyKMHQ=Ms{SlfLvc;I2(NeO7)^v5g^h`4G)N#xLzS+b*}h0=AWIOycH
zv#*mYVCEjRQ4c-%`uZ8IgRenPl9WUyo@>K!!RKpz30eeaSm=AKp9cUksFQ%$K>zW7
zJIBDF$7uTDTVJuZ57a}RqQv?#VokHd(dBSt=LI3TNNA^W52g5xc7FlP<@f0hx6i`y
z^+N#u?OPcE(R=78pV2h<B4+`06PXCr?BTLeL1Qse?d8hA3$o=~9ZnE~vL%sA;wDMf
z9c`7*ETc#72|m)r(N{nT-YXRN&Z-El^TQ7;M!WN!(%X5Cc6Up@a8q-5YSu(+%{=Ro
zSQ=gW2)@G%nech~h3VTJxV!drYPSyXb`B!G9?NvL`X@xY_XT{b+l$1K6BHO>>NJU)
z0T$%_A_up^Yhx7ejVFH>k+dP*TZuV7x4f-4;zLmi6Ch>4@A8^ww%u<t#rmFiy(JRs
zFC);?$O;i0xn_O<R;Us!pf%7@Ff<#pU^37&<hVvEb)LxfX8E{YkSm&2cpns#9jf$R
zpP$iNy**ez=xSZ~M&UQX4D)rmE9e(-j#87!Dc&CskTt#G0XdU2nS+^q)P%v9#u8#d
z!TM@w-mZC-zMGEhw*0LprGy`2pGo&(ewBoxtNjT@sub&iNMrgXhMzDAI3pt}J1&qb
zi+5CPiuFwbJ|xax>Rcjd1zc9klmctDmYf2i!mKQ^U`;8niiyKn!E{FHbSRTWtwhPu
zulJ^bypjFIG;gbY_=}ZHY{8{_FZ37a374W9l_OmtT#KZ_eBP{<v3nVmZ&wO__om?5
zZ9d!x|AM{{cm;F#O%&4I9#nDb1}8d928>KM2uHsL#j~56L*CVY--><wzziO<KE|t`
z!CjQlo2=NmPWUD$s$%&^Yf5m_ySQ@5^Saz>S(g{#>ce_3%^dAlK9ooI_240N&*Ne$
zpBeShTcwhe1wRTg1nqJ`o?A4zGOK*i@ST=Y5M0=Jp%i%asbOeY=iJTR>w}FwHp*#^
z^i%1~dvRyfLD2Q{n;0k7<^?HtGhD)-_uz6?Jj)m~NjE#lf}|}O`b(Szna9wZ1k4^#
z&VG6&7h&B{z0CwSW{TFV<-4boahbc}l=hDenYgwS)2$jr6Z+j9xfg>FIJECg@S-6C
zwG6XRFt^jwq`>|rDei8@f6YkZzn?cCCL1rRKb>r+-&#fC0G3HBh<~%**#5y!Q9Tp9
zBoN@|dDSMb<R*-hLdmnZj|x)?w0v3w)n^vPECi!DQ`hbR>Vd>?N8)vM8!#d%jxSBe
zH(Y;~9&!Ut4Nk@JVZ+{CpE9X?*NG6)kr_j_q`4!OJZ2BwjsK+}SYw#{sHCW_a`G&0
zhnwc-xk}KM`>h{GUH2R#r*7;1vJ*f*ZI4p^5?Fv4uzaO%wYnVP4-_cyxH#@I5#t7>
zL;QLq6<0UARMxAWooG-C_+8@UR9{a-V@AlM*^Dw#*LL4aSx@qH7DUsd`fp`+r%dJ7
z*N`?{)dCq3+mw4FUrUcau%kCKj|A-t#uMi-)vSps>)&t2YsMZ_grhvY*Oq|HyOoWa
zet1%L4iWwdMJnI_v>_nb=>E+2W7`^Am+TJYqui5$NJWWhz84iebTX>;I%9%t=MU`!
zCub69*Tr~XaegI9Dhlf>sj|yN*=8*uvzEq9xPc!WHXdIOw$6;YEACL>*vTmI4b3_t
zu!ezTOg~Z7hoyGJy_VlcKM@Q_%R8|^w8E_h!mkQJmH4fsyW@B^MunHoV&8quyqjFp
z&H@$+Xg{|xm-cHQ>qN6oc2=L&<(6o8>>T+lJb3_7dwj^@IWN`n)RgT=_ZmdJsobZW
zA0h3)5t))4%omc732dS9@6Cqc!c1<vKM59yvUI#i!GAgSXZ&uUJk!dH=E6tl#Mkh8
z{AA2|7RQHR5>&*TGQuHg8kU_`(a6=fQ@5LO{FJ!(Orm%-uI+-2ka4TJHOh@nl96eI
zqm~d=A%U6<6PIw{$E|rDO^W_%G0F4g<!QC^yaSbL2r1STXl&%vjbRFAWZ><;aD+k9
zWHsgAFo>jJ5@Az1PeDxZl3SdgVbx=m@<)Y8#?s;>TkZ|br{oqF12As(65_6xSu}~m
zwO*s7cjC7PVF%b%_=xDzymh0DXN?ot>Pq=!3A|qw)o<m{sYI*)A)p{o5dKRjD<58T
zAq{`l^?ifRBSJ}{_Pdj4AsxK@0&p-B_H55>hwuBgl#x#p6h@Y*)iL#*IQ;}7o?5$9
zxrIs?TQ%?hc(U6)lpuR@e$>_4^o4Y_S=+y8mg(Mh4@BH2?Mi(r^JE-WlV|5+-2ct)
zort?ZYd_(Y+Ena#SRs;|zNK{`&tBSE(aVko9vf_~9m-(SZQPwnSpL=icsT`Qp{u`n
zlk&*Lg5Y(V@XOJQHpuV$vf$vR^)(p*fG}7xfM+w8G}!PhvTJU+<F&@{JEDgy313yr
z!K}jTr#-#qR+;gt2qcaCsG?3T9^$Rc6?NpxG~niU^q2A4^?V2IQD;Fk=NS+l){nTk
zJsj9O(237Rnb7EuTvqUah6}0hY@c%ymbw}~xp$IZy>Y&LV%bf32LRBgV%%BwPD9Yo
zbR6gd0FDNOY~+rb%Df;7fywL#ix6CZKK$cVUK56J_~)zxA2vgFr}|Hx$I$oeH1W<~
zj1ISxsree=hZ(_QKG<RM<o`Eh_rEYbPx$%n(j!d&L<Ou3Ggh)h<?DBjZc{My6TH4T
z$n47W6O#Y5{p^IlMdUA<H9{N#z1}FpK-F)fyR>Tlpo}nX=aF9=9{FAOt{e<x_Mq6Q
zT5oYR{(?dL3{3E>BJU56E&qj<f}0)=(QAeY!0gwT?1IH##Q5EusGQWQ8_0TS{_-y-
z>iZ>qu0>HX>FP3|u<o#Wfe~{yVDf27|GCC{?3(Ygqp9Vt$A(awqLvB5f^WsyDZ%(R
z`%OTG@~xM|CIKT(L|1g}dy8#cv=(62&P7hm6e*_pY5YHO5+%QdkE@7oii2-e;siBB
zTn+xhTNzBnRM41qUh%|H;1Xp73=gtW$91pL9Bf!U>qzmFOad;q-SWKlve47<!09h8
zwh0=dKi?4qccD{*NgSK(;ZW7vm!;^Ce_*sU(#fC?MDM&lFn~}T;7wPXJn<ae)!wAw
zr=Nz)zHsG#s0(s8Fa|f$R4&|y8%x?=Adi}v&-wrEC>n^x?xczz=*mIO(WafCllO4B
zfJjC&8vTMS)M1&?c)Xu6_$OJgAJuJXWI#WJzl9sr!agww{0E&?m9PZwlL{Wn{*}1<
zz9SDrJoml`h4?>*m;+x($H?6$J05udD34t*vSA_kFQ)70{Qm@ZSJpo{_zC=j1V4-D
zRPe<i!M+{;KcafST@7wUqwBit)i?69J=^{)ekAbMTS0Uo7DBrQ3TO#2iHUi+C*^)V
z0^XMuY&wC_4)9)F?^a*IIJ&=BpttHF7ZP>XKC}Vay!+K^|EnU)c%|7ZXB%+Yl?xfk
zntveY9nKX*S?B`lQ>fUrMh@#KwD?mK!qqg5V_0<8Efnz%5<4=WvVHAW^X-j=-}N40
zs6I*8hG#&knJL)i?modPa5@zW6s=uF(g5l`e$lrcuPSfOLb$%69R}nAN0dH*U!}M|
zRLm)FFkF6*eVNM;O%z?QuKn+jA6uS*eBDp_wXCnlbHzs(;m%m^rFxo%w6QRHMD{dG
zUHH!2(c`rrj2t7B+RjxTJGZg5MZ8U}7O5t*fN~NnI0VjyYCFZb6A6yBu_mRfj{8-X
z+HtH3Joz;Q8S9S|j3)|>o9#!uAc~jeO;We};cTRwJJnSObzs5pb!9hyyb!+v@WbBB
zZ@c>t!q3ZNdjCG430f}D?NmEVn#sZd3}uW^vZW@57kZE%zLVJ7vFacBJS|aL<e(K9
z4w@MYEB&+tF*wt#9i5Uc11>+AN8=B@=MoKqK2}(_FMV21ZVJx|Vyv$uZAne)esi8W
zBlsC2-l=;u-IIk;QB=w)6CzHL`ixwVYMByR_lSd<7pBGSmlFbJ?o)e_LH$`cJsjDD
z+*~Z!R{1EQzutKeL&3W>b*bLEZ0E|?lJJ<L&~>(C;6%SQWNZ_<9)F$#eQcnI!w(jQ
z1GG$Sz(C5o20DqV()RDcAi?t;w+C2%d&{itB+^5VFJE-TcJfH6^BV^=1^SqMq}-N-
zZ@22^Zu?j<HnzPQ3Eh`D%fG)!uYQewdtd?{>B+&ydiF7W&aj@c(6S{=c}&j{3b9Wp
zW;^>#{NCdsIN*#>5!b)T{MGL{q6l77>|1$3a+~~G*whJ&yIB4w7ya*f2;@1ucP9-X
zA{MY%B5I;O<Cv3d$?4ZQT$Ls8V4rW_e~vTl45$5FxdUIHp3JWPp)=V1M)s!Pc2Tro
z>F7SoNctQ%PV~t7>Afco4m+l^iwS9#v+pO?-jsI-LSGSWq>sK&GU%mOB%iG&<pVB*
z9MSY!*Hp@yxh}L{LEf{}q9_j%>x<jXuZ9F>PL+DCjzTwlOdIQV_6jdI3w(G4=4jBo
z!@V|e&YT-|h<Lpq&Ovd#z~gY9qV(_X5+*d_n;YMXTm>C=^}pzN6x4>uP$=-UcX(>1
z1{1k)EFW8kb5Ek{{Er)(BZtFp`RXd~2M~>QFw}V*GYTGIYFKqM%1qxj1nOo;d=Fi_
z;+_9I9e->=Zx%VcG3!?<=`-9_!h&3$CYcH50(qgV+?y<37FXY(^pjpceGSt<at}~a
zbzNG5b**art2moBNf=5oT2BHj4&UWi&)9;$M+tBcotSElKhlxLd?5bd(T&{tNHIiD
zUqb4ktF>whY|Lng$npUc2S#OPtA_t_tJ8yY_Me^Ch52f`0n=Z!Kv|c-bBm;<$TbhV
znc-TblJuXr_Oanp!7?Rdmykial%q!v163`obUha7<6;oery!+K=5%h+N8>U^2-2s-
z<+((O1!V<4yc8H+T*p{&w7WXvU(xy*c84N?bj{sN80HqJ+$@U>M-fs23jb#N<EeI+
zCw$b2AyBEBQX0SI4XKqtYIi&E<&TJapby{Sy!USWu)6&+osJhqFeM9X>_aobf34}6
zzu>w1%$z<WWUNtHTkFeln9i)ECp-)NAzq-wCVVYaPcd<2EjBnT4Q!Y`TsH6|JCB-@
zB7{BYc>u!HGXkob+7sAp1y*FSOkgZwadNmXI_zS1*BA%fztVeU?lKDc_H^21a7YX!
z8W4rxN$RdFEVEUZdAdwh><3XRTeglTc};qy))=glST`oYjN0WTh*v|$8UH*XgFj;`
z>E}cArAmY&j~OzpGfZY*+RyP>i2-;bIOm*Q-9z?*r$(fg+dEY{n-3VYEx~b!#EW~B
zil$zAe;VTMWGJLX{!O&(Njc&yU%-y-k?$_*ZtU$}Qg`6v%+q6m=shseT$Na%lGZxX
zUXnrMqIszJd=IDecpn?A{5Qx(j5IvPgJAdOw{IXhV0mYhrJQ!M8E}&T&)|F9a`WU{
zpM%n2WAsYIpKlL5ZzaWOap%P};LCS9hJfGtj6EyK0L#>l#B(ogX`~Aoc@lzNxeOyf
zwr_j3-o3j?DZcdcP^Ye!HH9y;JbWGAAffdj={Z4rQ%;EP*i8a%dhf8}>MLLRH}|;D
zTjA_Y*D5_hDrUl1$fI6G&uXv$vISu2(zJNF!ArvEmO0FMcrE6Kg4SBs)oiu1T_iU5
zADL@9lz2O{D6ap^ef}j?jVK;eb>|FrQ!GR5Cb&QN%Y>6hND*x(tt+$iHK&rf^?;es
zu`U=QjwgG3on7)ExR%)5w2yuqN9*A;u%pPAz74g0ldArUZ48Sivb!6IQ_ncVd1RN3
zN(z>YW^M0snv@HCL`6;&F>xL}2U38TNVkxy1@?c}QetpmynJb2`)+Ifw;--#^k@Y~
zE=+ln!yf$I_Leo2)?jUFc~4+Fxm!D;#r<j2D-hpH>(#vh>%$p<x<H!N#e?=2Z+ctt
z(eE;#OiUcU+9k5YWIDo6Dxmaow!3yO1jEKFbJ}g`Tb{?XpVg(BBVR5G3ywmvL(*4=
z!v5G5TENRa^cKg(+m;I8-C7j>LLm-(BrmemIu3>y7|u;71eQpb>|d&4!R^<It0u|V
zG8A3916p;fdusl^P3Pb}jfAJM2<uNx_Vg7RNbN4B0fwO*sH!4Dk8-;E4WRz%;Nfm?
zn$nB14{g21vUh*K3f3QlE><CBeB++KuWF{Q=Oa~G6%2#wOV{_&r`*8?<4FhRkmp*^
z1AG8LyBD1#)jAboNdy3tXHateEt}NgD`ElaH~)41)lGkVH4awxV%dsaWF2?rbIA(b
zcWdqW*}>8>0#XUn=*`G@Hw4$m8^GZYybD(~?ZsQPSbCEKk~lj(RWq{0h5@)PqEQ6K
z+^H1)X4(#5t;b?X-9+v58Sv$ar-z@C0sK*RFJOCUQV+SJM08j#+Y+Hzt~h4%74xVk
zIypelbga%**FY-itWufR-r|w0kO$4@A5|o$P6F52?Qb8gQzvU#fxDI(Vm$vel;o$?
zN9LE-DmCt_Uy3NMl8<Fh&0Knc0k$SsAj{#gd{T<)m*uH<I?W8FigfjtHG!!iBE9@&
z`gla6wd}V$AD%yOQj&6F8~^?Bl91|jMv%B+so!lLkHPPIZwjxC3%P#5bcgzM^Wk!b
zN!QH5KmT}LP9ppVRoIlU{IhI|Fnwajc-jY+ey;XFzJiMNuq;oLgv;v76Min`Nnyx3
zYpRM-Vztx><;vAqvV>}F-n)SYy0}C;*&p<ZtJ~SXC1i+Qggfcm1$6wdS*IFDL~?-f
zLnXQwtBb)iYeJl9o%P=RM&ZTpJLm&HmYRaQDw!7w_pjU{E~$hmT_Rx6<zyf~A0@56
z<ruxm{h!))@Ul4RE^puDQE#TQ3b|+{39<)GBMJx}_RUoYQT))&^thUcJna~!M0l2w
z6Sn#JuX?s4m6iu>Ibp%vc;H^Qa48UVLEpf{yQ71S8s%JRo>X}Q&EEoR63v`dVU4dy
zi8c@S-(gq7?f`~CXDw#!5fN{Xm{97i?v6KcNoa?ueQfmuTYu)qyOZnj^xi4~0AL(D
zkOGV(3%t5P-2Gca?R9()&x)07Ady(n3?~2g%nDKotB-r+|Cfi1X@E+h$)hA_Y#coE
z#hCntu0yKC(PW<;tky%1#iiXdx~hhZIIjkL-PZGbNcZljMoIFRD37#&-s^qhslvg>
z2D^l>EC`reM`CLjy~W0C?^rTnSXD)^dC@L<NuAC;wR(?SDW^7hk?Di8xiL5~TQThe
zM7$SUvi~I9#Gc{g69-)uQdNQ4f;WQe^ncP1tKRBpbHWx%9bVL=igEeY$S>mCXKvpB
z;q}06vg_*w6HLoxVJ7j>F9Kt*G27n?*99Jjze^=T@4okHzhfQyfV{CNW%~<UqN#-R
zH4c<)Rb}rwF&)2+7o%d${7cpb+sj~SUG_e^mKy(UVeLPRkd8J=lWC0>b+48_HQ~+K
zsiND{;A2Uar6~0tJ9ukpTUqQ;RogSB-N|<*A8&Ls>}d&5EOu3Gq1mH$Zk@{O)q*pv
zd^c;;hcDBg-ee}w`Wzm<8TDm!X7WRiPx^V%AEsdH!l2jQ=gg6>^2*R>8H071VZsy_
z&#8@eHq{k8E`=R30b^I?lXvG?urVugczUx!WaV{SD=aijOCb3~u<uh^D1^NY!~{aT
zDF>Hi2xO+fN($DVUmS|>cPsT$vJp<uLYW$dbU9BjuxXA4Lk0}%pj{Q@vp!*>ENlQa
z7tt}v*m(bwg_Ay_E1u!xv6=nVWGtFh+#-92-fr6C+|BI*!P|Xxxt%52H$rKJNz#*N
zJ+34i{1`I-%?5Y)P|er#cv%KqJO5rzHd4KPsL~jGmnih(I3*Dsu9MYjX9Z+1)-hyo
zfbY;dUuTDIJz6n4KUNjE1XI=4ink=08sqNIF|eCjo**tQp7x6yj(VB*aA+o?ys=Vf
zjNvUs_7p>@1B-Lmz(jakvAoCmZSn4-qs^1=)SUPxkm*USoglwz`{UR)!(Y~zO(NiW
z?8B}+p7nnGE?P!?!nxLK!o7^Yg+^RsspNzrxM5ip?rYM~DXDcvn>4~<2zQA$V^1uZ
z>o%BG6${+m79eHvO@Fl3(!MGc)=DU8E8Fj;x49g1OSY%2ZtOl;cn=nA?WfOa-MC5F
zskS-3I3K+|TvZGhT=ts~d@($%dS3%>eCPb@Er*{#M>~BFHojF?nYVBJ^o_9e1k@+g
zEVQ!wk<{O%e8*MEHU<B}MN%_CWs)DJPD1{Yg95tcN{XcE^V)VJ?zIwHfUqSUV<<H4
zE72h&rxXwx1uUbL+g;8^j0>MkeCm>cQ#uGE%@d!c@w->~rvqPpZ-BCW3?c#?D8I)7
zd-2LT*z<GGpL#wzl(rKh>yRp&A!VYS_iS{4yZ{N9pyI!f%9F-cDk|$k8QW%6RZLrP
z<JK2~P>oT6qz4lEzQj}=4^;cAT0GYJ-@CN9-qz0l#6!4B_m7;#{-DoP{n3oA`$C>u
zBTpN}Y#RyA_6v=8^xLZ2Y|@L*qft$r^pm`coVt@IE%KX)!<Q2r9xbyQ4cR{VvV`xK
z8kSO+%H932sYYVxm?$-QC!W}StGc8-VZQ;W44o~%g^sFdJ?-E6?O6y<+9OL-09hdN
z?ec{`RG4X(R2j<)P|O;`_nmt5m=h+OJKv+n4M+l#b<`z~A66X{;|LS}Cq4oeGv8m=
zNNQ2{U^u5fU?bEY2-1IKw+LA0@wwV8?nXaYOFuQ<!x<4u8dPwXo2R<(Gnjr{zA*Bk
z!FkZBMC=!0`Qm<u@LirniIFcE>qUsWgtc5AdxzNKu9v#f-CfA@jxjqd^~ZTFK{2pZ
zVe&)fG3MaxB@G2qYvY|^lGHj<<qC33znD(G7T%l<?arJGL+4+AN&ZFOI98V&#SI$l
ztGC8-PMi#!M2G}`1&xg;C3mx@Yqw^+JzEgn4cg=dnGtZpxbDO<RBVjc5d2J(GW3Bn
zOKhV0!v+D6Lw8$V7+tdibbb(|FmSOpjGS7M8-+Jo8PJrf7b36h^7I?O#8oT3Dy~Of
zd*1v);dRno<i$$Q8p2+cuy~wWY%baT@<^%vLDiyPOCIi16uSH2A|ixXaqqW&g6`sY
zzu*rUmZgmkJ4NXCI1ml_0S$v|Mv)#k`s0liGOYm0Q^eu3*Ii)gl8Sax`^pcu>Xp4e
zY<?ohEV&sU9lngax|iiUUFY{@%Qw6mk-@i;CjjTL%asM6r+=|rvBL6eTuCcf7|rHj
z>p=5tRnxa)7fp7RTTetrai{t#1}vX+j9RZht6pch`Mz~zo~o95_hl%0`4Z_O6GQTv
z@P+?(2OnC5??~bCxM;j`P5i*{_PJkX=r+2x%?|me)qeEoZEfkNKC|zwp6SmwbtHy_
zR?w=bMz@{aB)8_VTF<rxzDahrB>8qNgY1Edr6s|m3yAiXMO%dZYa;W%YwTU+hpRIF
zxGtKw+|^I}SqOX6CL&$ZZq;Ffk?kZAw}=?}Tz*)gdSNG(W|wsmH*E7(AED+YGvM9k
z^vh@R^v+5@cjwMo!Oo}nsIjZ|vZCYNAFf6QMk86b1|o%vwez*<LJ2P`(?t17&sGe&
zo&rx-xKA*uVT>-TLcbCdzi(2$edJrPDu7L6H(o}#QKVO|m$AAazt@Yd2zUlU>t7YA
zBDaKLq>L46u4=g3b+GPIqs4IRYzN8(&zIIyZa-*f^cLTkqx+R0u}s@nyZ3#XY`ioP
zh~H?c6Pzhz0&@Js6>OF2^5@&B%t<55miDOw*>@Hn%Cu#n2;=A@rBUD4t5js8lk_uy
z10j;L9tb=Oj$DMqz~g<<_358{n@Bg)^@zv&yaS;JybrWOm^0H2Rp_eB!EbB9<o3>`
zXe&x2E&01g9owHf*N@gJ^*qL9J%kMTNKrMAu_-NtMt)JA#kH`-q>RkIWZ-H;R1peA
zKIx|_+hT-ouUD>Y)jQ*UBeEjJYdR$tc$trHpT+?b`zsI~PM8b#R8j09Yzh=DNPd_4
zsaovyv4cvzot*L83|+Ys3~yV-LHV;nZUt~^bR^2oO^Bt^ld^MTX)Y^~L#*E3W3K2l
zz<9bcMO<B{WH-p}ZLieL$^>Y<E!USMk997ZK?Uyi&PT*8v&Yq?*YXoVt*d&eNKYPZ
z&(+$gliem~edS*1Xcf-rQAgKmzW26v$v|k?^!vk}{kOtTh~e73a{L{+%LD~x)*|)P
zUvd6yXl-hlOl{qp2Q#JsVZp6OccXzu0zHY>prr1F7@5sXhvicOY7MN$U9DQdnIuQP
zfA$w*SULh_N@J0FV}^B7L}%4KN3S&RCTteb{u}o%U+D3_GdCXyec!C<OxQ2vaIhX>
zLV4lZl0|p@<+q41Czp@+=R|<Juf(F!HAYB;hu>@VLZDCJYG<6lh((le!&UYErJ<k5
zy?dzhlX2fl3K6s7vd+uhL_<E;vdM&_`lvnf;6aDcCAV>L!^rg7p_PfK_hxAH1bg&#
zid~)XcK_zM;gZ%E??VmRDTfk2*)nnsvgQp16ZPquFs07SwZB0ik_(2Ywtptotfc$t
zH>5*mV`-lw-J4!(f$!cdZ6fjBnU|b0<GEUyhtUlEXL#Rva}7_ij{6Vel2=$-K(+m)
z%vX<+cfr-5oYDs+&hQg`9jTdG90*%#yqyqY1)bQnSLIN3+=VK_tO?}Po=usGsp?f{
z`(ACAYaycuB1TcQ)i=7`5H5jshdz3@>f8m8V*0QVd5Z-cAL&ZL2}4WvPWU7NcY`|e
z8l{MHb|GUwMeO&2N>jgYGG%sDvPoD^Jeo^5D$w$4bM@G$7Q?J<*hMG>_LC2BA_jNt
zF13EowdL<3Og}b3KcD5oC4=Q2Vy0m2TD=wxVDZHs9~#|)sr9Y(=Amx-bM)$aA5vn!
zKy_?Pxs!ji>`M2s#G6H44JjpMrTLmo1(Uj47-3kS7$SS(aG$ND3|%kQu<HV7^iiEg
z`JT9rIZf1lwPX%DT5*F?4pgeme#4xU<fKK3iR>fDu_dvS4_C?K)w`}<N=Bc0CH5v#
z@_q_nzSbs`okcDwvn?6T(x+*E(7oJ+m`q1<uB+1)7F~F{im@XSrEQ7i;chXAx*JR8
zDpaZ_txe_yRRbUF<}8TTm7?7)(!t|oz`%%MZ;(FBZ4_l@pe*Xsxka2WzTNNE97$Z9
zz!;yaET5>{OKC?5*8&4bfp*|a3^4wAPApREXk;}TrQaQbS~+5Jx-|kNeUE-R5CNTd
zPB%HNAi}V>qj*uq<TYJZA_k;Bv*Ssst+{!wRugsgZao_{h^h14IQmST8<H&1=ip5>
zbNkM9!a_@b!C?NBaH^|@p$>jk?dsbv**o$825bE^L?`PCD|JIP#zV4?GAMwtKgT8+
z%INqVE=@|*7Vf#y)UuVKXR7U=SVVNx>GfJ0#oJ9_dgzZgC8lG}nu@}=mj<n76KajZ
z@4}h1$0`}K!kg|WhT9^)x#T^pZoOJ%S}*7>5%*ZDo&w4YFg*YZYGtUX)K^*weHY6|
zcaC@G<PX$W4mB!Pr)7Jt?Xu+Za`P_kK4370DAWuiq<dvg@|tyxPEFa=QvH_F^l1^B
z2F<J8I+DmqpZ*8x1}@YLqdQJ*BUh8Q8vWb>JJQJd%kRIJ=LyRAn~E%?f7A`u8(M>P
z>UFB=elyp9Y_gk?>Z$8+(Frj@;@avGos2)qRLRslkt~s&i}s}#uglB1l&$AYy=5qD
z?$|O{K$iWKhszb-S$q&BurdWJR$*_76k~o6v>vyq`pRYQT5KVZIi&dU4mJqZL`IE!
z1f(QMDT&RoOP)~HvWTCIQY)sJgMCwjZHmg;qOM%y{K7x1xLMR+Uu_hc$(#j6Ye66#
zsIS^}pU-xOW`37*?rTio>Fs>7gD-nV|BRSZm6FF8aSjwlzN_#3W_qwOnM^V@Af`H;
zR2j@BK~5P!_W3pXNhcmQj-H5i_>HZoj)bU`dbupvX7>6t{<W~nWnJ2($zRfN&Q4i8
znO9$9&bNT$>yOjy-PKPSxv7D!8a{#J7|DPNkAr}${v2V~8`l;W5!Xgswp20U#M=s=
znBdR9={)V?^Wy7^s=`x!HFw8O7!=!-PgCtuOJzHci;5EW6qYdFo$K`|G`k^8F(<wV
zxp$_;z)#BLW5<XntND2vu*CNej)!0=>>>~A4o>iMH0`-EG^qJVfhK)aqh%-Q#5VsV
za{+Ed0d+Le@1p-QS}-q|OE-BLtBU5eHbU&$rj#yGwfWxM9t7z^Zw&39j$wY%zu!fU
zpMKyXhpq)R^Op-co%G37*Dv<8daTuLAMu$^Byfn<m$Hoa6-~sF72;k<eYe=Yyw}+?
zX87y_jY%UxrhB8WS)q|`OLI)EYb}kS5hdS^?VK6P;p$yk)m6y{%5YodCWWWqAHy}#
z-*JOli;>&DPTP&{(%lW~&v(~uSsrePvUoJzy#B!$qE70dmyqvv@mpdudqTaCx)haE
z+jbg+3M|VcHtF0W<h#t;9pa@cUAb`rYl*1j5UbBUMJjd<k|f=)QqtQYJ0UFCJh}&o
zUH1LHe(`FY(8*_>t6)z0LK8ji^DgLk<gam^)TOrbZY|S(S%_R#e1h#_X{Tog8mzeG
zhNp^`x-SzM6Z-~Bm~hHB0NvJJWH0<~<IWvxf2e<GbU&%Pfthi<gt@#`DXw#u0*k;V
z{NLRI|8m5WlYlKaxr-!ifSY+3ftdNj{tdjY#1e$v%F-E!_~o-dT?&q<vJ+8~i*z4R
z(i|0;h)rBTc}VJO(5*<A_{y;zqwbk7B%5r|4x5579?M&$&&ym{oZsJYf~Yb2;>6T1
z#0IAhvHU9D@e#z<hj6i2Shlmqh;bA)D#uaYWP+Cy>lMeOy6UvZ{o3JX;C6<)qoy?$
z%dYseIJ|_u<vCbe2t>;>86`%k4eZ*nUk-Nem2dKn;r9%2WbF!$4c>h7-S4=6RouGs
ziBcvQk}Zm-hS>BREqHDt@VoN&slx4RpL5s~$9MOZ7;=6WJUz7qUz1EU)1ue-<Q+t-
zVr5@k?N43k$uPb@(&k}AgJ3L5KkgtbtDvJD7Qt!{)>U7z>7FMl1`^Jv&`yOCKoJ87
zHL3K<HBZfs0lK;SwXV}LvKG_zwpx)L2GD3!X2{HBQ=Z<BvLC%+;~e*ioD7T>_<jt*
zD<A$KXe(=ACBfV8hQLRcD8BL+ID2gEDjBx23gXQ?-g3X++6$!lf~`m1EC$Ix{UZ8+
z1C|_2*NAO$Kym8!NFa{lpP{ziIB4CJvdRBpPA`)zN_?trbSgJ#pd(dsHFtRr2+4k0
zQ(q>l{};=1UMj}e5jwuBjiR^hWIghv-o-%9AsnCfJ{nIP-UHIa^Q3h1w@{fYDb|p&
zr%GM5#TO00g69&<>aw>gAhB{ME8YW3QQ~5gr^O`>{(FgoyznqZrFFHd_oI)d9F|40
zeVo^LKy#t%)2f%5eqn{z>%i)n<nBM3>J20zNF~An9S1&F6n>52(LDFp<uHAmRAKoR
zTVD#6#!@!jKZUGp8CZI$Y-dVBzTNN8%~oZwLubpkRvgA;skgi}75NiaF&M36jm3rA
zyZgAisjd!u+bZ4)&5``$T!+aSl50x=!>WrLZWF6zm17kldMeTVfzY)Ti$~JN+N?Vt
zS#sV}KZqE%+~$LDD-&#I*{Subgd6e3g5%m>i@PAL;LBK?HYIeVsqJ!u_YsS-oX+I%
z*8-A_*C!A8`{={!|5W~o_YJQ<ja>Z1Y$ROY`uw;R2Go@S8@Xko?z~5r3wB&BM&q7K
zFz0jhXskjAy=;%`8ryR@xj>JJu&gw&CBUAT8-y>Mgae=X(m?$h%aGp#w#Ek|rHmgb
zn%?nF?VFFHz;+ANMbDe+drkweNjo-J#WpegA2k>(msI~2$M*asvx?(`{*Aiu17k8_
zA<v9JFF?uWYbl=WrxS9w3#bYOI4Z|`VDL|tqKKB|u{^tv;=$C=Apo)RUJ1925$8>C
zDpaXc-%@|VLr-dcq<lC@%c$47|EVGJBlPU(aKPlu;~4bVRGoK<i<6ZbU#xG$IS#5S
zw7^%|?q>gqK41yU=Jy{ST1F}<lgX~mv7vy%>m!*c?TfMY&f-6BKi`VJwaAa@qF;>8
zRg@rncw;Fr*!Ty)-S!OcL<dVOm`D8uUQOh#2kH5Jrj$2>T2uD#rVl@SajUF2aLG>1
z!-a)w>5oq87>_NbW`s{e_fZ1E8S{*gL-YzG#n6_En$dMRUtOKNP@$5A4rPng!{m8+
zFLmBj;HOGb8MZhUDUAo1uh3B(^R^dKpYu@bsF~IpdOS&;#5SGD|II)rLwO(W5VlK?
zeS4z@mUsQY)LX-EBY23wf~xK`?`-*C-4e4vN|{y>$i`T3^6wy|dX>w!j7GLgOt78G
z2fXzfkGLZ#TVBw0Mlicx*`4JtOkCdx52rX9#w$u%@fCW{wsL(X;pe=>Q=Q%PnsIES
z9`st6bY^}Nj$?_%qvemzG?4T@g@`E|Y2M0W6(2nuCmA?dK_c~Ncif}26Uf+YTP9Z4
z%X6cLY=N_&t2Zt}9Yb_i3AHD5@*VemY{4J;Np*b`W?hTS6a!Jm3^zu%A8`{A-SgaU
z{pRg=1W>!*?5VS-6*BZ>z*MngfqjycpS_f0vKx!JK<o;X0bDh)pnMB!Jz-(II$Ua$
z^skG4eS;xq{cuk4)rJE%V)2X90kaB&cW#~R1<qBVD*N#F%no1tvNs<anRc1@P)y27
zUMx?;EjsA`kc5z))y{t@)ajKdLwkJwyXvDYGdCBZ?=&Otw0Ga}hTE3=1RUw`f>QVE
z|F{cueTzrjr5j$ovG{aeY+rHWajxc1_AEcqt-2n_CBN|0pw;+2_!-?RK7f6KOLldt
zku+^@{?S4h<!gWRzeaSoJv}B0xgs2*(eSpFGCNlO6&)_N<7UQxUcRdeA7KCaW0B2@
z&K-W5|I3R0<!i@Sz?bVhj)c0Ism^vb-CH}jl03+4O1mm1&+0U~&M}`n>rVbypy@l%
zr&C@*TG5mn3%5_^Qbl~({cq-jlgnZxW`{SmXn?ZYx$8t<{gT@e=d~l5#LQa)#82j%
zLtbA<+2QnZy#@(9o;Po};WBl81do9_zjt%xF28{$XN)xSN^W>TSKNrfP-CT~7D`|4
zHBV#kLvSZAk9I`15}5{kLE9y@a9m(PB?f)*I_KC;V0YqTla(J+y>vrhYX;5*IeEv<
z?X*EM3)z<WArL2J91#%?K`edZ<A@p9;CjIyns$dHm~Bt7^CyQH*r_paO(pZPHuKnO
zwKQ@#2UVM<GEeGARRLv%eQ8KHQStOqkP8+GubAsGFF{k>-@I=E+kyYA_h~LJ&J~P5
zR;T?S<=JxmEw~u%I(B%CG2Br<Vzro5BR8Usx5%yhE@0QPM+`;yGQMbzTszGq(f(mM
zV8p<)zBgW2L6%&$RNVSoG*7g0efl!_R`pv+Vu9x$CCUs+>;gr}p!NGt)0gP2+D_~I
zU%mF5E7)+RmY!$y80Ga?EB|+y*-&?)q#Piu7B$2WF0G@y9bPZMMVXkY1nCu=dDdL7
zEza&ScRA~=H%s^4@XuUhGPKZ5P!U;Zn0~GhaTjp{g`qK1TY1eUPV<a9#u`@E-Zy%*
zj*CB(^`l83W0Wy#`*lS67p1iIi)qQn9z%Tly(W5@k6D5z3)Xof^<xn}`+M61hZ9lZ
zbjNW^Tja8Fi|m<{z-*KPvi7>FUWkXM&^7$R@yJQ9-HA%<>++qdU3?;9jyHEXj+B!o
zAFYqZQ?9e9()hw(>Kg_t&QFIQ5vie1rcmAnF5Yidh?+|6vZ1OpwYEz}y6!&BIj6Mw
z);>EsUE(|QKKBf#xY!eSQ0M`l%*Y?4L-nE`-}eOc=T+{0w#y7u#z($up@FIzA-%4v
zmt<btVQWoc^3kJNf{f2xe>XH`Es_D7gD+5}0~g&`g(OM^rspX$QC2%og7kjoJ=N;q
zh?eFE1k%aNdbl5AUv}5LFijPkCQ=RRGZd2_V_1GpDM4!6eph{)ceAOYA!1-ZJh045
z0=uM7<>^7EA=EcOpB!@5Q0Obu=Pq@rR<u7to2!?GKY(GgOwWF!3;0F6eT!CUQX?1L
z1TsY*@<;Xsp}ap*Rwy!_N3CjJZ}~HCyQl6co_6M~dNT-s+3=|UY=7x9Pp@6C9|@Y+
zs3$g~tUIafEEvdf8Op<^K%5Q5Zvd_$;BOB4ExNPp27y<6y{>|ty)1_2%){$Yqzsm%
zf?tI}odyq?HIJ~BWaNsfAAZ5|mZ%kT9zV$D0Wr2#(+=B%L0?AfQO6ewBHKy~W>$N$
zeltL9C&Gh^Zl60*CRhU0?zJ0BR(iGP1&V$53F9+YY6ng(STLIz1V}gix<sCA3Qj1@
z(8Ifk$o*nT%Fw4GR_}%ye}^gkl0n=Kd|-u58*V0d<}YES$(07QHo3Lim+n7PrG_=e
z8+{2*(|sN75VK2n50NBYyjR^d0g3UK6@7_z@d4ZG)?UK(_T3U&N^~8)9~#)qMryc2
zpY?Ods|-YXj9TSfiG=oW`jsXkKcm&wA8tTd*Cnk7g+YmUGk<wj0o}LTz%R<840{0o
z%{!2ad#&nYFR~eNAUM3^k;3X^3#GVccNFQ~EJ3*I$}&J$*QkQ!Ui}|+^?z&Zzbc^z
zsUo}2_ngWCE<M1#W;9HhE7?DMEi*BG1!wvrhPA0)j!~_RuT(Bl4r9+70Cse#iWw7E
ziz=QIsD8JFdED2urg5UWG-jLQ)q-P3x6V|TJd}4!&G<G~6n9V1uiseMfX6#D=ds;(
zmaF3qk6hu~rFYYhds`mfgKHDQ^i$tLB$!vXAQOjc)sRjX<!D1_&Hwa+=;U8Jm+R-Z
zo7dlCY9Qhs-Yd|wT2V_Ihm3AM`Kv#QimPe3o}Px)RiQlLD!33QUt=($JzPIrXw2ns
zAW14snT#@^e4Jjcd;5i-%i@|^lw;4SI{Aa8EKeCzxHg#FS?I;>6X`1gDX>{hWS{Ql
z>nFn`oy1d&;fGb2jNmsX8a^u4JEx5;jXt&P`mzp=uh}mWt81>UFgw0-1BbJbC&j!V
zM(<Q99-{oZ0qZtd$TQW;!%eOpB$ifm>9ZmwdLw{DJ;ZyAwfRk(u@tOZBmBIlID(re
zof{THT;<d-YyPn~NLsGM@~|RM|ET(;>Y}z%`j4(i-mTrjApKh*>Th<+Rwsg_76?X$
zVT=}0;?d`y)+W<FMgvoJpKgkFz73StHzMm%nT{Cw%;|S=p;1B1nrnq41G_ZfM&y+U
zC?~;02KOTEyGMMMgOOT_=DqlZV9fbxC;hb3wOr@EJ}HRtF$tr@%e_x@p{4UoMgd0$
zsgrt7HN>k<a=cUgw=Z{GTiFFge-wn7Ab7PnQrp;&XIfmuSUZH@$Rbq@c6L}tYoe$M
zo3oY*d~E8NEt22do!~9?b<GTrZZ6atW0jD->J(+kx)~ei?a3i8a2SxzleMNhPb!oV
zchx6@j#lJE{_Gx^HS9+XyzKIVVCj(5E5ViGLR~O|a4C+`KqH!PLm)^lF6!uD_2XCQ
zxgEBcs|mE5FU!4tr~jairE6pVigS;Hwro%_W17Ka`z*6}zizNv#g5kYJFTLrNGx^{
zileP+xC&Rln<23?-W-`xv8Du<n9sbRmqmugld81>W?t5M-dwe2N6Wg(y3T~jZcM%^
zfk^F;=z;r+5{MTjmpxNO@w?*;^?uI!1uwjtxgVQ+ODICJ?@}^EpKZEh3X*n%95Hjk
z^@ifqZ$@n3%jaI04B+->3Q)}VNxqmZ_hf8uU~Al`Z>L9xd|r|$4=l|_Jbiv136eC7
zT7omJ3j`>Z|Jtb5!ic~sMeuA2j*Y(Kp6T=<tNB92MVR9%-I0}pfBb6L|3MsdP=eof
z50^bfP*~S-r5QZEAO7JsL#j!HRLp_tEj+8SC{{cq0sRhhxLbp!zZ3+RjM4kQF(t&g
z0}!U<guOn9@7qcM0p3g)G!$?)F5KC}OOo<$Ra)D8h|NW+u&u`b3poF;AbKS>eSWXv
z73MYnA<H+T`!ETwe`n#^?7M?m-seNi{&5B>zn|s|adFyvv9+1xpR^}}8PgB!+#nwV
zy!r-tj%)K1*v9At`Q<%g{E@5bHV`^5bZFlAw|y2D%giW<Ny~UjKJEDa5Gq^>9lUw~
zaoWeWv|=%Gy313Q4)4?Fw@*Uw-;pw4&2-KuBO3uD!3F=dQ|FtEZgsz*)6m^S-GXx3
zy9P@J6m}GMB2LQ;TNQHC@_h(in!&SfGOl<+F4-8&z=DyN!k<MUhp|Fg_)4a}3_DqH
zks^X{Q;jr5(u~Tq@uwB4Nbv8ERsUlvo<^{D_ePy(-y`~D((<+Q&u*Wps~)tv{mTBe
zmy?z~{>k#@mi~-wsTXx`z9`k%vCiLX&j0mHx=+6z)%_Bl=dbJhp1=82`lbFq`)|#A
zy?;x+rTx|ZJ^YD6*&olV{OW&wapT1O?n``<GW53SUor0WT`cn91F$u5f+>_QNRU-`
zhLnDkuHK^MpBBQJ6T(7TanFw2IF`G2Rm0AwF450lFM7PVDk!db+s>++e{yf`+us!+
zY^QhT_v-xk`~11}PioZuM*QBj;M&bSMGKC+{ITh4+$!S>E>3x8mHS1$cr<<UjaqI$
z^&xNj;Wv&J6<WYGc+DrfLmT}vRCz*0stQGu0;RfR_&EcC+0H;|Dy+GnpJw&$dLVFV
ze(&|EiJ!mMN_?N*FP`@I>Fu|l^VQbg68^S0zu0MM@2l(j@=utZ+|&*x#UG8Wl`Z|?
z)AYUAY~qOm1_d?#b*>q2ayv?t9)DNa(Hr_;$C^vxelJQO75$csUv^Laoh_W(_u(Vg
zblES{v$yxP=N5mxS{Q5J^g8~M+wbY0!%kbu`XuQpCocb+Fwc34e>uNT(~8Ou`wlGM
zba2K>PXQf<RE}4@iu%XjdrtZEYjvX7nK|E9?N>kO^4IjHeBkY6e=}acmXEnzd->b?
z$UgS#vnAsGZZ>@K@6V5?8-CyESE<+%_$$VCf!XQc1Jk1&Az5d=4d<B!fs9t%4ebn|
zx^~yK@OuhwZlb_7Y;w%t%+pf+l>5WymTU1J-|90Q*bD69W6eYb7Jur0Y@3t9`s{xV
PPz8ghtDnm{r-UW|qxlst

literal 0
HcmV?d00001


From dd30d570b7be10ea0b53c0652c60bf4db80e8509 Mon Sep 17 00:00:00 2001
From: Trung Le <trungtuanle90@gmail.com>
Date: Tue, 27 Sep 2016 16:28:55 -0400
Subject: [PATCH 15/15] Modified the way to find the remaining elements count
 to be O(1) instead of O(logn) as before

---
 README.md                      |  4 +++-
 stream_compaction/common.cu    | 29 -----------------------------
 stream_compaction/common.h     |  3 ---
 stream_compaction/efficient.cu | 12 ++++++++----
 4 files changed, 11 insertions(+), 37 deletions(-)

diff --git a/README.md b/README.md
index d3f1bfb..c5b8d8b 100644
--- a/README.md
+++ b/README.md
@@ -47,7 +47,6 @@ As we can see, the CPU version is outperformed by the rest. Thrust is clearly a
 - We're not taking advantage of shared memory inside each block to store the partial sum results.
 - Each level of upsweep/downsweep currently launches a new kernel. It would be ideal to use the same kernel and compute the next level there without having to transfer the control back to the CPU.
 - At deeper level in the upsweep/downsweep calls, there are a lot of idle threads not doing work. This is wasting a lot of GPU cycles.
-- In the stream compaction phase, in order to find the number of remaining elements after compaction, I launched a new kernel to search for the maximum value in the prefix-sum array that is used to index into the output array. This could be a potential bottle neck but I haven't tested a different version to compare.
 - There are quite a bit of memory transfering between GPU & CPU, which initially slowed the application down alot. So I rewrote my scan and compaction functions to minimize this memory transfer.
 
 When testing with different block sizes, I found it pretty interesting that at size 128, it seems to be the most optimal. So I decided to use this block size for the rest of profiling 
@@ -128,9 +127,12 @@ Runtime: 2.01408 ms
 ```
 
 ## Note
+
 ### Modified test
 I added a #define PROFILE and #define PROFILE_ITERATIONS flags in a new header file "profilingcommon.h". When this is on, running main() will also iterate through each function call PROFILE_ITERATIONS number of times, then measure the execution time and average it for profiling analysis.
 
+I also increased the reserved stack size in VS to 0x40000000 to prevent stack overflow for larger array size
+
 ### Modified CMakeList.txt
 - Added "ProfilingCommon.h"
 - Changed to -arch=sm_52
diff --git a/stream_compaction/common.cu b/stream_compaction/common.cu
index cf8450a..33080b3 100644
--- a/stream_compaction/common.cu
+++ b/stream_compaction/common.cu
@@ -14,35 +14,6 @@ void checkCUDAErrorFn(const char *msg, const char *file, int line) {
     exit(EXIT_FAILURE);
 }
 
-/* Max reduction is really just the partial sum upsweep algorithm */
-__global__ void maxReduction(int n, int level, int* odata) {
-  int tid = threadIdx.x + (blockIdx.x * blockDim.x);
-  if (tid >= n) {
-    return;
-  }
-  
-  int twoToLevel = powf(2, level);
-  int twoToLevelPlusOne = powf(2, level + 1);
-  if (tid % twoToLevelPlusOne == 0) {
-    odata[tid + twoToLevelPlusOne - 1] = imax(odata[tid + twoToLevel - 1], odata[tid + twoToLevelPlusOne - 1]);
-  }
-}
-
-int findMaxInDeviceArray(int n, int *dev_idata) {
-
-  int height = ilog2ceil(n);
-
-
-  for (int level = 0; level < height; ++level) {
-	  maxReduction << <BLOCK_COUNT(n), BLOCK_SIZE >> >(n, level, dev_idata);
-  }
-
-  int maxValue = 0;
-  cudaMemcpy(&maxValue, dev_idata + n - 1, sizeof(int), cudaMemcpyDeviceToHost);
-
-  return maxValue;
-}
-
 namespace StreamCompaction {
 namespace Common {
 
diff --git a/stream_compaction/common.h b/stream_compaction/common.h
index 26a03e1..e3eedd3 100644
--- a/stream_compaction/common.h
+++ b/stream_compaction/common.h
@@ -33,9 +33,6 @@ inline int ilog2ceil(int x) {
     return ilog2(x - 1) + 1;
 }
 
-int findMaxInDeviceArray(int n, int *idata);
-
-
 namespace StreamCompaction {
 namespace Common {
     __global__ void inclusiveToExclusiveScanResult(int n, int* odata, const int* idata);
diff --git a/stream_compaction/efficient.cu b/stream_compaction/efficient.cu
index 3f23434..123309a 100644
--- a/stream_compaction/efficient.cu
+++ b/stream_compaction/efficient.cu
@@ -39,8 +39,8 @@ __global__ void downsweep(int n, int level, int* odata) {
 }
 
 // Should only be launched with 1 thread?
-__global__ void remainingElementsCountForCompact(const int boolIndex, int* dev_indices, const int* dev_bools, int* remainingElementsCount) {
-	*remainingElementsCount = dev_bools[boolIndex] == 1 ? boolIndex : boolIndex;
+__global__ void kernRemainingElementsCountForCompact(const int n, int* dev_indices, const int* dev_bools, size_t* remainingElementsCount) {
+	*remainingElementsCount = dev_bools[n - 1] + dev_indices[n - 1];
 }
 
 void deviceScan(int n, int* dev_odata) {
@@ -160,7 +160,11 @@ int compact(int n, int *odata, const int *idata, float* timeElapsedMs) {
   Common::kernScatter << <BLOCK_COUNT(ceilPower2), BLOCK_SIZE >> >(ceilPower2, dev_odata, dev_idata, dev_bools, dev_indices);
 
   // The max value of all the valid indices for the compacted stream is the number of remaining elements
-  int remainingElementsCount = findMaxInDeviceArray(ceilPower2, dev_indices);
+  size_t* dev_remainingElementCount;
+  cudaMalloc((void**)&dev_remainingElementCount, sizeof(size_t));
+  kernRemainingElementsCountForCompact<<<1, 1>>>(ceilPower2, dev_indices, dev_bools, dev_remainingElementCount);
+  size_t remainingElementCount = 0;
+  cudaMemcpy(&remainingElementCount, dev_remainingElementCount, sizeof(size_t), cudaMemcpyDeviceToHost);
   
 #ifdef PROFILE
   // -- End code block to profile
@@ -182,7 +186,7 @@ int compact(int n, int *odata, const int *idata, float* timeElapsedMs) {
   cudaEventElapsedTime(&milliseconds, start, stop);
   *timeElapsedMs = milliseconds;
 #endif
-  return remainingElementsCount;
+  return remainingElementCount;
 }
 
 }