BUG: Fix buffered reduction case in nditer (ticket #1834)

author: Mark Wiebe <mwwiebe@gmail.com> 2011-05-18 06:31:51 -0500
committer: Mark Wiebe <mwwiebe@gmail.com> 2011-05-18 06:31:51 -0500
commit: 9fb892241a0e7d23ab317e41fd77882e4a254c1f (patch)
tree: e0995e1523c59a3989db8571e399488c4c805826
parent: cbca2458d9ade3c624d29bb1b27451af0c47372a (diff)
download: numpy-9fb892241a0e7d23ab317e41fd77882e4a254c1f.tar.gz
3 files changed, 22 insertions, 3 deletions
diff --git a/numpy/core/src/multiarray/einsum.c.src b/numpy/core/src/multiarray/einsum.c.src
index 9898d00fa..fe4922854 100644
--- a/numpy/core/src/multiarray/einsum.c.src
+++ b/numpy/core/src/multiarray/einsum.c.src
@@ -3006,7 +3006,7 @@ PyArray_EinsteinSum(char *subscripts, npy_intp nop,
 
     /***************************/
     /*
-     * Accceleration for some specific loop structures. Note
+     * Acceleration for some specific loop structures. Note
      * that with axis coalescing, inputs with more dimensions can
      * be reduced to fit into these patterns.
      */
diff --git a/numpy/core/src/multiarray/nditer.c.src b/numpy/core/src/multiarray/nditer.c.src
index d2074db83..781e901d2 100644
--- a/numpy/core/src/multiarray/nditer.c.src
+++ b/numpy/core/src/multiarray/nditer.c.src
@@ -5539,13 +5539,30 @@ npyiter_copy_to_buffers(NpyIter *iter, char **prev_dataptrs)
 
     /* If last time around, the reduce loop structure was full, we reuse it */
     if (reuse_reduce_loops) {
+        npy_intp full_transfersize;
+
         reduce_outerstrides = NBF_REDUCE_OUTERSTRIDES(bufferdata);
         reduce_outerptrs = NBF_REDUCE_OUTERPTRS(bufferdata);
         reduce_outerdim = NBF_REDUCE_OUTERDIM(bufferdata);
         reduce_outeraxisdata = NIT_INDEX_AXISDATA(axisdata, reduce_outerdim);
         reduce_innersize = NBF_SIZE(bufferdata);
         NBF_REDUCE_POS(bufferdata) = 0;
-        transfersize = NBF_REDUCE_OUTERSIZE(bufferdata)*reduce_innersize;
+        /*
+         * Try to do make the outersize as big as possible. This allows
+         * it to shrink when processing the last bit of the outer reduce loop,
+         * then grow again at the beginnning of the next outer reduce loop.
+         */
+        NBF_REDUCE_OUTERSIZE(bufferdata) = (NAD_SHAPE(reduce_outeraxisdata)-
+                                            NAD_INDEX(reduce_outeraxisdata));
+        full_transfersize = NBF_REDUCE_OUTERSIZE(bufferdata)*reduce_innersize;
+        /* If the full transfer size doesn't fit in the buffer, truncate it */
+        if (full_transfersize > NBF_BUFFERSIZE(bufferdata)) {
+            NBF_REDUCE_OUTERSIZE(bufferdata) = transfersize/reduce_innersize;
+            transfersize = NBF_REDUCE_OUTERSIZE(bufferdata)*reduce_innersize;
+        }
+        else {
+            transfersize = full_transfersize;
+        }
         NBF_BUFITEREND(bufferdata) = iterindex + reduce_innersize;
 
         NPY_IT_DBG_PRINT3("Reused reduce transfersize: %d innersize: %d "
@@ -5553,6 +5570,8 @@ npyiter_copy_to_buffers(NpyIter *iter, char **prev_dataptrs)
                             (int)transfersize,
                             (int)reduce_innersize,
                             (int)NpyIter_GetIterSize(iter));
+        NPY_IT_DBG_PRINT1("Reduced reduce outersize: %d",
+                            (int)NBF_REDUCE_OUTERSIZE(bufferdata));
     }
     /*
      * If there are any reduction operands, we may have to make
diff --git a/numpy/core/tests/test_iterator.py b/numpy/core/tests/test_iterator.py
index d29c2adfb..8898657b2 100644
--- a/numpy/core/tests/test_iterator.py
+++ b/numpy/core/tests/test_iterator.py
@@ -2236,7 +2236,7 @@ def test_iter_reduction():
     for x in it2:
         x[1][...] += x[0]
     assert_equal(it1.operands[1], it2.operands[1])
-    assert_equal(it2.operands[2].sum(), a.size)
+    assert_equal(it2.operands[1].sum(), a.size)
 
 def test_iter_buffering_reduction():
     # Test doing buffered reductions with the iterator
author	Mark Wiebe <mwwiebe@gmail.com>	2011-05-18 06:31:51 -0500
committer	Mark Wiebe <mwwiebe@gmail.com>	2011-05-18 06:31:51 -0500
commit	9fb892241a0e7d23ab317e41fd77882e4a254c1f (patch)
tree	e0995e1523c59a3989db8571e399488c4c805826
parent	cbca2458d9ade3c624d29bb1b27451af0c47372a (diff)
download	numpy-9fb892241a0e7d23ab317e41fd77882e4a254c1f.tar.gz