* _iotools.StringConverter

- use '1' instead of '0' to test the update - add `iterupgrade` to upgrade from an iterator * io.genfromtxt (bug #1212) - use `iterupgrade` to upgrade the converters, and reprocess if there's a problem to catch the offending line
author: pierregm <pierregm@localhost> 2009-10-06 03:47:07 +0000
committer: pierregm <pierregm@localhost> 2009-10-06 03:47:07 +0000
commit: 6386708bcd6deaf3f6e5f145fb59c0d4b9af86d9 (patch)
tree: c5ef08d00870e076b37298cf37c9bb4ca868d5fb /numpy/lib/io.py
parent: 9a41e774079340e1a8887d9f2310c2458580ec6c (diff)
download: numpy-6386708bcd6deaf3f6e5f145fb59c0d4b9af86d9.tar.gz
1 files changed, 30 insertions, 10 deletions
diff --git a/numpy/lib/io.py b/numpy/lib/io.py
index ba804e43f..255c5a7f5 100644
--- a/numpy/lib/io.py
+++ b/numpy/lib/io.py
@@ -12,12 +12,14 @@ import cStringIO
 import os
 import itertools
 import warnings
+from operator import itemgetter
 
 from cPickle import load as _cload, loads
 from _datasource import DataSource
 from _compiled_base import packbits, unpackbits
 
 from _iotools import LineSplitter, NameValidator, StringConverter, \
+                     ConverterError, ConverterLockError, \
                      _is_string_like, has_nested_fields, flatten_dtype
 
 _file = file
@@ -1176,16 +1178,29 @@ def genfromtxt(fname, dtype=float, comments='#', delimiter=None, skiprows=0,
         elif nbvalues != nbcols:
             append_to_invalid((i, nbvalues))
             continue
-        # Check whether we need to update the converter
-        if dtype is None:
-            for (converter, item) in zip(converters, values):
-                converter.upgrade(item)
         # Store the values
         append_to_rows(tuple(values))
         if usemask:
             append_to_masks(tuple([val.strip() in mss
                             for (val, mss) in zip(values, missing)]))
 
+    # Upgrade the converters (if needed)
+    if dtype is None:
+        for (i, converter) in enumerate(converters):
+            current_column = map(itemgetter(i), rows)
+            try:
+                converter.iterupgrade(current_column)
+            except ConverterLockError:
+                errmsg = "Converter #%i is locked and cannot be upgraded: " % i
+                current_column = itertools.imap(itemgetter(i), rows)
+                for (j, value) in enumerate(current_column):
+                    try:
+                        converter.upgrade(value)
+                    except (ConverterError, ValueError):
+                        errmsg += "(occurred line #%i for value '%s')"
+                        errmsg %= (j + 1 + skiprows, value)
+                        raise ConverterError(errmsg)
+
     # Check that we don't have invalid values
     if len(invalid) > 0:
         # Construct the error message
@@ -1202,14 +1217,19 @@ def genfromtxt(fname, dtype=float, comments='#', delimiter=None, skiprows=0,
 
     # Convert each value according to the converter:
     # We want to modify the list in place to avoid creating a new one...
+#    if loose:
+#        conversionfuncs = [conv._loose_call for conv in converters]
+#    else:
+#        conversionfuncs = [conv._strict_call for conv in converters]
+#    for (i, vals) in enumerate(rows):
+#        rows[i] = tuple([convert(val)
+#                         for (convert, val) in zip(conversionfuncs, vals)])
     if loose:
-        conversionfuncs = [conv._loose_call for conv in converters]
+        rows = zip(*(map(converter._loose_call, map(itemgetter(i), rows))
+                     for (i, converter) in enumerate(converters)))
     else:
-        conversionfuncs = [conv._strict_call for conv in converters]
-    for (i, vals) in enumerate(rows):
-        rows[i] = tuple([convert(val)
-                         for (convert, val) in zip(conversionfuncs, vals)])
-
+        rows = zip(*(map(converter._strict_call, map(itemgetter(i), rows))
+                     for (i, converter) in enumerate(converters)))
     # Reset the dtype
     data = rows
     if dtype is None:
author	pierregm <pierregm@localhost>	2009-10-06 03:47:07 +0000
committer	pierregm <pierregm@localhost>	2009-10-06 03:47:07 +0000
commit	6386708bcd6deaf3f6e5f145fb59c0d4b9af86d9 (patch)
tree	c5ef08d00870e076b37298cf37c9bb4ca868d5fb /numpy/lib/io.py
parent	9a41e774079340e1a8887d9f2310c2458580ec6c (diff)
download	numpy-6386708bcd6deaf3f6e5f145fb59c0d4b9af86d9.tar.gz