summaryrefslogtreecommitdiff
path: root/unidecode/x013.py
diff options
context:
space:
mode:
authorTomaz Solc <tomaz.solc@tablix.org>2010-10-12 19:12:30 +0200
committerTomaz Solc <tomaz.solc@tablix.org>2010-10-12 19:12:30 +0200
commit5f1a7a98bbdae79dd1e7de2fd577a3feced0169f (patch)
treeada5201890c047f5ab19664f4c9eba006ff57aa0 /unidecode/x013.py
parentb6ca26833caeaede52e13bcf6ebd0e2015a2d753 (diff)
downloadunidecode-5f1a7a98bbdae79dd1e7de2fd577a3feced0169f.tar.gz
Support for characters beyond BMP and below PUA
Diffstat (limited to 'unidecode/x013.py')
-rw-r--r--unidecode/x013.py257
1 files changed, 257 insertions, 0 deletions
diff --git a/unidecode/x013.py b/unidecode/x013.py
new file mode 100644
index 0000000..8a8c3f9
--- /dev/null
+++ b/unidecode/x013.py
@@ -0,0 +1,257 @@
+data = (
+'ja', # 0x00
+'ju', # 0x01
+'ji', # 0x02
+'jaa', # 0x03
+'jee', # 0x04
+'je', # 0x05
+'jo', # 0x06
+'jwa', # 0x07
+'ga', # 0x08
+'gu', # 0x09
+'gi', # 0x0a
+'gaa', # 0x0b
+'gee', # 0x0c
+'ge', # 0x0d
+'go', # 0x0e
+'[?]', # 0x0f
+'gwa', # 0x10
+'[?]', # 0x11
+'gwi', # 0x12
+'gwaa', # 0x13
+'gwee', # 0x14
+'gwe', # 0x15
+'[?]', # 0x16
+'[?]', # 0x17
+'gga', # 0x18
+'ggu', # 0x19
+'ggi', # 0x1a
+'ggaa', # 0x1b
+'ggee', # 0x1c
+'gge', # 0x1d
+'ggo', # 0x1e
+'[?]', # 0x1f
+'tha', # 0x20
+'thu', # 0x21
+'thi', # 0x22
+'thaa', # 0x23
+'thee', # 0x24
+'the', # 0x25
+'tho', # 0x26
+'thwa', # 0x27
+'cha', # 0x28
+'chu', # 0x29
+'chi', # 0x2a
+'chaa', # 0x2b
+'chee', # 0x2c
+'che', # 0x2d
+'cho', # 0x2e
+'chwa', # 0x2f
+'pha', # 0x30
+'phu', # 0x31
+'phi', # 0x32
+'phaa', # 0x33
+'phee', # 0x34
+'phe', # 0x35
+'pho', # 0x36
+'phwa', # 0x37
+'tsa', # 0x38
+'tsu', # 0x39
+'tsi', # 0x3a
+'tsaa', # 0x3b
+'tsee', # 0x3c
+'tse', # 0x3d
+'tso', # 0x3e
+'tswa', # 0x3f
+'tza', # 0x40
+'tzu', # 0x41
+'tzi', # 0x42
+'tzaa', # 0x43
+'tzee', # 0x44
+'tze', # 0x45
+'tzo', # 0x46
+'[?]', # 0x47
+'fa', # 0x48
+'fu', # 0x49
+'fi', # 0x4a
+'faa', # 0x4b
+'fee', # 0x4c
+'fe', # 0x4d
+'fo', # 0x4e
+'fwa', # 0x4f
+'pa', # 0x50
+'pu', # 0x51
+'pi', # 0x52
+'paa', # 0x53
+'pee', # 0x54
+'pe', # 0x55
+'po', # 0x56
+'pwa', # 0x57
+'rya', # 0x58
+'mya', # 0x59
+'fya', # 0x5a
+'[?]', # 0x5b
+'[?]', # 0x5c
+'[?]', # 0x5d
+'[?]', # 0x5e
+'[?]', # 0x5f
+'[?]', # 0x60
+' ', # 0x61
+'.', # 0x62
+',', # 0x63
+';', # 0x64
+':', # 0x65
+':: ', # 0x66
+'?', # 0x67
+'//', # 0x68
+'1', # 0x69
+'2', # 0x6a
+'3', # 0x6b
+'4', # 0x6c
+'5', # 0x6d
+'6', # 0x6e
+'7', # 0x6f
+'8', # 0x70
+'9', # 0x71
+'10+', # 0x72
+'20+', # 0x73
+'30+', # 0x74
+'40+', # 0x75
+'50+', # 0x76
+'60+', # 0x77
+'70+', # 0x78
+'80+', # 0x79
+'90+', # 0x7a
+'100+', # 0x7b
+'10,000+', # 0x7c
+'[?]', # 0x7d
+'[?]', # 0x7e
+'[?]', # 0x7f
+'[?]', # 0x80
+'[?]', # 0x81
+'[?]', # 0x82
+'[?]', # 0x83
+'[?]', # 0x84
+'[?]', # 0x85
+'[?]', # 0x86
+'[?]', # 0x87
+'[?]', # 0x88
+'[?]', # 0x89
+'[?]', # 0x8a
+'[?]', # 0x8b
+'[?]', # 0x8c
+'[?]', # 0x8d
+'[?]', # 0x8e
+'[?]', # 0x8f
+'[?]', # 0x90
+'[?]', # 0x91
+'[?]', # 0x92
+'[?]', # 0x93
+'[?]', # 0x94
+'[?]', # 0x95
+'[?]', # 0x96
+'[?]', # 0x97
+'[?]', # 0x98
+'[?]', # 0x99
+'[?]', # 0x9a
+'[?]', # 0x9b
+'[?]', # 0x9c
+'[?]', # 0x9d
+'[?]', # 0x9e
+'[?]', # 0x9f
+'a', # 0xa0
+'e', # 0xa1
+'i', # 0xa2
+'o', # 0xa3
+'u', # 0xa4
+'v', # 0xa5
+'ga', # 0xa6
+'ka', # 0xa7
+'ge', # 0xa8
+'gi', # 0xa9
+'go', # 0xaa
+'gu', # 0xab
+'gv', # 0xac
+'ha', # 0xad
+'he', # 0xae
+'hi', # 0xaf
+'ho', # 0xb0
+'hu', # 0xb1
+'hv', # 0xb2
+'la', # 0xb3
+'le', # 0xb4
+'li', # 0xb5
+'lo', # 0xb6
+'lu', # 0xb7
+'lv', # 0xb8
+'ma', # 0xb9
+'me', # 0xba
+'mi', # 0xbb
+'mo', # 0xbc
+'mu', # 0xbd
+'na', # 0xbe
+'hna', # 0xbf
+'nah', # 0xc0
+'ne', # 0xc1
+'ni', # 0xc2
+'no', # 0xc3
+'nu', # 0xc4
+'nv', # 0xc5
+'qua', # 0xc6
+'que', # 0xc7
+'qui', # 0xc8
+'quo', # 0xc9
+'quu', # 0xca
+'quv', # 0xcb
+'sa', # 0xcc
+'s', # 0xcd
+'se', # 0xce
+'si', # 0xcf
+'so', # 0xd0
+'su', # 0xd1
+'sv', # 0xd2
+'da', # 0xd3
+'ta', # 0xd4
+'de', # 0xd5
+'te', # 0xd6
+'di', # 0xd7
+'ti', # 0xd8
+'do', # 0xd9
+'du', # 0xda
+'dv', # 0xdb
+'dla', # 0xdc
+'tla', # 0xdd
+'tle', # 0xde
+'tli', # 0xdf
+'tlo', # 0xe0
+'tlu', # 0xe1
+'tlv', # 0xe2
+'tsa', # 0xe3
+'tse', # 0xe4
+'tsi', # 0xe5
+'tso', # 0xe6
+'tsu', # 0xe7
+'tsv', # 0xe8
+'wa', # 0xe9
+'we', # 0xea
+'wi', # 0xeb
+'wo', # 0xec
+'wu', # 0xed
+'wv', # 0xee
+'ya', # 0xef
+'ye', # 0xf0
+'yi', # 0xf1
+'yo', # 0xf2
+'yu', # 0xf3
+'yv', # 0xf4
+'[?]', # 0xf5
+'[?]', # 0xf6
+'[?]', # 0xf7
+'[?]', # 0xf8
+'[?]', # 0xf9
+'[?]', # 0xfa
+'[?]', # 0xfb
+'[?]', # 0xfc
+'[?]', # 0xfd
+'[?]', # 0xfe
+)