summaryrefslogtreecommitdiff
path: root/unidecode/x015.py
diff options
context:
space:
mode:
authorTomaz Solc <tomaz.solc@tablix.org>2010-10-12 19:12:30 +0200
committerTomaz Solc <tomaz.solc@tablix.org>2010-10-12 19:12:30 +0200
commit5f1a7a98bbdae79dd1e7de2fd577a3feced0169f (patch)
treeada5201890c047f5ab19664f4c9eba006ff57aa0 /unidecode/x015.py
parentb6ca26833caeaede52e13bcf6ebd0e2015a2d753 (diff)
downloadunidecode-5f1a7a98bbdae79dd1e7de2fd577a3feced0169f.tar.gz
Support for characters beyond BMP and below PUA
Diffstat (limited to 'unidecode/x015.py')
-rw-r--r--unidecode/x015.py258
1 files changed, 258 insertions, 0 deletions
diff --git a/unidecode/x015.py b/unidecode/x015.py
new file mode 100644
index 0000000..5ac22cb
--- /dev/null
+++ b/unidecode/x015.py
@@ -0,0 +1,258 @@
+data = (
+'swa', # 0x00
+'swa', # 0x01
+'swaa', # 0x02
+'swaa', # 0x03
+'swaa', # 0x04
+'s', # 0x05
+'s', # 0x06
+'sw', # 0x07
+'s', # 0x08
+'sk', # 0x09
+'skw', # 0x0a
+'sW', # 0x0b
+'spwa', # 0x0c
+'stwa', # 0x0d
+'skwa', # 0x0e
+'scwa', # 0x0f
+'she', # 0x10
+'shi', # 0x11
+'shii', # 0x12
+'sho', # 0x13
+'shoo', # 0x14
+'sha', # 0x15
+'shaa', # 0x16
+'shwe', # 0x17
+'shwe', # 0x18
+'shwi', # 0x19
+'shwi', # 0x1a
+'shwii', # 0x1b
+'shwii', # 0x1c
+'shwo', # 0x1d
+'shwo', # 0x1e
+'shwoo', # 0x1f
+'shwoo', # 0x20
+'shwa', # 0x21
+'shwa', # 0x22
+'shwaa', # 0x23
+'shwaa', # 0x24
+'sh', # 0x25
+'ye', # 0x26
+'yaai', # 0x27
+'yi', # 0x28
+'yii', # 0x29
+'yo', # 0x2a
+'yoo', # 0x2b
+'yoo', # 0x2c
+'ya', # 0x2d
+'yaa', # 0x2e
+'ywe', # 0x2f
+'ywe', # 0x30
+'ywi', # 0x31
+'ywi', # 0x32
+'ywii', # 0x33
+'ywii', # 0x34
+'ywo', # 0x35
+'ywo', # 0x36
+'ywoo', # 0x37
+'ywoo', # 0x38
+'ywa', # 0x39
+'ywa', # 0x3a
+'ywaa', # 0x3b
+'ywaa', # 0x3c
+'ywaa', # 0x3d
+'y', # 0x3e
+'y', # 0x3f
+'y', # 0x40
+'yi', # 0x41
+'re', # 0x42
+'re', # 0x43
+'le', # 0x44
+'raai', # 0x45
+'ri', # 0x46
+'rii', # 0x47
+'ro', # 0x48
+'roo', # 0x49
+'lo', # 0x4a
+'ra', # 0x4b
+'raa', # 0x4c
+'la', # 0x4d
+'rwaa', # 0x4e
+'rwaa', # 0x4f
+'r', # 0x50
+'r', # 0x51
+'r', # 0x52
+'fe', # 0x53
+'faai', # 0x54
+'fi', # 0x55
+'fii', # 0x56
+'fo', # 0x57
+'foo', # 0x58
+'fa', # 0x59
+'faa', # 0x5a
+'fwaa', # 0x5b
+'fwaa', # 0x5c
+'f', # 0x5d
+'the', # 0x5e
+'the', # 0x5f
+'thi', # 0x60
+'thi', # 0x61
+'thii', # 0x62
+'thii', # 0x63
+'tho', # 0x64
+'thoo', # 0x65
+'tha', # 0x66
+'thaa', # 0x67
+'thwaa', # 0x68
+'thwaa', # 0x69
+'th', # 0x6a
+'tthe', # 0x6b
+'tthi', # 0x6c
+'ttho', # 0x6d
+'ttha', # 0x6e
+'tth', # 0x6f
+'tye', # 0x70
+'tyi', # 0x71
+'tyo', # 0x72
+'tya', # 0x73
+'he', # 0x74
+'hi', # 0x75
+'hii', # 0x76
+'ho', # 0x77
+'hoo', # 0x78
+'ha', # 0x79
+'haa', # 0x7a
+'h', # 0x7b
+'h', # 0x7c
+'hk', # 0x7d
+'qaai', # 0x7e
+'qi', # 0x7f
+'qii', # 0x80
+'qo', # 0x81
+'qoo', # 0x82
+'qa', # 0x83
+'qaa', # 0x84
+'q', # 0x85
+'tlhe', # 0x86
+'tlhi', # 0x87
+'tlho', # 0x88
+'tlha', # 0x89
+'re', # 0x8a
+'ri', # 0x8b
+'ro', # 0x8c
+'ra', # 0x8d
+'ngaai', # 0x8e
+'ngi', # 0x8f
+'ngii', # 0x90
+'ngo', # 0x91
+'ngoo', # 0x92
+'nga', # 0x93
+'ngaa', # 0x94
+'ng', # 0x95
+'nng', # 0x96
+'she', # 0x97
+'shi', # 0x98
+'sho', # 0x99
+'sha', # 0x9a
+'the', # 0x9b
+'thi', # 0x9c
+'tho', # 0x9d
+'tha', # 0x9e
+'th', # 0x9f
+'lhi', # 0xa0
+'lhii', # 0xa1
+'lho', # 0xa2
+'lhoo', # 0xa3
+'lha', # 0xa4
+'lhaa', # 0xa5
+'lh', # 0xa6
+'the', # 0xa7
+'thi', # 0xa8
+'thii', # 0xa9
+'tho', # 0xaa
+'thoo', # 0xab
+'tha', # 0xac
+'thaa', # 0xad
+'th', # 0xae
+'b', # 0xaf
+'e', # 0xb0
+'i', # 0xb1
+'o', # 0xb2
+'a', # 0xb3
+'we', # 0xb4
+'wi', # 0xb5
+'wo', # 0xb6
+'wa', # 0xb7
+'ne', # 0xb8
+'ni', # 0xb9
+'no', # 0xba
+'na', # 0xbb
+'ke', # 0xbc
+'ki', # 0xbd
+'ko', # 0xbe
+'ka', # 0xbf
+'he', # 0xc0
+'hi', # 0xc1
+'ho', # 0xc2
+'ha', # 0xc3
+'ghu', # 0xc4
+'gho', # 0xc5
+'ghe', # 0xc6
+'ghee', # 0xc7
+'ghi', # 0xc8
+'gha', # 0xc9
+'ru', # 0xca
+'ro', # 0xcb
+'re', # 0xcc
+'ree', # 0xcd
+'ri', # 0xce
+'ra', # 0xcf
+'wu', # 0xd0
+'wo', # 0xd1
+'we', # 0xd2
+'wee', # 0xd3
+'wi', # 0xd4
+'wa', # 0xd5
+'hwu', # 0xd6
+'hwo', # 0xd7
+'hwe', # 0xd8
+'hwee', # 0xd9
+'hwi', # 0xda
+'hwa', # 0xdb
+'thu', # 0xdc
+'tho', # 0xdd
+'the', # 0xde
+'thee', # 0xdf
+'thi', # 0xe0
+'tha', # 0xe1
+'ttu', # 0xe2
+'tto', # 0xe3
+'tte', # 0xe4
+'ttee', # 0xe5
+'tti', # 0xe6
+'tta', # 0xe7
+'pu', # 0xe8
+'po', # 0xe9
+'pe', # 0xea
+'pee', # 0xeb
+'pi', # 0xec
+'pa', # 0xed
+'p', # 0xee
+'gu', # 0xef
+'go', # 0xf0
+'ge', # 0xf1
+'gee', # 0xf2
+'gi', # 0xf3
+'ga', # 0xf4
+'khu', # 0xf5
+'kho', # 0xf6
+'khe', # 0xf7
+'khee', # 0xf8
+'khi', # 0xf9
+'kha', # 0xfa
+'kku', # 0xfb
+'kko', # 0xfc
+'kke', # 0xfd
+'kkee', # 0xfe
+'kki', # 0xff
+)