Skip to content

Commit d8fda84

Browse files
committed
add - หลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
1 parent ee0820c commit d8fda84

File tree

5 files changed

+611
-116
lines changed

5 files changed

+611
-116
lines changed

README.md

Lines changed: 1 addition & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -29,6 +29,7 @@ Natural language processing หรือ การประมวลภาษา
2929

3030
- รองรับ Thai Character Clusters (TCC) และ ETCC
3131
- Thai WordNet ตัวใหม่
32+
- เพิ่มหลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
3233

3334
### ความสามารถ
3435
- ตัดคำภาษาไทย

docs/pythainlp-1-4-thai.md

Lines changed: 12 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -83,8 +83,19 @@ engine คือ ชุดเครื่องมือในการ postagge
8383

8484
```python
8585
from pythainlp.romanization import romanization
86-
romanization(str)
86+
romanization(str,engine='pyicu')
8787
```
88+
มี 2 engine ดังนี้
89+
90+
- pyicu ส่งค่า Latin
91+
- royin ใช้หลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
92+
93+
data :
94+
95+
รับค่า ''str'' ข้อความ
96+
97+
คืนค่าเป็น ''str'' ข้อความ
98+
8899
**ตัวอย่าง**
89100

90101
```python

pythainlp/romanization/__init__.py

Lines changed: 14 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,17 @@
11
# -*- coding: utf-8 -*-
22
from __future__ import absolute_import,unicode_literals
3-
import icu
43
# ถอดเสียงภาษาไทยเป็น Latin
5-
def romanization(data):
6-
"""เป็นคำสั่ง ถอดเสียงภาษาไทยเป็น Latin รับค่า ''str'' ข้อความ คืนค่าเป็น ''str'' ข้อความ Latin"""
7-
thai2latin = icu.Transliterator.createInstance('Thai-Latin')
8-
return thai2latin.transliterate(data)
4+
def romanization(data,engine='pyicu'):
5+
"""เป็นคำสั่ง ถอดเสียงภาษาไทยเป็นอังกฤษ
6+
romanization(data,engine='pyicu')
7+
มี 2 engine ดังนี้
8+
- pyicu ส่งค่า Latin
9+
- royin ใช้หลักเกณฑ์การถอดอักษรไทยเป็นอักษรโรมัน ฉบับราชบัณฑิตยสถาน
10+
data :
11+
รับค่า ''str'' ข้อความ
12+
คืนค่าเป็น ''str'' ข้อความ"""
13+
if engine=='royin':
14+
from .royin import romanization
15+
elif engine=='pyicu':
16+
from .pyicu import romanization
17+
return romanization(data)

0 commit comments

Comments
 (0)