TIN TỨC & SỰ KIỆN
Tin tức   Thông báo   Sau đại học 00:18:47 Ngày 13/07/2020 GMT+7
Thông tin LATS của NCS Nguyễn Thị Lương
Tên đề tài luận án: Nghiên cứu nâng cao hiệu quả phân tích cú pháp tiếng Việt theo tiếp cận học máy thống kê

1. Họ và tên nghiên cứu sinh: Nguyễn Thị Lương                         2.Giới tính: Nữ

3. Ngày sinh:     10/10/1983                                                           4. Nơi sinh: Hà Tĩnh

5. Quyết định công nhận nghiên cứu sinh: Quyết định số 633/QĐ-SĐH ngày 14/03/2013 của Hiệu trưởng Trường Đại học Khoa học Tự nhiên, Đại học Quốc gia Hà Nội.

6. Các thay đổi trong quá trình đào tạo: Quyết định 636/QĐ-ĐHKHTN ngày 14/03/2014 về việc điều chỉnh cán bộ hướng dẫn khoa học luận án tiến sĩ; Quyết định 852/QĐ-ĐHKHTN ngày 12/04/2016 về việc tiếp tục học của học viên sau đại học; Quyết định gia hạn đào tạo và bảo vệ luận án tiến sĩ số 2786/QĐ-ĐHKHTN ngày 28/7/2016 và số 1034/QĐ-ĐHKHTN ngày25/4/2017; Quyết định trả NCS về địa phương số 4747/QĐ-ĐHKHTN ngày 28/12/2018.

8. Chuyên ngành: Cơ sở toán cho tin học                      

9. Mã số: 9460117.02

10. Cán bộ hướng dẫn khoa học:           Hướng dẫn chính:         TS. Lê Hồng Phương   

                                                                Hướng dẫn phụ:            PGS. TS. Đỗ Trung Tuấn

11. Tóm tắt các kết quả mới của luận án:

Với việc thực hiện đề tài nghiên cứu này chúng tôi đã thu được một số kết quả sau:

Về mặt dữ liệu:  xây dựng được bộ nhãn quan hệ phụ thuộc và vai nghĩa cho tiếng Việt. Kết quả hơn 10,000 câu tiếng Việt được gán nhãn phụ thuộc tự động, trong đó 3.000 câu được gán nhãn lại bằng tay đưa lên kho ngữ liệu phụ thuộc toàn cầu https://universaldependencies.org/,  và hơn 5.000 câu được gán nhãn vai nghĩa.

Về phương pháp: đánh giá thử nghiệm phương pháp phân tích cú pháp thành phần tự chú ý (self-attention) trên tiếng Việt. Đề xuất sử dụng đặc trưng biểu diễn phân bố từ cho phân tích cú pháp phụ thuộc dựa trên đồ thị và dựa trên bước chuyển, sử dụng hệ thống phân tích cú pháp phụ thuộc MSTParser và MaltParser. Đồng thời phân tích kết quả thử nghiệm trên công cụ Bist-parser áp dụng cho phân tích cú pháp phụ thuộc tiếng Việt. Đề xuất thuật toán rút trích thành phần và một số ràng buộc riêng cho tiếng Việt nhằm nâng cao hiệu quả gán nhãn vai nghĩa. Dựa trên phương pháp quy hoạch tuyến tính nguyên để phát triển công cụ gán nhãn vai nghĩa cho tiếng Việt.

12. Khả năng ứng dụng thực tiễn:

Luận án cung cấp kho ngữ liệu gán nhãn cú pháp phụ thuộc và vai nghĩa cho cộng đồng nghiên cứu xử lý tiếng Việt. Luận án cũng cung cấp một số nghiên cứu chuyên sâu về phân tích cú pháp và gán nhãn vai nghĩa cho tiếng Việt, làm nền tảng thiết yếu để tiếp tục phát triển các ứng dụng xử lí ngôn ngữ tiếng Việt như dịch máy, hệ thống trả lời tự động và nhiều ứng dụng khác.

13. Các hướng nghiên cứu tiếp theo:

Phát triển kho ngữ liệu gán nhãn cú pháp thành phần, nhãn cú pháp phụ thuộc và nhãn vai nghĩa cho tiếng Việt.

Xây dựng một số ứng dụng như hệ thống dịch máy, trả lời tự động, ... dựa trên kết quả đã có.

14. Các công trình công bố liên quan đến luận án:

Nguyễn Thị Lương, Hà Mỹ Linh, Nguyễn Việt Hùng, Nguyễn Thị Minh Huyền, Lê Hồng Phương, “Xây dựng kho ngữ liệu gán nhãn cú pháp phụ thuộc tiếng Việt”, IEEE RIVF lần thứ X, hội thảo quốc tế về công nghệ thông tin và truyền thông, Hà Nội, IEEE,  trang 147–151, 11/2013.

Hà Mỹ Linh, Nguyễn Thị Lương, Nguyễn Việt Hùng, Nguyễn Thị Minh Huyền, Lê Hồng Phương, Phan Thị Huê, “Xây dựng kho ngữ liệu mẫu có gán nhãn vai nghĩa cho tiếng Việt”, Hội thảo quốc gia lần thứ XVII: Một số vấn đề chọn lọc của Công nghệ thông tin và truyền thông-Đắk Lắk, trang 409-414, 30-31/10/2014.

Lê Hồng Phương, Nguyễn Thị Minh Huyền, Nguyễn Thị Lương, Hà Mỹ Linh, “Phân tích cú pháp phụ thuộc nhanh sử dụng biểu diễn phân bố từ”, Kỷ yếu hội thảo PAKDD 2015, Thành Phố HCM, Việt Nam, Springer 2015.

Nguyễn Thị Lương, Hà Mỹ Linh, Nguyễn Thị Minh Huyền, Lê Hồng Phương, “Sử dụng biểu diễn phân bố từ trong phân tích cú pháp phụ thuộc dựa trên đồ thị cho tiếng Việt”, Hội thảo nghiên cứu cơ bản và ứng dụng công nghệ thông tin lần thứ IX (FAIR’9), Cần Thơ, Việt Nam, Trang 804–810, 08/2016.

Lê Hồng Phương, Phạm Thái Hoàng, Phạm Xuân Khoái, Nguyễn Thị Minh Huyền, Nguyễn Thị Lương, Nguyễn Minh Hiệp, “Gán nhãn vai nghĩa tiếng Việt”,  tạp chí khoa học đại học quốc gia: khoa học máy tính và công nghệ truyền thông, tập 33, số 2, Trang 1-21, 2017.

Nguyễn Thị Lương, Hà Mỹ Linh, Nguyễn Thị Minh Huyền, Lê Hồng Phương, “Sử dụng BiLSTM trong phân tích cú pháp phụ thuộc tiếng Việt”, tạp chí Computacion y Sistemas, tập 22, số 3, Trang. 853-862, 2018.

Nguyễn Thị Lương, Nguyễn Minh Hiệp, Đinh Viết Tuấn và Lê Hồng Phương, "Sử dụng phân bố từ trong phân tích cú pháp thành phần tiếng Việt",Kỷ yếu hội thảo khoa học công nghệ thông tin và truyền thông, Nhà xuất bản Khoa học và Kỹ thuật ISBN:978-604-67-1191-9, Trang 84-90, Nha Trang, 12/2018.

Nguyễn Thị Lương, Lê Hồng Phương, “Một thử nghiệm trên phân tích cú pháp thành phần tiếng Việt”, Hội nghị quốc tế PACLING lần thứ XVI, Hà Nội, Việt Nam, 10/2019.

                                                                                   

 VNU - HUS
   In bài viết     Gửi cho bạn bè
  Từ khóa :
   Xem tin bài theo thời gian :
TRÊN WEBSITE KHÁC
THĂM DÒ DƯ LUẬN
Bạn sẽ thi vào trường đại học nào?
  • Khoa Quản trị Kinh doanh
  • Trường Đại học Khoa học Tự nhiên
  • Trường Đại học Khoa học Xã hội và Nhân văn
  • Trường Đại học Ngoại ngữ
  • Trường Đại học Công nghệ
  • Trường Đại học Kinh tế
  • Trường Đại học Giáo dục
  • Khoa Luật
  • Khoa Quốc tế
  • Khoa Y Dược