Sau đại học
Trang chủ   >  Tin tức  >   Thông báo  >   Sau đại học
Thông tin LATS của NCS Hà Văn Sang
Tên đề tài luận án: Nghiên cứu cải tiến một số kỹ thuật rút gọn đặc trưng cho phân lớp dữ liệu.

1. Họ và tên nghiên cứu sinh: Hà Văn Sang

2. Giới tính: Nam

3. Ngày sinh: 25/12/1982 

4. Nơi sinh: Ninh Bình

5. Quyết định công nhận nghiên cứu sinh số: 3205, ngày 08 tháng 11 năm 2010 của Giám đốc Đại học Quốc gia Hà nội.

6. Các thay đổi trong quá trình đào tạo: Không

7. Tên đề tài luận án: Nghiên cứu cải tiến một số kỹ thuật rút gọn đặc trưng cho phân lớp dữ liệu.

8. Chuyên ngành: Hệ thống Thông tin   9. Mã số: 62.48.05.01

10. Cán bộ hướng dẫn khoa học: PGS. TS. Nguyễn Hà Nam và PGS. TS. Nguyễn Hải Châu

11. Tóm tắt các kết quả mới của luận án:

- Đề xuất phương pháp lựa chọn đặc trưng (FRFE) dựa trên hướng tiếp cận đóng gói dựa trên cơ sở áp dụng chiến lược loại bỏ đặc trưng đệ quy và việc cải tiến hàm đánh giá đặc trưng. Hàm đánh giá đặc trưng đề xuất có đặc điểm là giúp tránh được hiện tượng quá khớp, tăng hiệu quả phân lớp và giúp cho kết quả này được ổn định hơn. Thủ tục loại bỏ đệ quy giúp thuật toán không chỉ quan tâm tới mối liên quan của các đặc trưng mà còn quan tâm tới mối tương quan giữa các đặc trưng với bộ phân lớp. Thuật toán học đề xuất nhằm tự động tìm ra tập con đặc trưng tối ưu cho mỗi bộ dữ liệu. Nhằm giải quyết vấn đề chi phí tính toán lớn, luận án đề xuất sử dụng bộ phân lớp rừng ngẫu nhiên (random forest) với khả năng xử lý song song nhằm làm giảm thời gian thực hiện của phương pháp đề xuất. Tính hiệu quả của phương pháp lựa chọn đặc trưng đề xuất đã được lý giải và kiểm chứng bằng thực nghiệm trên bộ dữ liệu tín dụng.

- Đề xuất kỹ thuật trích xuất đặc trưng có tên C-KPCA (Custom-Kernel PCA) nhằm làm giảm số lượng đặc trưng dựa trên kỹ thuật hàm nhân PCA. Cải tiến chính trong đề xuất của chúng tôi là xây dựng một hàm nhân mới dựa trên việc kết hợp một số hàm nhân cơ bản. Chúng tôi đã tiến hành thực nghiệm trên 04 bộ dữ liệu ung thư và so sánh kết quả khi sử dụng hàm nhân đề xuất với hàm nhân cơ bản cũng như so sánh với một số phương pháp lựa chọn đặc trưng phổ biến khác. Thực nghiệm cho thấy C-KPCA cho kết quả ổn định và tốt hơn so với các phương pháp khác trong nhiều trường hợp

- Luận án đóng góp vào dòng nghiên cứu trên thế giới và trong nước về rút gọn đặc trưng cho bài toán phân lớp dữ liệu thông qua các công bố: 05 bài báo khoa học được phản biện và đánh chỉ mục trong các cơ sở dữ liệu như Scopus, ISI-proceeding, và DBLP.

12. Khả năng ứng dụng trong thực tiễn: Ứng dụng cho các bài toán cho điểm tín dụng và phân tích dữ liệu ung thư.

13. Những hướng nghiên cứu tiếp theo: Nghiên cứu sinh sẽ tiếp tục nghiên cứu các hướng giải quyết các vấn đề còn tồn tại của luận án và tiếp tục cải tiến các đề xuất nhằm hoàn thiện mô hình, giải pháp rút gọn đặc trưng tổng quát cho phân lớp dữ liệu.

14. Các công trình đã công bố có liên quan đến luận án:

Ha Van Sang, Nguyen Ha Nam, Nguyen Duc Nhan. (2016). “A Novel Credit Scoring Prediction Model based on Feature Selection Approach and Parallel Random Forest” Indian Journal of Science and Technology, Vol 9(S20), May 2016.

Van-Sang Ha and Ha-Nam Nguyen (2016). “Credit scoring with a feature selection approach based deep learning”, in MATEC Web of Conferences, vol. 54, p. 05004.

Van-Sang Ha and Ha-Nam Nguyen. (2016). “C-KPCA: Custom Kernel PCA for Cancer Classification”, in Machine Learning and Data Mining in Pattern Recognition: 12th International Conference, MLDM 2016, Springer International Publishing, pp. 459–467

Van-Sang Ha and Ha-Nam Nguyen (2016), “FRFE: Fast Recursive Feature Elimination for Credit Scoring”, in Nature of Computation and Communication: Second International Conference, ICTCC 2016, Springer International Publishing, pp. 133–142.

Ha Van Sang, Nguyen Ha Nam, & Bao, H. N. T. (2017). A hybrid feature selection method for credit scoring. EAI Endorsed Trans. Context-Aware Syst. & Appl., 4(11), e2.

 Hà Thanh - VNU - UET
  In bài viết     Gửi cho bạn bè
  Từ khóa :
Thông tin liên quan
Trang: 1   | 2   | 3   | 4   | 5   | 6   | 7   | 8   | 9   | 10   | 11   | 12   | 13   | 14   | 15   | 16   | 17   | 18   | 19   | 20   | 21   | 22   | 23   | 24   | 25   | 26   | 27   | 28   | 29   | 30   | 31   | 32   | 33   | 34   | 35   | 36   | 37   | 38   | 39   | 40   | 41   | 42   | 43   | 44   | 45   | 46   | 47   | 48   | 49   | 50   | 51   | 52   | 53   | 54   | 55   | 56   | 57   | 58   | 59   | 60   | 61   | 62   | 63   | 64   | 65   | 66   | 67   | 68   | 69   | 70   | 71   | 72   | 73   | 74   | 75   | 76   | 77   | 78   | 79   | 80   | 81   | 82   | 83   | 84   | 85   | 86   | 87   | 88   | 89   | 90   | 91   | 92   | 93   | 94   | 95   | 96   | 97   | 98   | 99   | 100   | 101   | 102   | 103   | 104   | 105   | 106   | 107   | 108   | 109   | 110   | 111   | 112   | 113   | 114   | 115   | 116   | 117   | 118   | 119   | 120   | 121   | 122   | 123   | 124   | 125   | 126   | 127   | 128   | 129   | 130   | 131   | 132   | 133   | 134   | 135   | 136   | 137   | 138   | 139   | 140   | 141   | 142   |