Tin tức chung
Trang chủ   >  Tin tức  >   Tin tức chung  >  
Khoa học dữ liệu - Công việc hấp dẫn nhất thế kỷ 21
Khoa học dữ liệu (KHDL) là thuật ngữ có lẽ còn khá lạ lẫm đối với Việt Nam trong thời đại công nghiệp 4.0. Nhưng nó đang dần trở thành xu hướng của các doanh nghiệp hướng tới để đẩy mạnh hoạt động kinh doanh nhờ việc sử dụng những thông tin được phân tích do công nghệ này mang lại. Khi CMCN 4.0 bùng nổ, mọi quốc gia đều phải dựa nhiều hơn vào KHCN, vào dữ liệu. Trong cuộc chạy đua công nghệ số, người thắng cuộc chính là người làm chủ các nguồn dữ liệu lớn. Đây cũng là lĩnh vực đang trở thành tâm điểm thu hút người học. Nhà khoa học dữ liệu nổi lên như một nghề được săn lùng nhiều đến bất ngờ. Ở Việt Nam, ĐHQGHN là một trong những đơn vị tiên phong triển khai đào tạo về KHDL.

Để chiến thắng trong thời đại 4.0

Theo GS.TSKH Hồ Tú Bảo – Viện JAIST, Nhật Bản: "KHDL là khoa học dựa trên sự kết hợp của toán học (tiêu biểu là thống kê) và công nghệ thông tin (tiêu biểu là machine learning)". Nghiên cứu KHDL là quan tâm hàng đầu của chuyên gia công nghệ thông tin.

Con đường phát triển và cách đi của mỗi quốc gia tất nhiên phụ thuộc vào nhiều yếu tố. Đó là thể chế chính trị với các chính sách phát triển, là tình trạng kinh tế, xã hội, văn hoá, giáo dục và đào tạo, khoa học và công nghệ… Tuy nhiên khi CMCN 4 bùng nổ, mọi quốc gia muốn phát triển đều phải dựa nhiều hơn vào khoa học và công nghệ, vào các nguồn dữ liệu thay cho các nguồn tài nguyên thiên nhiên. Đương nhiên các quốc gia đang sản xuất với nhiều công nghệ cao cũng như có nền khoa học phát triển sẽ có nhiều cơ hội hơn.

GS.TSKH Hồ Tú Bảo cho biết: Cốt lõi của CMCN4 là sản xuất thông minh dựa trên các đột phá của công nghệ số. Có thể hiểu công nghệ số gồm hai nội dung chính: số hóa và dùng dữ liệu số hóa. Tiến bộ của khoa học đã cho phép con người dần số hóa được hầu hết mọi thực thể trên đời (hệ gien người, cây lúa, chiếc ô-tô, khách sạn, doanh nghiệp, cơ quan công quyền…), và hầu hết mọi thực thể trong thế giới thực của chúng ta có thể được kết nối với nhau qua các phiên bản số của chúng trong không gian internet (internet vạn vật). Việc kết nối này thực chất là kết nối dữ liệu số hóa của các thực thể và do đó tạo ra một không gian số hoá rất lớn và rất phức tạp, gọi là dữ liệu lớn (big data), hiện đang vượt quá khả năng xử lý của con người. Những điều trên đang dẫn đến sự thay đổi phương thức sản xuất của con người: Hoạt động sản xuất trong thế giới thực được điều hành và quyết định một cách thông minh từ không gian số các kết nối kể trên.

Có thể nói, về bản chất, quốc gia nào thắng cuộc trong CMCN 4 là quốc gia làm chủ được các nguồn dữ liệu lớn và phức tạp này, đưa chúng vào mọi lĩnh vực của sản xuất và cuộc sống, làm cho sản xuất và cuộc sống thông minh và hiệu quả hơn qua các phương pháp của trí tuệ nhân tạo.

Ý thức được điều này, trong vòng vài năm qua các nước phát triển đều xây dựng chương trình chiến lược quốc gia của mình. Nước Mỹ có "Chiến lược quốc gia về sản xuất tiên tiến" cho ba thập kỷ. Nước Đức có "Công nghiệp 4.0". Nước Pháp có "Bộ mặt mới của công nghiệp Pháp". Hàn Quốc có "Chương trình tăng trưởng của Hàn Quốc trong tương lai". Trung Quốc có "Sản xuất tại Trung Quốc năm 2025". Nhật Bản có "Xã hội thông minh" (Smart society). Singapore có "Quốc gia thông minh" (Smart nation)… Cốt lõi của các chương trình đó chính là câu chuyện của số hóa, kết nối và phân tích dữ liệu lớn. Và xuyên suốt ba khía cạnh công nghệ này chính là khoa học dữ liệu (KHDL).

Lĩnh vực sẽ thay đổi tất cả

Nhìn vào một khía cạnh nào đó, ta có thể xem đây như một thể mới của một tập hợp gồm các ngành khác nhau trong sự vận động phát triển không ngừng của khoa học máy tính, mô phỏng, thống kê, phân tích và toán học. Trọng tâm của nó nằm ở việc áp dụng các phương pháp tự động hóa cho việc phân tích một lượng lớn dữ liệu và từ đó rút ra các kiến thức.

Điều này ta có thể quan sát ở hầu khắp nơi từ di truyền học đến vật lý cao năng lượng, khoa học dữ liệu giúp ta tìm ra những nhánh mới của khoa học, tạo ra sự ảnh hưởng sâu rộng đến toàn bộ nền khoa học tự nhiên, công nghệ kỹ thuật , cũng như khoa học xã hội và nhân văn.

Hầu như tất cả các ngành kinh tế hiện nay đều có thể truy cập vào trung tâm dữ liệu. Điều này hơn hẳn những gì bạn có thể tưởng tượng cách đây chỉ mười năm. Các doanh nghiệp hiện nay đang tích lũy những khối thông tin mới với một tốc độ vượt quá năng lực mà họ có thể rút chiết ra được giá trị. Vậy nên câu hỏi chính mà tất các các tổ chức đang đặt ra thu hút được sự quan tâm toàn bộ cộng đồng là làm thế nào để sử dụng được dữ liệu một cách hiệu quả, không chỉ là của riêng họ mà bao gồm cả mọi nguồn có liên quan.

Trong những năm tới, xu hướng này dự kiến sẽ tăng mạnh với sự đang lên của những thiết bị thông minh và thế giới mạng thông tin. Còn với nghiên cứu khoa học, chúng ta sẽ thấy một số lượng lớn các ngành mới được sinh ra đi kèm với từ "tính toán"(computational) hoặc "định lượng" (quantitative) ở phía trước. Trong công nghiệp, khoa học dữ liệu sẽ thay đổi tất cả các lĩnh vực từ y tế đến phương tiện truyền thông.

“Cơn khát” nguồn lực

Khoa học dữ liệu là lĩnh vực việc làm nóng nhất hiện nay và mỗi nhà khoa học dữ liệu là một vị vua. Vị vua này được các công ty trong mọi lĩnh vực có liên quan đến dữ liệu săn lùng, được hưởng biết bao nhiêu sự ưu đãi bên cạnh mức lương cao. Nhưng vị vua này đâu dễ ngồi lâu trên ngai vàng nếu không giỏi về các kỹ năng kỹ thuật, giỏi toán, có kỹ năng kể chuyện, hài hước và có trực giác tốt. Nhà khoa học dữ liệu (Data Scientist) được Harvard Business Review đánh giá là “công việc hấp dẫn nhất thế kỷ 21”. Glassdoor báo cáo rằng mức lương trung bình của một nhà khoa học dữ liệu năm 2014 là 118.709 USD so với 64,537 USD của một lập trình viên. Theo dự báo của học viện toàn cầu McKinsey: vào năm 2018, riêng nước Mỹ có thể đối mặt với tình trạng thiếu hụt từ 140 000 tới 190 000 chuyên gia phân tích dữ liệu, thiếu 1,5 triệu nhà quản lý biết sử dụng các công cụ của Dữ liệu lớn để thực hiện việc ra quyết định hiệu quả hơn. Những người có kỹ năng về khoa học dữ liệu (Data Science) đang được chào đón hơn bao giờ hết.

Tình trạng khan hiếm nhà khoa học dữ liệu phổ biến đến nỗi người ta có cảm giác rằng đi đâu cũng nghe thấy các yêu cầu tuyển dụng nhà khoa học dữ liệu. Daniel Gutierrez, Thư ký tòa soạn của tạp chí inside BIGDATA ở Los Angeles, cho biết có rất nhiều người đang chuyển từ các lĩnh vực việc làm, như kinh tế học, tâm lý học, toán học… sang khoa học dữ liệu bởi vì họ nhìn thấy lĩnh vực này đang bùng nổ và hơn hết là họ có nhiều cơ hội để kiếm được nhiều tiền. Thật ra, ngay cả sau vụ bê bối về sự riêng tư của Facebook Inc. và những vụ tai tiếng lớn khác về dữ liệu, chuyện tìm kiếm các nhà khoa học dữ liệu – những người có thể biến các lượt nhấp chuột trên trang web truyền thông xã hội và hình ảnh do người dùng đăng tải thành các đoạn mã nhị phân biết đẻ ra tiền – vẫn diễn ra và đây là một trong những mối thách thức lớn nhất đối với ngành công nghiệp dữ liệu của Mỹ.

Tỷ lệ doanh nghiệp đăng tuyển ứng viên nhà khoa học dữ liệu qua trang web cung ứng nguồn nhân lực Indeed.com đã tăng 75% trong khoảng thời gian từ tháng 1-2015 đến tháng 1-2018. Trong khi tỷ lệ ứng viên tìm việc làm ở mảng khoa học dữ liệu cũng tăng cao tương ứng lên 65% trong cùng thời điểm. Một hiện tượng mà trang web này gọi là “đặc sản” ở mảng việc làm khoa học dữ liệu là sự gia tăng về số lượt tìm kiếm các ứng viên có khả năng phân tích tâm lý, cảm xúc của một hay nhóm đối tượng khách hàng nào đó (sentiment analysis) – một trong những sự thách thức đối với công nghệ máy học (machine learning). Theo công ty về nhân sự Robert Half Technology, một nhà khoa học dữ liệu thông thường được trả mức lương trung bình ban đầu khoảng 119.000 USD và sau đó tăng lên ở mức 168.000 USD. Những người có chứng chỉ hay tấm bằng có liên quan đến ngành khoa học dữ liệu nằm trong nhóm chuyên gia được tìm kiếm nhiều nhất trong lĩnh vực kinh doanh, với một số tiến sĩ khoa học dữ liệu được hưởng mức lương đến 300.000 USD trở lên.

Jennifer Priestley, Giáo sư ngành khoa học thống kê và khoa học dữ liệu tại Trường Đại học Kennesaw, miêu tả việc ráo riết săn lùng ứng viên dẫn đến tình trạng khan hiếm nhân lực như nói trên bằng cụm từ “run on the bank”, tạm dịch là sự đổ xô tới đòi rút tiền ở ngân hàng ra, nghĩa là tất cả doanh nghiệp đều tranh nhau tài năng trong cùng một lĩnh vực, vào cùng một thời điểm.

Một nghiên cứu của McKinsey dự đoán trong năm 2018, nhu cầu thế giới về các nhà khoa học dữ liệu sẽ vượt 50% so với nguồn cung, trong đó chỉ riêng nước Mỹ cần đến 490.000 người, trong khi đào tạo và nguồn cung thu hút từ các nước khác chỉ được gần 200.000 người. Sự phát triển nhu cầu nhân lực khoa học dữ liệu tạo ra rất nhiều cơ hội cho tất cả mọi người. Đặc biệt là các bạn sinh viên khối ngành công nghệ thông tin. Hiện nay, các công ty đang tìm cách tiếp cận với lực lượng các nhà khoa học dữ liệu trong tương lai thông qua các dự án hợp tác đào tạo với các trường đại học. 

Cơ hội cho Việt Nam

Với lợi thế dân số trẻ, có lượng người sử dụng internet cao (khoảng 54 triệu người chiếm 57% dân số), Việt Nam được xem là thị trường Big Data tiềm năng hàng đầu khu vực châu Á. Tuy nhiên, không phải doanh nghiệp nào cũng có thể thu thập dữ liệu khách hàng. Hầu hết dữ liệu khách hàng tại Việt Nam được thu thập từ các công ty cung cấp dịch vụ nghiên cứu thị trường hoặc do chính công ty tự thu thập (đa phần là các tổ chức tài chính hoặc các công ty hoạt động trong lĩnh vực thương mại điện tử). Ngành khoa học dữ liệu ở Việt Nam cũng tương đối mới so với ở các nước phát triển, cơ sở hạ tầng công nghệ thông tin cũng chưa thực sự tiên tiến nên cần đầu tư nhiều hơn mới có thể lưu trữ và xử lý dung lượng lớn dữ liệu. 

GS Phùng Quốc Định (công tác Đại học Deakin, Australia) dự báo Việt Nam có thể trở thành nơi tiềm năng về phát triển công nghệ cao khoa học dữ liệu. Điều này tạo ra hàng triệu việc làm trong lĩnh vực này nhưng cũng sẽ thay thế công việc của hàng trăm triệu lao động giản đơn.

“Cần phải đẩy mạnh khoa học dữ liệu trong giáo dục. Hầu hết các trường đại học lớn trên thế giới đã có các môn học về khoa học dữ liệu và chắc chắn hầu hết các trường đại học khắp thế giới đều sẽ sớm có môn này. Theo tôi quan sát thì ở Việt Nam nhìn chung lĩnh vực khoa học dữ liệu chưa phát triển đúng mức của nó”, GS Phùng Quốc Định nêu quan điểm.

GS Nguyễn Xuân Long (Đại học Michigan, Mỹ) cho rằng, trong bối cảnh hiện nay, điểm quan trọng mà các tổ chức, doanh nghiệp Việt Nam cần tập trung để có thể khai thác được giá trị của dữ liệu là cần phát triển một “tư duy phân tích dữ liệu”, nuôi dưỡng một “văn hoá dữ liệu”. Điều này là một nhiệm vụ khó khăn. Thách thức và cơ hội đặt ra cho ngành giáo dục.

Các trường đại học không thể đứng ngoài cuộc CMCN lần thứ tư. Những thay đổi nhanh chóng về nhu cầu lao động sẽ gây ra sức ép lớn cho ngành giáo dục.

Hiện nay ở Việt Nam có rất ít các chương trình đào tạo chuyên sâu về Khoa học Dữ liệu. Được biết, ĐH Khoa học Tự nhiên, ĐHQGHN có thế mạnh về cả 3 lĩnh vực Toán ứng dụng, Thống kê và Tin học đã dành thời gian hơn 2 năm qua cho việc xây dựng bài bản, công phu một chương trình đào tạo bậc thạc sĩ về Khoa học Dữ liệu. Năm 2018, trường ĐH Khoa học Tự nhiên đã được ĐHQGHN chính thức phê duyệt giao cho triển khai thí điểm chương trình đào tạo (CTĐT) này. CTĐT Khoa học Dữ liệu bậc thạc sĩ sẽ trang bị đồng thời các kiến thức vững chắc về toán học, thống kê, tin học, giúp học viên phân tích, khai thác hiệu quả nhiều loại dữ liệu khác nhau trong thực tế như trong kinh tế, tài chính, sinh học, biến đổi khí hậu,… Khoá thạc sĩ Khoa học Dữ liệu đầu tiên bắt đầu tuyển sinh từ năm học 2018-2019.

 

 Minh Phúc - Bản tin ĐHQGHN
  In bài viết     Gửi cho bạn bè
  Từ khóa :
Thông tin liên quan
Trang: 1   | 2   | 3   | 4   | 5   | 6   | 7   | 8   | 9   | 10   | 11   | 12   | 13   | 14   | 15   | 16   | 17   | 18   | 19   | 20   | 21   | 22   | 23   | 24   | 25   | 26   | 27   | 28   | 29   | 30   | 31   | 32   | 33   | 34   | 35   | 36   | 37   | 38   | 39   | 40   | 41   | 42   | 43   | 44   | 45   | 46   | 47   | 48   | 49   | 50   | 51   | 52   | 53   | 54   | 55   | 56   | 57   | 58   | 59   | 60   | 61   | 62   | 63   | 64   | 65   | 66   | 67   | 68   | 69   | 70   | 71   | 72   | 73   | 74   | 75   | 76   | 77   | 78   | 79   | 80   | 81   | 82   | 83   | 84   | 85   | 86   | 87   | 88   | 89   | 90   | 91   | 92   | 93   | 94   | 95   | 96   | 97   | 98   | 99   | 100   | 101   | 102   | 103   | 104   | 105   | 106   | 107   | 108   | 109   | 110   | 111   | 112   | 113   | 114   | 115   | 116   | 117   | 118   | 119   | 120   | 121   | 122   | 123   | 124   | 125   | 126   | 127   | 128   | 129   | 130   | 131   | 132   | 133   | 134   | 135   | 136   | 137   | 138   | 139   | 140   | 141   | 142   | 143   | 144   | 145   | 146   | 147   | 148   | 149   | 150   | 151   | 152   | 153   | 154   | 155   | 156   | 157   | 158   | 159   | 160   | 161   | 162   | 163   | 164   | 165   | 166   | 167   | 168   | 169   | 170   | 171   | 172   | 173   | 174   | 175   | 176   | 177   | 178   | 179   | 180   | 181   | 182   | 183   | 184   | 185   | 186   | 187   | 188   | 189   | 190   | 191   | 192   | 193   | 194   | 195   | 196   | 197   | 198   | 199   | 200   | 201   | 202   | 203   | 204   | 205   | 206   | 207   | 208   | 209   | 210   | 211   | 212   | 213   | 214   | 215   | 216   | 217   | 218   | 219   | 220   | 221   | 222   | 223   | 224   | 225   | 226   | 227   | 228   | 229   | 230   | 231   | 232   | 233   | 234   | 235   | 236   | 237   | 238   | 239   | 240   | 241   | 242   | 243   | 244   | 245   | 246   | 247   | 248   | 249   | 250   | 251   | 252   | 253   | 254   | 255   | 256   | 257   | 258   | 259   | 260   | 261   | 262   | 263   | 264   | 265   | 266   | 267   | 268   | 269   | 270   | 271   | 272   | 273   | 274   | 275   | 276   | 277   | 278   | 279   | 280   | 281   | 282   | 283   | 284   | 285   | 286   | 287   | 288   | 289   | 290   | 291   | 292   | 293   | 294   | 295   | 296   | 297   | 298   | 299   | 300   | 301   | 302   | 303   | 304   | 305   | 306   | 307   | 308   | 309   | 310   | 311   | 312   | 313   | 314   | 315   | 316   | 317   | 318   | 319   | 320   | 321   | 322   | 323   | 324   | 325   | 326   | 327   | 328   | 329   | 330   | 331   | 332   | 333   | 334   | 335   | 336   | 337   | 338   | 339   | 340   | 341   | 342   | 343   | 344   | 345   | 346   | 347   | 348   | 349   | 350   | 351   | 352   | 353   | 354   | 355   | 356   | 357   | 358   | 359   | 360   | 361   | 362   | 363   | 364   | 365   | 366   | 367   | 368   | 369   | 370   | 371   | 372   | 373   | 374   | 375   | 376   | 377   | 378   | 379   | 380   | 381   | 382   | 383   | 384   | 385   | 386   | 387   | 388   | 389   | 390   | 391   |