Đã có rất nhiều bài viết trên Internet và những báo cáo khoa học trình bày về vấn đề này. Mỗi tác giả có thể đưa ra một quan điểm khác nhau về định nghĩa của Machine Learning (ML), tùy vào kinh nghiệm của bản thân. Do đó theo mình, một mô hình tổng quát cho ML làm hài lòng mọi quan điểm là không tồn tại và không cần thiết. Tuy nhiên, tại bài viết này mình vẫn sẽ đưa ra một mô hình đơn giản có thể áp dụng cho nhiều vấn đề ML. Bạn đọc chỉ nên xem như đây là một nguồn tham khảo nhỏ giữa rất nhiều nguồn tham khảo khác.

Mục lục
Người học và máy học
Mô hình tổng quát
Nguồn tham khảo
Người học và máy học
Chúng ta học từ khi còn nhỏ, và qua rất nhiều hình thức. Các ví dụ là
- Quá trình phát triển khả năng ngôn ngữ thông qua tiếp xúc, giao tiếp.
- Sau khi nghe thầy giáo môn Toán hướng dẫn về các phương pháp tìm nguyên hàm, bạn có thể tìm được nguyên hàm của
.
- Bạn tra cứu nhiều nguồn thông tin trên mạng và hiểu thêm về nguyên lí bất định Heisenberg.
Như vậy, nhìn chung thì việc học là quá trình phát triển tri thức, nhận thức và kĩ năng thông qua trải nghiệm. Sau khi học thì chúng ta có thể thực hiện được những việc mà trước đó chúng ta chưa làm được.
Một số chi tiết sẽ khác khi ta cố gắng định nghĩa máy học. Ví dụ, những ‘kiến thức’, ‘kĩ năng’ sẽ được biểu diễn bởi những chương trình, hoặc các tham số của một hàm số; hay các ‘trải nghiệm’ được đưa vào máy dưới dạng các cặp vector – scalar. Theo mình, không nên nói rằng ML mô phỏng quá trình học của con người. Mặc dù thực tế, tồn tại những lĩnh vực ML mang ý tưởng từ việc học của con người (ví dụ, learning from demonstration), những gì còn lại của ML vẫn rất đa dạng. Và, về lý thuyết, chúng ta không cố gắng tạo ra những bản sao của chính mình, thay vào đó là những công cụ hỗ trợ chúng ta đạt tới những thành tựu mới.
Khung sơ đồ chung của phương pháp Khoa học bao gồm:
- Quan sát hiện tượng
- Đặt ra giả thuyết
- Làm thí nghiệm
- Phân tích dữ liệu
- Trình bày kết quả tìm được
- Chia sẻ kiến thức
Phần “học” của Machine Learning có thể xem như các bước 2, 3, và 4 trong phương pháp trên. Trong quá trình học, máy càng ngày càng có thể tạo ra những giả thuyết chính xác hơn.
Mô hình tổng quát
Đến một giới hạn nào đó, ta có thể định nghĩa rằng:
Machine Learning được thực hiện khi máy được cung cấp trải nghiệm E và sử dụng thuật toán A để tìm kiếm kết quả trong không gian F. Kết quả này được tìm để tối ưu hóa giá trị hàm đánh giá P, nhằm hoàn thành nhiệm vụ T.
Mình sẽ phân tích định nghĩa trên thông qua ví dụ về Linear Regression.
Đầu tiên, nhiệm vụ T được đặt ra cho máy là “Hãy tìm cho mình một hàm số tuyến tính , sao cho mỗi lần mình đưa vào
nào đó, hàm này có thể xuất ra một giá trị
hợp lí.”
Bạn thắc mắc, và chắc chắn rằng máy sẽ thắc mắc rằng “Như thế nào thì mới gọi là hợp lí?”. E và P có thể đưa ra câu trả lời cho câu hỏi này. E bao gồm các cặp giá trị mẫu , mà ta mong đợi máy sẽ tìm được hàm cho kết quả gần giống như vậy. Mà như thế thì chưa đủ, vì máy vẫn sẽ hỏi “Giống là giống thế nào?”. Ừm thì, “giống” nghĩa là giá trị hàm đánh giá P phải tốt. Chẳng hạn như mình lấy P là hàm đánh giá độ sai lệch mà hàm máy tìm được so với ví dụ E. Vậy thì P có giá trị càng nhỏ, máy sẽ biết là hàm
tìm được càng tốt.
Vậy là máy đã biết rằng ta mong chờ kết quả như thế nào. Thông tin tiếp theo máy cần biết là, phải tìm bằng cách nào, và đi tìm ở đâu. Thuật toán A giống như một bản hướng dẫn cho máy được ta viết sẵn dưới dạng code. Sau khi thực hiện xong bước
, máy sẽ nhìn vào bản hướng dẫn và thấy “Ồ, vậy theo thuật toán, mình sẽ làm bước
thế này”. Nhưng chúng ta rất sợ máy đi lung tung, tìm
ở nơi bậy bạ nào đó thì sẽ rất lâu thấy được. Vậy nên, ta phải vạch ra không gian hàm tuyến tính F, là một khu vực giới hạn, và máy chỉ cần đi tìm hàm
tại khu vực này thôi.
Nói tóm gọn thì Machine Learning là máy tự học, nhờ vào hướng dẫn ban đầu và trải nghiệm.
Nguồn tham khảo
Bài giảng Introduction to AI của anh Ngô Quốc Hưng, MaSSP Computer Science 2018;
Machine learning: Trends, perspectives, and prospects, M.I. Jordan và T.M. Mitchell.
Một số xu hướng ứng dụng ML hiện nay có thể kể đến Xử lí ngôn ngữ tự nhiên (NLP) hay Phân tích hình ảnh. Lấy ví dụ, trong NLP, máy có thể nhận đầu vào là một văn bản tin tức và cho đầu ra là tiêu đề tóm tắt cho đoạn văn bản đó. Trong phân tích hình ảnh, khi cho đầu vào là bức ảnh từ camera của một ô tô tự lái, máy có thể xác định những đối tượng (đèn giao thông, xe đằng trước) nằm trong bức ảnh đó. Bài viết Machine learning: Trends, perspectives, and prospects là một bài viết tổng quan về xu hướng, các góc nhìn và dự đoán tương lai của ML. Bạn đọc có thể tham khảo bài viết để biết nhiều hơn.
LikeLiked by 1 person