Trí tuệ nhân tạo và Công nghệ máy học: Nghe thì tưởng là một, nhưng thực ra lại khác biệt ở điểm này
Có thể hiểu, AI định nghĩa và thể hiện mong muốn của con người, còn công nghệ máy học – Machine Learning lại là một trong những phương tiện giúp chúng ta đạt được mục tiêu ấy.
Trí tuệ nhân tạo – Artificial Intelligence (AI) và Công nghệ máy học – Machine Learning (ML) là hai xu hướng công nghệ được phát triển mạnh mẽ trong thời gian gần đây. Các hãng công nghệ lớn như Google, Facebook, Amazon, Microsoft... đều đầu tư rất lớn vào lĩnh vực này và đã tạo ra nhiều sản phẩm hữu ích phục vụ con người.
Bạn có thể bắt gặp hai khái niệm về AI hay ML được đề cập trong các bài báo về thiết bị xe tự lái, hệ thống nhà thông minh, các robot thực hiện những công việc thay thế con người, và đôi lúc hai khái niệm này được xem là tương đương. Tuy nhiên thực tế không hẳn như vậy.
Có thể hiểu, AI định nghĩa và thể hiện mong muốn của con người, còn công nghệ máy học – Machine Learning lại là một trong những phương tiện giúp chúng ta đạt được mục tiêu ấy.
Theo định nghĩa của đại học Stanford, ML là ngành khoa học máy tính nhằm xây dựng hệ thống có thể thực hiện các hành vi giống con người mà không cần lập trình rõ ràng cho từng hành vi cụ thể này. Ta cần AI để tạo ra các thiết bị thông minh, nhưng để chúng thật sự thông minh và ứng xử như con người, ta cần phải có ML.
Google đã dùng hệ thống máy chủ với 16.000 CPU, xử lý hơn 10 triệu video trên Youtube để có thể nhận dạng được hình ảnh con mèo với độ chính xác 74.8%
Những ứng dụng của ML trong một thập kỷ qua là rất nhiều, như xe tự lái, nhận diện và hiểu được tiếng nói, cải thiện hiệu quả của ngữ cảnh tìm kiếm, hay ứng dụng trong việc tìm hiểu bộ gen con người.
Vậy công nghệ máy học hoạt động như thế nào?
Lấy một ví dụ đơn giản, khi bạn tìm kiếm trên Google, trang web sẽ trả lời kết quả tìm kiếm đồng thời có thêm một dòng gợi ý: "Ý bạn có phải là...?" Đó là kết quả của một trong những giải thuật máy học của Google.
Giả sử bạn tìm trên Google từ khóa "trí tuệ nhân tạo", nhưng lại gõ nhầm là "trí tuệ nhân tai", sau khi có kết quả thì bạn mới nhận ra mình đã gõ sai và quay lại trang tìm kiếm để nhập từ khóa đúng là "trí tuệ nhân tạo".
Google sẽ học và ghi nhớ quá trình "lỗi – thử lại" này, và khi có người gặp lỗi tương tự, nó sẽ đưa ra từ khóa gợi ý đúng cần tìm, hoặc thậm chí sửa sai và tìm kiếm luôn cho từ khóa đúng ấy.
Có thể bạn không để ý, hoặc cho rằng việc trình duyệt tự sửa sai lỗi chính tả là điều hiển nhiên. Thật ra, đằng sau đấy là cả một hệ thống máy học của Google, nó đã tự học được hành vi của người dùng và giúp họ sửa sai.
Trường hợp trên chỉ là một ví dụ đơn giản. Trên thực tế, các lập trình viên cần phải sử dụng rất nhiều các giải thuật phức tạp của ML nhằm hướng đến những khả năng mà trước đây được xem là ngoài khả năng của khoa học máy tính.
Bằng cách học hỏi qua kinh nghiệm, các chương trình máy tính sẽ có khả năng tìm hiểu được cơ chế hoạt động của bộ gen người, hiểu được những hành vi khách hàng mà bạn sẽ khó có thể tưởng tượng được. Như công nghệ nhận diện hình ảnh như con người (Facebook), tính năng phiên dịch tự động theo thời gian thực (Skype),…
Như vậy, bạn đã có thể phần nào hiểu được sự khác biệt cơ bản giữa trí tuệ nhân tạo – AI và công nghệ máy học – ML.
Để hiểu rõ hơn, hãy cùng gặp bà Nidhi Chappell, Giám đốc dự án máy học của Intel:
"Trí tuệ nhân tạo, là định nghĩa làm thế nào để máy móc thông minh như con người. Còn công nghệ máy học là việc phát triển các giải thuật máy tính để giải quyết các bài toán đấy. Theo cách hiểu của tôi, AI là một ngành khoa học và ML là các thuật toán giúp máy móc thật sự có được các hành động thông minh. Nói cách khác, ML sự hiện thực hóa của AI".
Giải thích của Chappell còn chỉ ra rằng, ML là mảng phát triển mạnh mẽ nhất của AI, do đó trên báo chí gần đây ta thường thấy những sản phẩm, các bình luận về lĩnh vực máy học.
Cho dù hiện tại ML chỉ chiếm tỷ trọng rất nhỏ trong toàn bộ hoạt động tính toán các hệ thống máy tính, nhưng nó lại là lĩnh vực phát triển nhanh nhất, và các kỹ sư đều đang dồn nguồn lực của họ vào lĩnh vực này.
Facebook cũng đã triển khai rất nhiều dự án về AI và ML dựa trên dữ liệu người dùng tải lên trang cá nhân của họ. Giám đốc nghiên cứu về trí tuệ nhân tạo của Facebook, Yann LeCun giải thích:
"AI đều đã được sử dụng hằng ngày, ngay trên điện thoại của bạn, ngôi nhà của bạn, tài khoản ngân hàng, hay trên ô tô.
Đôi khi bạn biết được mình đang tương tác với một hệ thống AI, ví dụ như bạn hỏi trợ lý ảo Siri chỉ đường đến trạm xăng gần nhất, hoặc Facebook đề xuất bạn gắn nhãn một người bạn khi tải ảnh chụp lên trang Facebook nhờ vào khả năng nhận diện khuôn mặt".
Ông dự đoán:
"AI đang có những đóng góp rất quan trọng đối với cuộc sống con người, chẳng hạn như phát triển xe tự lái, phân tích hình ảnh y khoa, hỗ trợ chẩn đoán bệnh, cấp thuốc cho người bệnh. Đây sẽ là nền móng cho rất nhiều ứng dụng và dịch vụ tương lai. Nói thêm, AI không phải là điều kỳ diệu, nó chỉ là toán học, nhưng là môn toán học rất phức tạp".
Các hệ thống AI hiện đại đều sử dụng kỹ thuật mạng nơron nhân tạo, sử dụng ngôn ngữ lập trình để mô phỏng một mạng lưới rất lớn với nhiều phần tử nhỏ được kết nối với nhau, tương tự như mạng nơron của bộ não người
Quá trình học tập của mạng nơron này thông qua việc điều chỉnh các kết nối giữa các phần tử để có thể hiểu được mục tiêu cần học: nhận dạng hình ảnh, biên dịch các ngôn ngữ, giải quyết các vấn đề logic, hay thậm chí là hình thành các ý tưởng.
Khác với con người là có khả năng "khái quát hoá" từ một số hướng dẫn đơn giản, máy tính cần phải học qua rất rất nhiều mẫu giá trị đầu vào, với số lượng hàng Tera byte để có thể nhận biết được một đối tượng.
Theo Yann Le Cun, có 3 mô hình máy học được sử dụng phổ biến hiện nay:
Mô hình "học tăng cường": Reinforcement learning
Đặc điểm của giải thuật này là các chương trình phần mềm (software agents) sẽ cố gắng thực hiện các hành động và nhận được các phần thưởng tích cực (reward), với mục tiêu nhằm cực đại hóa phần thưởng. Giải thuật này không yêu cầu câu trả lời mẫu, ngược lại máy tính sẽ cần thực hiện rất nhiều phép thử và dựa vào kết quả phản hồi để điều chỉnh từng hành động và huấn luyện cho chính hệ thống của mình.
Mô hình "học có hướng dẫn": Supervised learning
Ta đưa cho máy tính hàng loạt các ví dụ đầu vào/câu trả lời mẫu, nó sẽ dùng giải thuật để tìm ra các đặc điểm cần thiết và đưa ra hình mẫu cho câu trả lời đúng với các ví dụ tương tự. Đây là giải thuật phổ biến nhất được áp dụng trong ngành Máy học.
Một trong những bài toán sử dụng giải thuật này được Google thử nghiệm là cho máy tính xem hàng trăm ngàn video trên youtube để xây dựng nên hình ảnh nhận dạng của con mèo. Perceptron là giải thuật "học có hướng dẫn" thông dụng nhất hiện nay.
Mô hình "học không có giám sát", hay còn gọi là "học bằng cách suy đoán": Unsupervised learning / predictive learning
Con người, ngay từ khi sinh ra đã có khả năng này. Bằng cách quan sát bố mẹ của mình, quan sát thế giới xung quanh, bạn sẽ tự định hình cho mình những khái niệm căn bản, mà không có ai chỉ bảo cho bạn cả, ví dụ: đồ vật luôn ở dạng ba chiều, một vật không thể tự nhiên hiện ra được – đó là phi logic...
Tuy nhiên đây là giới hạn hiện tại của khoa học trí tuệ nhân tạo. Các nhà nghiên cứu chưa thể xây dựng được một hệ thống hay mô hình có thể học tập được những khái niệm này, hay thậm chí chưa thể hiểu được con người tự hình thành những khái niệm ấy như thế nào.
Nếu bạn quan tâm đến lĩnh vực này, có thể đăng ký tham gia khóa học về Machine learning của đại học Stanford, hoặc tham khảo các tài liệu sau:
- A Course in Machine Learning
- The Elements of Statistical Learning
- Bayesian Reasoning and Machine Learning
- Gaussian Processes for Machine Learning