Chuyện chưa kể trong hành trình mang công nghệ nhận diện khuôn mặt đầu tiên của Việt Nam chinh phục ‘chuẩn Mỹ’
Từ những người hoàn toàn không có kinh nghiệm “thi cử”, anh Lê Thành Công (Phó TGĐ Viettel Solutions) và đồng đội đã trở thành những người Việt đầu tiên vượt qua bài kiểm tra khó nhất trong các bài đo lường nhận diện khuôn mặt của Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST).
- Công nghệ nhận diện khuôn mặt "đạt tiêu chuẩn Mỹ" được Viettel Solutions cho ra đời trong hoàn cảnh nào và nhằm mục tiêu gì?
Anh Lê Thành Công, Phó Tổng Giám đốc Tổng Công ty Giải pháp Doanh nghiệp Viettel (Viettel Solutions): Khi chúng tôi nghiên cứu về nhận diện khuôn mặt, trên thế giới và ngay chính tại Việt Nam cũng có những công ty làm rồi. Bắt tay vào làm, chúng tôi đặt câu hỏi rằng ai cũng tuyên bố họ có công nghệ nhận diện khuôn mặt rất tốt, xuất sắc nhưng chẳng có gì chứng nhận. Từ thắc mắc đó, chúng tôi tìm tới các công ty hàng đầu đề xem công nghệ của họ được chứng thực bằng cái gì.
Quá trình xem xét ấy, chúng tôi nhận thấy Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) có những bài test để xác thực những tiêu chuẩn đó và được cả thế giới công nhận. Từ đó, chúng tôi quyết tâm đạt được chứng thực của NIST và tham gia với mong muốn sản phẩm của mình có thể cạnh tranh với các sản phẩm trong nước và trên thế giới.
Ngoài ra, thế giới bây giờ tương đối mở, nhất là trong lĩnh vực công nghệ. Các công ty Việt Nam có thể mang công nghệ thế giới về cho mình và họ cũng có thể mang công nghệ của mình ra với thế giới. Càng như vậy càng cần một tiêu chuẩn để xác thực giá trị của sản phẩm.
- Việc vượt qua bài kiểm tra khó nhất trong các bài đo lường nhận diện gương mặt của Viện Tiêu chuẩn và Công nghệ Quốc gia Mỹ (NIST) có ý nghĩa như thế nào với một giải pháp Make in Vietnam?
Việc vượt qua bài kiểm tra khó nhất này góp phần khẳng định rằng các sản phẩm Việt Nam chúng ta có thể tương đương với giải pháp mà các doanh nghiệp hàng đầu thế giới cung cấp. Đó là động lực, không chỉ cho riêng chúng tôi, mà cho nhiều kỹ sư Việt Nam khác trong việc khẳng định vị thế công nghệ của mình.
Thứ 2, nó khẳng định khả năng nghiên cứu, khả năng làm chủ công nghệ của Viettel Solutions - một trong những tổng công ty đại diện cho Tập đoàn Viettel thực hiện sứ mệnh tiên phong, chủ lực kiến tạo số. Vượt qua bài test chính là sự chứng thực cho năng lực công nghệ, năng lực nghiên cứu của chúng tôi.
Nhận diện khuôn mặt cũng chỉ là một trong các lĩnh vực nghiên cứu của chúng tôi nhưng kết quả này tạo ra sự tự tin cho toàn Tổng công ty. Các team khác trong lĩnh vực khác cũng có động lực, tự tin để vươn lên và đạt được những thành tựu tương tự.
- Trong quá trình mang sản phẩm đi dự thi, các kỹ sư của Viettel Solutions đã đặt kỳ vọng gì vào kết quả?
Thời điểm quyết định tham gia dự thi, không ai nói mạnh được bất kể điều gì, ngay cả các bạn trong team. Mục tiêu ban đầu của chúng tôi chỉ là vượt qua được bài test. Sau đó, với mong muốn của ban lãnh đạo, chúng tôi xác định đã tham gia test thì sản phẩm của mình phải tương đương với công ty hàng đầu thế giới.
Dẫu quyết tâm lớn nhưng không thể phủ nhận thực tế rằng tất cả các bạn trong nhóm chưa bao giờ tiếp xúc với một bài test ở cấp độ này. Tham gia lần đầu mà nghe tới tiêu chuẩn Mỹ thì thực sự nhiều bạn cũng cảm thấy hoang mang. Sau đó, chúng tôi lại nghe câu chuyện của những doanh nghiệp khác từng nộp hồ sơ để test. Có doanh nghiệp vượt qua, có doanh nghiệp bị loại.
Điều quan trọng nhất là chúng tôi đã giúp mọi người cùng tự tin chinh phục thách thức chưa từng có này.
- Hiện tại, Viettel Solutions là doanh nghiệp đầu tiên vượt qua các tiêu chí khắt khe của NIST, trở thành Nhà cung cấp nhận diện khuôn mặt FRVT 1:N duy nhất tại Việt Nam. Là người trong cuộc, anh cảm thấy ra sao về thành tựu này?
Cá nhân tôi rất tự hào, hạnh phúc và vui mừng với thành công của team. Đây là thành công cho bài toán 1:N, liên quan tới định danh. Bài đầu tiên của NIST là bài toán 1:1, đơn giản chỉ dành cho việc xác thực, chẳng hạn như eKYC (electronic Know Your Customer - định danh khách hàng điện tử).
Để mọi người có thể hiểu rõ hơn, tôi xin giải thích định danh là gì? Công nghệ này nhằm tìm ra 1 người trong 1 không gian lớn, chẳng hạn như ở biên giới, sân bay… Không chỉ tìm ra một người mà ngay lập tức, có thể định danh được người đó là ai. Nó khó hơn nhiều so với bài toán 1:1.
- Anh nhận thấy nhóm phát triển đã gặp phải những khó khăn điển hình như thế nào? Cá nhân anh nhận thấy nhóm đã rút ra bài học gì từ sự tham gia này?
Cả 1:1 lẫn 1:N thì chúng tôi đều gặp những khó khăn vì nó liên quan tới khả năng nghiên cứu công nghệ và tính cân bằng tiêu chuẩn bài thi. Qua bài thi, chúng tôi học được rất nhiều thứ.
Chẳng hạn như nếu mình có thuật toán rất tốt nhưng thời gian xử lý lâu cũng không thành công. Nó chỉ phản ảnh những điều hiển nhiên trong cuộc sống thôi. Ví dụ như một bài toán truy tìm tội phạm. Nếu thuật toán phát hiện có độ chính xác cao nhưng thời gian lâu thì khi chúng ta định danh được tội phạm thì người đó đã không còn ở vị trí đó nữa.
Trong quá trình nghiên cứu, có những bạn làm chủ thuật toán tốt nhưng thời gian xử lý lâu, tốn tài nguyên thì đưa vào bài test của NIST cũng sẽ không được đánh giá cao. Chính vì thế, chúng tôi phải thay đổi nhiều thứ.
Ban đầu chúng tôi dùng ngôn ngữ Python, chuyên về khoa học dữ liệu. Sau đó, chúng không đạt được hiệu năng của NIST nên buộc phải chuyển sang ngôn ngữ C, gần với ngôn ngữ máy hơn. Đó là những chuyển đổi căn bản nhất.
Bên cạnh đó, nhóm phát triển cũng phải vượt qua các rào cản về múi giờ, tương tác hay áp lực "đã bắt đầu thì phải đi nhanh" vốn không còn lạ lẫm ở Viettel. NIST cũng chỉ đánh giá 1 tháng 1 lần nên cần tính toán để làm sao hoàn thiện trong đúng chu kỳ đánh giá của họ.
Giải pháp được hoàn thiện chỉ trong 3 tháng. Thực tế, công nghệ này chúng tôi đã nghiên cứu lâu rồi nhưng 3 tháng đó là để nhóm phát triển đảm bảo hiệu năng, tốn ít tài nguyên và phù hợp với những tiêu chí mà NIST đưa ra trong bài đánh giá.
- Nằm trong Top 5% giải pháp xuất sắc nhất với hạng mục Visa Kiosk, công nghệ này đủ khả năng giải các bài toán như tìm người lạc, giám sát và hỗ trợ hải quan ở sân bay, cảng biển, kiểm soát vào ra…. Ở Việt Nam, chúng ta đã có thể khai thác được những tính năng này hay chưa?
Tệp Visa Kiosk là tệp có 1,6 triệu ảnh, lấy ảnh của các dân tộc khác nhau, đa sắc tộc. Nó có thể rất phù hợp cho Việt Nam với các bài toán như kiểm soát sân bay, biên giới, các bài toán du lịch…. Thông qua đó, chúng ta có thể tìm kiếm phát hiện ra đối tượng nằm trong danh sách truy nã, danh sách đen. Trong du lịch, nhóm người có hành vi xấu ở khu vực này có thể được cảnh báo cho khu vực khác.
Hiện tại, ứng dụng này đang được áp dụng ở Viettel cho Trung tâm điều hành thông minh. Nó cũng có thể phục vụ bài toán truy xuất tội phạm, nhận dạng, phát hiện tội phạm. Sắp tới, chúng tôi sẽ triển khai các dự án liên quan tới bảo vệ biên giới, kiểm soát xuất nhập cảnh.
Như đã nói, công nghệ này không phải là mới nhất ở Việt Nam. Tuy nhiên, chúng tôi đã được chứng nhận về độ chính xác thông qua các tiêu chuẩn của Mỹ, đảm bảo rằng sản phẩm của Viettel tốt về chất lượng; khẳng định sản phẩm của chúng tôi khác với những sản phẩm khác đang có trên thị trường.
Ngoài ra, Viettel Solutions hướng tới việc xây dựng các sản phẩm được chứng thực, từ đó hướng tới việc xây dựng các sản phẩm xứng tầm, không chỉ cạnh tranh trong nước mà còn cạnh tranh với các sản phẩm hàng đầu thế giới.
- Với thành công này, giải pháp về nhận diện khuôn mặt của Viettel Solutions có thể được định vị ra sao trên bản đồ thế giới?
Thực tế, công nghệ chỉ là 1 phần của sản phẩm. Công nghệ giúp xây dựng được sản phẩm tốt. Nếu muốn sản phẩm đi tới đích cuối, phải có đầy đủ các hệ thống kèm theo chẳng hạn như có đầy đủ camera tại các điểm nóng để phát hiện dấu vết đối tượng, dữ liệu lớn để nhận diện đối tượng…. Đó là chìa khóa để giải pháp trở nên toàn diện và đưa được vào đời sống.
Với công nghệ hiện hữu và kết quả đánh giá bởi NIST, chúng tôi định vị mình nằm trong top 30 nhà cung cấp hàng đầu, đủ năng lực cạnh tranh với giải pháp từ các nhà cung cấp lớn trên thế giới. Chúng tôi đủ tự tin để bước ra thế giới chứ không chỉ còn "nói suông" nữa.
- Ngoài các ứng dụng về an ninh, Viettel Solutions sẽ đưa giải pháp này phục vụ đời sống hàng ngày như thế nào?
Chúng tôi có thể triển khai hệ thống này ở lối ra vào công sở, tòa nhà, đơn vị để phát hiện người mới. Ngoài ra, nó cũng giúp nhận diện khách quen, để khách hàng cảm thấy mình được chào đón hơn. Qua đó, lực lượng an ninh cũng đỡ vất vả hơn khi họ biết khách đã từng tới một cách an toàn.
Ngoài ra, công nghệ cũng giúp nâng cao năng lực cạnh tranh của một giải pháp Make in Vietnam. Nó phù hợp với mục tiêu của Viettel Solutions và Viettel nhằm tiến tới làm chủ công nghệ. Nếu không làm chủ được, một ngày nào đó có thể rơi vào tình trạng bong bóng.
Ví dụ, có nhiều doanh nghiệp Việt, phát triển trên các nền tảng của nước ngoài như Google, đã chịu ảnh hưởng nặng nề khi đối tác này thay đổi chính sách. Hiện tại, trao đổi công nghệ đang diễn ra khá đơn giản và mở nhưng về tương lai, sẽ không biết như thế nào.