Rủi ro khi bán danh tính cho AI

Theo Hoài Vy | 28/03/2026 20:30 PM | Công nghệ

Những người huấn luyện trí tuệ nhân tạo (AI) trên toàn thế giới đang bán những khoảnh khắc trong cuộc sống của họ, bao gồm cuộc gọi và tin nhắn, cho các công ty AI để kiếm tiền nhanh chóng.

Một buổi sáng năm ngoái, anh Jacobus Louw bắt đầu chuyến đi bộ thường lệ quanh khu phố để cho những con mòng biển ăn. Nhưng lần này, anh quay lại chân của mình và khung cảnh khi đi bộ trên vỉa hè. Video đó mang về cho anh 14 USD (369.000 VND), gấp khoảng 10 lần mức lương tối thiểu ở Nam Phi. Đối với anh Louw, 27 tuổi sống ở thủ đô Cape Town của Nam Phi, số tiền đó đủ mua thực phẩm cho nửa tuần.

Video đó là một phần của nhiệm vụ “Điều hướng đô thị” mà anh Louw tìm thấy trên Kled AI - một ứng dụng trả tiền cho người tải lên dữ liệu của họ để huấn luyện các mô hình AI. Chỉ trong vài tuần, anh Louw đã kiếm được 50 USD (1,3 triệu VND) bằng cách tải lên hình ảnh và video về cuộc sống hằng ngày của mình.

Cách đó hàng nghìn dặm ở thành phố Ranchi của Ấn Độ, anh Sahil Tigga, sinh viên 22 tuổi, thường xuyên kiếm tiền bằng cách cho phép Silencio, một nền tảng thu thập dữ liệu âm thanh để huấn luyện AI, truy cập vào micrô của điện thoại để thu âm tiếng động xung quanh, như bên trong một nhà hàng hoặc tiếng ồn giao thông tại một ngã tư đông đúc. Anh Tigga cũng tải lên các bản ghi âm giọng nói của mình, và kiếm được hơn 100 USD (2,6 triệu VND) mỗi tháng bằng việc này, đủ để trang trải tất cả chi phí ăn uống của mình.

Tại thành phố Chicago của Mỹ, anh Ramelio Hill, thợ hàn 18 tuổi, kiếm được vài trăm đô la bằng cách bán các cuộc trò chuyện điện thoại riêng tư của mình với bạn bè và gia đình cho Neon Mobile - một nền tảng huấn luyện AI. Anh Hill tin rằng, đằng nào các công ty công nghệ cũng đã thu thập quá nhiều dữ liệu cá nhân của anh, nên họ chia sẻ lợi nhuận với mình là hợp lý.

Những người huấn luyện AI tự do này - những người tải lên mọi thứ từ cảnh xung quanh đến ảnh, video và giọng nói của chính họ - đang ở tiền tuyến của một “cơn sốt vàng” toàn cầu mới. Khi nhu cầu dữ liệu vượt xa những gì có thể thu thập được từ Internet mở, một thị trường dữ liệu đã nổi lên để thu hẹp khoảng cách. Từ Cape Town đến Chicago, hàng nghìn người đang cho đi danh tính sinh trắc học và dữ liệu riêng tư của họ để huấn luyện thế hệ AI tiếp theo.

Nhưng nền kinh tế mới cũng có một mặt tối. Đổi lấy vài đô la, những người huấn luyện AI này đang tiếp tay cho một ngành công nghiệp mà cuối cùng có thể khiến kỹ năng của họ trở nên lỗi thời, đồng thời khiến họ dễ bị tổn thương trước công nghệ deepfake và đánh cắp danh tính.

Các mô hình AI, như ChatGPT và Gemini, đang phải đối mặt tình trạng khan hiếm dữ liệu. Các nguồn huấn luyện được sử dụng nhiều nhất, chiếm một phần tư các tập dữ liệu chất lượng cao nhất trên web, hiện đang hạn chế các công ty AI sử dụng dữ liệu của họ để huấn luyện mô hình. Các nhà nghiên cứu ước tính, các công ty AI sẽ cạn kiệt nguồn văn bản chất lượng cao để huấn luyện sớm nhất là năm 2026. Mặc dù một số phòng thí nghiệm đã chuyển sang sử dụng dữ liệu tổng hợp do AI của họ tạo ra để phản hồi, nhưng quy trình luẩn quẩn như vậy có thể dẫn đến việc các mô hình tạo ra những dữ liệu lỗi, dẫn đến sự sụp đổ của chúng.

Những người huấn luyện AI tự do tải lên mạng mọi thứ từ hình ảnh khung cảnh xung quanh đến video và giọng nói của chính họ

Đây là lúc các ứng dụng như Kled AI, Silencio… xuất hiện. Trên thị trường dữ liệu, hàng triệu người đang kiếm tiền từ danh tính của họ để cung cấp dữ liệu và huấn luyện AI. Những người huấn luyện AI, đặc biệt là ở các nước đang phát triển, thường có rất ít lựa chọn khác để kiếm sống. Anh Louw nhận thức rõ về những đánh đổi liên quan quyền riêng tư. Và mặc dù thu nhập không ổn định và không đủ để trang trải toàn bộ chi phí hằng tháng, anh vẫn sẵn lòng chấp nhận những điều kiện này để kiếm tiền.

Những mặt trái của việc huấn luyện AI theo hình thức làm việc tự do ban đầu có thể vô hình. Trên một số nền tảng AI, người cung cấp dữ liệu cấp phép vĩnh viễn, miễn phí bản quyền cho phép các công ty tạo ra tác phẩm phái sinh, nghĩa là một bản ghi âm giọng nói dài 20 phút ngày hôm nay có thể được sử dụng để vận hành một bot dịch vụ khách hàng AI trong vài năm tới, mà người cung cấp không được nhận thêm xu nào. Thêm vào đó, do thiếu minh bạch trên các nền tảng AI, khuôn mặt của người dùng có thể bị đưa vào cơ sở dữ liệu nhận dạng khuôn mặt hoặc bị sử dụng trong quảng cáo mang tính chất trục lợi.

Thành phố Cape Town - thủ đô Nam Phi

Ông Mark Graham, giáo sư về địa lý Internet tại Đại học Oxford (Anh), nhận định, đối với người dân ở các nước đang phát triển, số tiền bán dữ liệu có thể có ý nghĩa ngắn hạn, nhưng cảnh báo rằng “công việc này rất bấp bênh, không có tiềm năng phát triển và thực chất là một ngõ cụt”.

Bà Jennifer King, nhà nghiên cứu về quyền riêng tư dữ liệu tại Viện Trí tuệ Nhân tạo của Đại học Stanford (Mỹ), lo ngại rằng, các thị trường AI không rõ ràng về cách thức và nơi dữ liệu của người dùng sẽ được sử dụng. Bà nói thêm rằng, nếu không đàm phán hoặc không biết quyền lợi của mình, “dữ liệu của người dùng có nguy cơ bị tái sử dụng theo những cách mà họ không thích, không hiểu hoặc không lường trước được, và họ sẽ khó phản kháng nếu điều đó xảy ra”.

Ông Graham nói thêm rằng, các nền tảng AI dựa trên “nhu cầu tạm thời về dữ liệu con người”. Một khi nhu cầu này thay đổi, “người lao động sẽ không còn được bảo vệ, không có kỹ năng chuyển giao và không còn lưới an toàn”. Theo ông, người chiến thắng duy nhất là “các nền tảng nắm bắt được tất cả giá trị bền vững”.

Anh Hill, người cung cấp dữ liệu huấn luyện AI ở Chicago, cảm thấy mâu thuẫn về việc bán các cuộc gọi điện thoại riêng tư của mình cho Neon Mobile. Với khoảng 11 giờ gọi điện, anh kiếm được 200 USD (5,3 triệu VND) nhưng anh cho biết ứng dụng thường xuyên trả tiền muộn. “Neon luôn có vẻ mờ ám với tôi, nhưng tôi vẫn tiếp tục sử dụng nó để kiếm thêm một ít tiền để trả hóa đơn và các chi phí khác”, anh Hill nói.

Giờ đây, anh đang cân nhắc lại công việc này. Vào tháng 9 năm ngoái, chỉ vài tuần sau khi ra mắt, Neon Mobile đã ngừng hoạt động sau khi TechCrunch phát hiện ra một lỗ hổng bảo mật cho phép bất kỳ ai cũng có thể truy cập vào số điện thoại và bản ghi âm cuộc gọi của người dùng. Anh Hill cho biết, Neon Mobile chưa bao giờ thông báo cho anh về điều này, và giờ anh lo lắng giọng nói của mình có thể bị lạm dụng trên Internet.

Theo Hoài Vy

Cùng chuyên mục
XEM