Sợ kế toán sai một li "đi... tù một dặm", lập trình viên tự code ứng dụng AI đọc hóa đơn thay mình

Theo Thế Duyệt | 24/03/2026 19:15 PM | Công nghệ

Dự án mã nguồn mở cho phép chụp ảnh hóa đơn rồi để LLM trích xuất dữ liệu, phân loại chi phí, quy đổi hơn 170 loại tiền tệ - toàn bộ chạy trên máy chủ cá nhân.

"Kế toán - nghề dễ đi tù nhất" là câu đùa đã trở thành meme kinh điển trên mạng xã hội Việt Nam, đặc biệt phổ biến trên TikTok và các hội nhóm tài chính. Câu nói phản ánh nỗi ám ảnh có thật: sai sót trong sổ sách, khai man chứng từ hay ghi nhận không đúng quy định đều có thể dẫn đến hậu quả pháp lý nghiêm trọng theo luật kế toán Việt Nam. Với freelancer và doanh nghiệp nhỏ - những người thường tự làm sổ sách mà không có chuyên viên kế toán riêng - rủi ro sai sót càng cao hơn khi phải xử lý hàng trăm hóa đơn mỗi năm bằng tay.

Vasily Zubarev, lập trình viên gốc Siberia hiện sống tại Berlin (Đức), cũng rơi vào tình huống tương tự. Là freelancer, mỗi năm đến mùa thuế anh phải ngồi cả tuần phân loại đống hóa đơn tích lũy từ đầu năm. Zubarev cho biết đã thử nhiều phần mềm kế toán qua nhiều năm nhưng hầu hết không phù hợp với workflow cá nhân, hoặc tính phí hàng tháng quá cao. Giải pháp của anh: tự viết một ứng dụng dùng mô hình ngôn ngữ lớn (LLM) để đọc và phân loại hóa đơn tự động, rồi phát hành mã nguồn mở dưới giấy phép MIT cho bất kỳ ai muốn dùng.

Ứng dụng này có tên TaxHacker, hoạt động theo quy trình khá đơn giản: người dùng upload ảnh hóa đơn, receipt hoặc file PDF, sau đó hệ thống gửi tài liệu qua LLM đa phương thức (hỗ trợ OpenAI, Google Gemini hoặc Mistral) để nhận diện nội dung, trích xuất ngày tháng, số tiền, tên nhà cung cấp, danh sách sản phẩm, thuế, rồi tự động phân loại và lưu vào database dạng bảng tính. Ứng dụng xử lý được nhiều loại tài liệu: hóa đơn cửa hàng, bill nhà hàng, sao kê ngân hàng, thậm chí hóa đơn viết tay bằng bất kỳ ngôn ngữ nào. Có thể tách từng item trong một invoice thành các transaction riêng biệt.

Tuy vậy, khả năng OCR bằng AI không phải điều mới lạ. Điểm đáng chú ý hơn của dự án nằm ở triết lý thiết kế: toàn bộ prompt AI đều mở và cho phép chỉnh sửa. Người dùng tạo được custom fields không giới hạn, mỗi field đi kèm một prompt riêng để AI biết cần trích xuất thông tin gì. System prompt chung cũng sửa được ngay trong settings. Zubarev giải thích lý do: các phần mềm kế toán anh từng dùng đều ép người dùng vào khuôn mẫu cố định, với những trường dữ liệu bắt buộc không liên quan - một app thậm chí yêu cầu nhập email và "State" cho mỗi giao dịch đơn lẻ.

Về hỗ trợ tiền tệ, ứng dụng tự nhận diện loại tiền trong tài liệu và quy đổi theo tỷ giá lịch sử tại ngày giao dịch thực tế, hỗ trợ hơn 170 loại tiền tệ thế giới và 14 loại tiền mã hóa phổ biến gồm BTC, ETH, LTC, DOT. Tính năng này phục vụ nhóm freelancer nhận thanh toán từ nhiều quốc gia hoặc bằng crypto.

Về triển khai, ứng dụng chạy trên nền Next.js 15+ với PostgreSQL 17+, deploy bằng Docker Compose gồm 2 container. Toàn bộ dữ liệu lưu trên máy chủ của người dùng. Ngoài ra có full-text search trong nội dung tài liệu đã nhận diện, filter nâng cao theo nhiều tiêu chí, export CSV kèm file đính kèm, và thao tác hàng loạt.

Cần nhấn mạnh một số hạn chế. Dự án vẫn đang trong giai đoạn phát triển sớm, tác giả ghi rõ trên trang GitHub rằng người dùng tự chịu rủi ro khi sử dụng. Ứng dụng không có invoicing, payroll hay hệ thống sổ kép - bản chất là expense tracker kết hợp document analyzer, không phải phần mềm kế toán chuyên nghiệp. Chưa có tính năng cộng tác nhiều người dùng đầy đủ, chưa có mobile app chính thức, và vì phụ thuộc API từ OpenAI, Gemini hoặc Mistral nên vẫn phát sinh chi phí sử dụng AI (hỗ trợ LLM local đang nằm trong lộ trình). Quy mô cộng đồng hiện tại cũng còn nhỏ, khoảng 250 stars trên GitHub.

Zubarev cho biết đã dùng ứng dụng của mình xử lý hơn 200 hóa đơn cho năm 2024. Lộ trình tiếp theo gồm tự động tạo báo cáo VAT theo quý, nhắc nhở deadline thuế, đánh dấu giao dịch thiếu dữ liệu, và cho phép phân tích lại hàng loạt khi thay đổi prompt. Mã nguồn phát hành miễn phí dưới giấy phép MIT, dành cho ai biết dùng Docker và muốn tự kiểm soát dữ liệu tài chính của mình - dù "chị kế toán" vẫn là người đáng tin cậy nhất mà không AI nào thay thế được.

Theo Thế Duyệt

Cùng chuyên mục
XEM