Cực kỳ ấn tượng: AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn!

12/07/2019 09:30 AM | Công nghệ

Hệ thống mới cắt bỏ được nhiều bước nhiêu khê, cho phép dịch nhanh hơn và được một kết quả ấn tượng.

Cực kỳ ấn tượng: AI của Google có thể thay bạn nói trôi chảy mọi loại ngoại ngữ, bằng giọng điệu của chính bạn!

Trước khi biết về công nghệ AI mới của Google, bạn hãy nghe kết quả dự án nghiên cứu trước.

Đây là một câu trong tiếng Tây Ban Nha.

Vẫn là câu đó, được dịch sang tiếng Anh bằng hệ thống thông thường của Google. Các hệ thống dịch thuật khác cũng sẽ có kết quả tương tự, chỉ là giọng khác nhau thôi.

Dịch sang tiếng Anh, câu này có nghĩa là: “Tôi tự hỏi mình cảm thấy sao, và đó là lúc tôi bắt đầu khóc”.

Đây là câu nói nguyên bản được dịch sang tiếng Anh, thông qua hệ thống dịch tự động mới. Nội dung câu nói giờ đã khác: "Larry hỏi tôi cảm thấy thế nào, và đó là lúc tôi bắt đầu khóc".

Kết quả chưa hoàn hảo, nhưng bạn có thể thấy ngữ điệu, âm sắc trầm bổng trong câu nói được giữ lại phần nhiều. Đây là hệ thống dịch lập tức mới của Google, có thể cho phép người dùng giữ lại chính giọng nói đó.

Đây chính là điểm khác biệt giữa hai hệ thống dịch thuật giọng nói cũ và mới. Trước thời điểm này, mọi câu nói đều được chuyển hóa thành dạng text, được dịch lại thành ngôn ngữ yêu cầu và được đọc lại bằng giọng nói máy móc. Việc này khiến cho ngữ điệu bị mất trong quá trình phiên dịch.

Hệ thống mới, được đặt cho cái tên Translatotron, bao gồm 3 thành phần; cả ba sẽ đều tập trung vào ảnh phổ - hình ảnh đại diện cho một phổ nhất định, rồi thực hiện ba công việc khác nhau.

Phần đầu tiên sẽ sử dụng mạng neural đã được huấn luyện phân tích phổ âm thanh, để tạo ra một phổ âm thanh của ngôn ngữ đầu ra.

Phần thứ hai sẽ chuyển phổ đó thành một sóng âm thanh có thể nghe được.

Phần thứ ba sẽ tách riêng những nét đặc trưng trong giọng nói nguyên bản, để gắn vào đoạn âm thanh cuối cùng.

Cách thức mới không chỉ giữ nguyên được những ngữ điệu (trong nhiều trường hợp là cả hàm ý) người nói trong sản phẩm cuối cùng, trên lyus thuyết, nó còn giảm được lỗi khi cắt bớt được những bước không cần thiết trong các hệ thống dịch thuật cũ.

Translatotron mới chỉ là sản phẩm mẫu mang tính chất chứng minh hệ thống hoạt động được. Trong quá trình thử, các nhà nghiên cứu mới chỉ tập trung vào dịch tiếng Tây Ban Nha sang tiếng Anh, “mới chỉ” có thế mà đã cần tới lượng dữ liệu huấn luyện AI khổng lồ. Nhưng nó hé cảnh cửa hẹp cho ta thấy tương lai có thể sẽ ra sao.

Bạn có thể nghe thêm các ví dụ khác theo đường link này.

Theo Dink

Trí Thức Trẻ

Cùng chuyên mục
XEM

NỔI BẬT TRANG CHỦ

Một loạt cửa hàng trà sữa Ten Ren nay mang tên Toocha, The Coffee House đang toan tính gì?

Ngay sau khi thay CEO thì The Coffee House đưa ra thông báo ngưng hoạt động thương hiệu trà sữa Ten Ren. Chưa đầy một tuần kể từ ngày phát đi thông báo ngưng hoạt động, nay các cửa hàng Ten Ren đã mang bảng hiệu của một thương hiệu trà sữa khác là Toocha...

Case study

Lion King – Vị vua “giả mạo” của Disney: Tên nhân vật, cốt truyện, tạo hình… đều “xài chùa” từ bộ Anime Nhật 30 năm trước?

Được đánh giá là “Sản phẩm điện ảnh thành công nhất mọi thời đại”, Vua sư tử của Disney đã mở ra một kỷ nguyên mới với hàng loạt vở nhạc kịch, chương trình âm nhạc và hiện tại là bộ phim chuyển thể “bom tấn”. Nhưng ít ai biết rằng, đằng sau Vua Simba là chú sư tử “đàn anh” Kimba đã chết trong im lặng và uất ức.

Tư duy ngấm vào máu người thông minh: Tự kỉ luật khiến bạn trở nên xuất chúng, không kỉ luật khiến bạn mất chỗ đứng!

Kỉ luật và tự giác ngắn hạn giúp chúng ta hình thành và phát triển thói quen nhưng về lâu dài sẽ thay đổi cuộc sống của mỗi người. Tuân thủ kỉ luật và tự giác, số phận sẽ quan tâm và đối đãi chúng ta.

Việt Nam có 2 nhà khoa học lọt tốp 100 châu Á

Tạp chí Asian Scientist (Singapore) vừa công bố danh sách “100 nhà khoa học châu Á điển hình năm 2019”, trong đó có 2 người Việt.

Đọc thêm