Công cụ dịch trực tiếp giọng nói của Google sử dụng công nghệ AI

Gốc
Google đang phát triển một công cụ có khả năng dịch trực tiếp từ giọng nói ra giọng nói theo nhiều ngôn ngữ khác nhau mà không cần bước trung gian chuyển sang văn bản.

Theo đó, các công cụ dịch hiện nay thường chuyển giọng nói thành văn bản, sau đó dịch văn bản sang ngôn ngữ mới, rồi mới chuyển văn bản thành giọng nói.

Tuy nhiên, công cụ dịch thuật mới mà hãng công nghệ Mỹ đang phát triển mang tên Translatotron, sẽ bỏ qua bước trung gian và dịch trực tiếp từ giọng nói ra giọng nói.

Google cho biết, Translatotron sử dụng công nghệ AI với một mạng lưới thần kinh cho phép dịch nhanh, loại bỏ lỗi, xác định các từ không cần dịch như tên riêng, địa danh. Ngoài ra, công cụ này còn hỗ trợ giữ lại giọng điệu của người nói với âm thanh tự nhiên.

Translatotron hiện là công cụ đầu tiên cho phép dịch trực tiếp giọng nói từ một ngôn ngữ sang giọng nói bằng ngôn ngữ khác.

Google xem Translatotron là sự khởi đầu cho việc xây dựng các hệ thống dịch đầu - cuối bằng giọng nói trong tương lai.

Bảo Lam

Theo DM