Sự hồi sinh của công nghệ nhận diện giọng nói

Sau thời gian im hơi lặng tiếng, công nghệ này đã trở lại bằng cuộc cạnh tranh sôi động của thị trường loa thông minh.

Lịch sử chưa xa

Đầu những năm 2000, công nghệ nhận diện giọng nói đã đạt 80% yêu cầu về độ chính xác. Trong môi trường phát triển cho các doanh nghiệp, nó đã khởi đầu cho kỷ nguyên của hệ thống trả lời tự động, được áp dụng để giải quyết các rắc rối trong ngành dịch vụ khách hàng.

Nhưng khi đó, các ứng dụng của công nghệ này vẫn còn rất phụ thuộc vào ngôn ngữ và lượng từ vựng, tức là, nó cần một hệ thống tổng hợp rất tinh vi và được chuyên môn hóa cao. Mỗi ngôn ngữ phải tự phát triển một công cụ nhận diện giọng nói riêng. Cho đến năm 2005, hiện tượng này chấm dứt khi hãng phần mềm Nuance thâu tóm và hợp nhất 15 công ty phát triển công nghệ này.

Cuộc đổi mới với phương pháp dạy máy học ngôn ngữ

Trong khi việc ứng dụng công nghệ nhận diện giọng nói vào dịch vụ chăm sóc khách hàng chững lại, Amazon, Apple, Google, IBM và Microsoft tiếp tục nghiên cứu và phát triển với tầm nhìn mới, tập trung vào những tương tác của người dùng với thiết bị.

Apple có bước đột phá đầu tiên với Siri. Trí tuệ nhân tạo đã giúp loại bỏ nhiều khiếm khuyết và phức tạp của công nghệ nhận diện giọng nói, cũng như nhu cầu tái cấu trúc ngôn ngữ và từ vựng.

Siri của Apple là trợ lý giọng nói đầu tiên cho smartphone.

Siri của Apple là trợ lý giọng nói đầu tiên cho smartphone.

Ngày nay, hầu hết các công ty với công nghệ đột phá, trong đó phải kể đến 3 ông lớn của thị trường Trung Quốc là Alibaba, Baidu và Tencent đang xây dựng kho từ vựng khổng lồ của riêng mình. Nhờ sử dụng các công cụ học máy và tổng hợp, rào cản về ngôn ngữ nhập đã được giảm bớt đáng kể. Các nguồn mở như Julius, HTK, Kaldi cũng trở nên phổ biến.

Những kẻ thay đổi cuộc chơi

Thị trường loa thông minh đang sôi động với sản phẩm của rất nhiều ông lớn như Echo, Echo Dot, Echo Show của Amazon; Google Home của Google và HomePod của Apple dự kiến ra mắt vào tháng 12 năm nay. Công nghệ nhận diện giọng nói là một trong những phần cốt yếu của các thiết bị này khi người dùng có thể đặt lệnh thoại cho các thiết bị này thực hiện một số công việc đơn giản như đặt xe taxi, xem giờ, hỏi tình hình thời tiết, phát nhạc. Các tính năng này mở ra lĩnh vực áp dụng rộng lớn hơn cho công nghệ nhận diện giọng nói và hứa hẹn một cuộc cạnh tranh sôi động giữa các loa thông minh không kém gì cuộc chiến giữa các hãng điện thoại thông minh.

Loa thông minh Echo Dot của Amazone là sản phẩm bán chạy nhất trong ngày Prime Day vừa qua.

Minh Thu (theo ReadWrite)

Nguồn ICTNews: http://ictnews.vn/kinh-doanh/thi-truong/su-hoi-sinh-cua-cong-nghe-nhan-dien-giong-noi-156350.ict