ChatGPT sẽ 'nhìn, nghe và nói chuyện được'

OpenAI thông báo ChatGPT sẽ ra một bản cập nhật lớn cho phép chatbot này trò chuyện bằng giọng nói với người dùng và tương tác bằng hình ảnh, tương tự các trợ lý trí tuệ nhân tạo (AI) phổ biến như Siri của Apple.

Với bản cập nhật mới nhất, ChatGPT có thể giao tiếp với người dùng qua giọng nói giống như trợ lý ảo Siri của Apple. Ảnh: Reuters/Dado Ruvic

OpenAI cập nhật loạt tính năng mới cho ChatGPT

Theo OpenAI, với bản cập nhật lớn nhất từ khi ra mắt đến nay, ChatGPT sẽ "nhìn, nghe và nói chuyện được", "mở ra cánh cửa cho nhiều ứng dụng sáng tạo và tập trung vào khả năng tiếp cận". Theo đó, với tính năng giọng nói mới, ChatGPT có thể kể những câu chuyện trước khi đi ngủ, giải quyết các cuộc tranh luận tại bàn ăn tối hay nói to nội dung nhập văn bản của người dùng.

OpenAI cho biết công nghệ này cũng đang được Spotify sử dụng để dịch các podcast trên nền tảng này sang các ngôn ngữ khác nhau.

Phiên bản mới cho phép chatbot của OpenAI giao tiếp được với người dùng tương tự như Siri - trợ lý giọng nói của Google và Alexa của Amazon.com. Các dịch vụ AI này được tích hợp với các thiết bị chạy trên đó và thường được sử dụng để đặt báo thức, lời nhắc hay cung cấp thông tin qua Internet.

Với sự hỗ trợ hình ảnh, người dùng có thể chụp ảnh mọi thứ xung quanh và yêu cầu ChatGPT "khắc phục sự cố khiến lò nướng của bạn không khởi động, xem những thực phẩm có trong tủ lạnh để lên kế hoạch cho bữa ăn hoặc phân tích biểu đồ phức tạp cho dữ liệu liên quan đến công việc". Google Lens của Alphabet hiện là lựa chọn phổ biến để thu thập thông tin về hình ảnh.

Các tính năng mới của ChatGPT sẽ được phát hành cho những người đăng ký gói Plus và Enterprise trong 2 tuần tới. Chức năng giọng nói sẽ có sẵn trên iOS và Android tùy theo sự lựa chọn của người dùng, trong khi đó, chức năng nhận dạng hình ảnh sẽ có sẵn trên tất cả các nền tảng.

ChatGPT (Chat Generative Pre-training Transformer) là chatbot do công ty OpenAI của Mỹ phát triển và ra mắt vào tháng 11/2022. ChatGPT được xây dựng dựa trên GPT-3.5, dòng mô hình ngôn ngữ lớn của OpenAI đồng thời được tinh chỉnh bằng cả 2 kỹ thuật học tăng cường lẫn học có giám sát.

Kể từ khi ra mắt, ChatGPT đã được các công ty áp dụng cho nhiều nhiệm vụ từ tóm tắt tài liệu đến viết mã máy tính, tạo ra cuộc chạy đua giữa các "ông lớn" công nghệ như OpenAI, Microsoft, Google, nhằm tung ra các dịch vụ riêng dựa trên AI tạo sinh. Gần đây, Google và Microsoft đã công bố một loạt bản cập nhật cho chatbot trí tuệ nhân tạo của mình là Bard và Bing.

Google cũng dự kiến tung ra Gemini - mô hình AI đa phương thức do Google DeepMind nghiên cứu và phát triển. Đây được xem là "nỗ lực nghiêm túc nhất" của hãng trong cơn sốt AI - lĩnh vực hãng tham gia nhiều năm nhưng lại chậm chân trong cuộc đua AI tạo sinh so với ChatGPT. Về phần mình, ngày 25/9/2023, Amazon đã công bố khoản đầu tư 4 tỷ USD vào công ty khởi nghiệp AI Anthropic để hỗ trợ và thúc đẩy các nỗ lực liên quan đến AI tạo sinh.

Nguồn: Reuters, OpenAI

Hồng Ngọc

Nguồn Công dân & Khuyến học: https://congdankhuyenhoc.vn/chatgpt-se-nhin-nghe-va-noi-chuyen-duoc-179230926163530648.htm