Hành trình tạo AI giải toán ngang thí sinh Olympic của tiến sĩ Việt

18/1/2024 Gốc

Công cụ AI của nhóm nghiên cứu có khả năng giải đúng 25 bài toán Olympic. Trong khi đó, con số này với quán quân Olympic Toán học Quốc tế là 25,9 bài.

Suốt 4 năm qua, TS. Trịnh Hoàng Triều luôn miệt mài với câu hỏi làm thế nào để xây dựng một mô hình AI có khả năng giải toán hình học trong các kỳ thi Olympic Toán học Quốc tế (IMO).

Nỗ lực đã mang lại trái ngọt khi nhà khoa học máy tính người Việt đã bảo vệ thành công luận án tiến sĩ về đề tài này tại Đại học New York vào tuần trước. Anh còn công bố thành quả lao động suốt nhiều năm trên tạp chí khoa học uy tín Nature.

Được đặt tên là AlphaGeometry, hệ thống này giải quyết các bài toán hình học Olympic với độ khó gần bằng nhà vô địch đoạt huy chương vàng Olympic.

Bước nhảy vọt của AI giải toán

“Chúng tôi không chỉ cải tiến từ những điều đã có. Điều chúng tôi đạt được là một bước nhảy vọt, một bước đột phá lớn về mặt kết quả”, TS. Trịnh Hoàng Triều nói với New York Times.

Đồng tác giả của bài báo khoa học về hệ thống AlphaGeometry còn có TS. Lương Minh Thắng và TS. Lê Viết Quốc - đều đến từ Google DeepMind, He He - cố vấn tiến sĩ của Trịnh Hoàng Triều tại Đại học New York, cùng Yuhuai Wu - nhà đồng sáng lập xAI với Elon Musk.

Nhóm các nhà khoa học đã thử thách hệ thống AlphaGeometry với bộ đề gồm 30 bài toán hình học Olympic, từng xuất hiện trong các kỳ thi từ năm 2000-2022. Công cụ AI đã giải được 25 bài trong thời gian thi đấu tiêu chuẩn của Olympic. Trong khi đó, trung bình các nhà vô địch đoạt huy chương vàng Olympic những năm đó giải được 25,9 câu.

Để so sánh, nhóm nghiên cứu còn đưa các bài toán này cho Phương pháp của Wu Wenjun (Wu's method) - thuật toán chứng minh định lý hình học giỏi nhất được công bố vào năm 1970. Kết quả là nó giải được 10 bài toàn.

AlphaGeometry đã giải quyết 25 bài toán trong giới hạn thời gian thi đấu, gần bằng với điểm số trung bình của những người giành huy chương vàng. Nguồn: Google.

Mở đầu bài báo khoa học, nhóm nghiên cứu của TS. Trịnh Hoàng Triều lập luận rằng việc một công cụ AI có khả năng chứng minh thành công các bài toán Olympic sẽ “thể hiện một cột mốc quan trọng trong khả năng suy luận tự động ở cấp độ con người”.

Trong bài blog đăng trên trang chủ DeepMind, nhóm các nhà khoa học cho biết AlphaGeometry là một hệ thống AI biểu tượng thần kinh (Neuro Symbolic AI). Nó kết hợp một mô hình ngôn ngữ mạng thần kinh (neural language model) giỏi suy luận giống ChatGPT và một công cụ biểu tượng dựa trên quy tắc chuyên về khả năng lập luận.

Sau đó, hệ thống này được tùy chỉnh để giải quyết các bài toán hình học. Nhà toán học Heather Macbeth tại Đại học Fordham đánh giá AlphaGeometry tiến triển rất tốt trong quá trình xử lý lý luận con người một cách tự động với bộ quy tắc có sẵn.

Dữ liệu đầu vào hoàn toàn là nhân tạo

Điểm sáng của AlphaGeometry nằm ở việc mạng lưới thần kinh được đào tạo hoàn toàn dựa trên dữ liệu thuật toán. Con số này lên đến 100 triệu bài toán hình học. Trong số đó, không có bất kỳ dữ liệu nào là của con người.

Nhóm nghiên cứu AlphaGeometry bao gồm Yuhuai Wu, Trịnh Hoàng Triều, Lương Minh Thắng và Lê Viết Quốc. Ảnh: Aaron Cohen.

Việc sử dụng dữ liệu do thuật toán tạo lập đã giúp nhóm nghiên cứu vượt qua một trở ngại lớn mỗi khi con người phát triển hệ thống AI chứng minh định lý tự động. Đó là tình trạng thiếu dữ liệu đào tạo đáp ứng đủ 2 tiêu chí: kiểm chứng được và dịch sang ngôn ngữ mà máy có thể đọc. “Thật ra ban đầu chúng tôi đều nghi ngờ về khả năng thành công của cách làm này”, TS. He He chia sẻ.

Bên cạnh đó, điểm đặc biệt khác của AlphaGeometry là khi giải một bài toán, công cụ biểu tượng sẽ bắt đầu trước. Nếu bí, mạng lưới thần kinh sẽ đề xuất các cách để tăng cường lập luận chứng minh. Vòng lặp tiếp tục cho đến khi tìm ra đáp án hoặc cho đến khi hết thời gian quy định là 4h30’.

Trong toán học, quá trình tăng cường lập luận này được gọi là “vẽ thêm hình phụ” (auxiliary construction) như thêm một đường thẳng, chia đôi một góc, vẽ một vòng tròn. Đây vốn là những phương pháp mà các nhà toán học dùng để tìm ra đáp án.

Trong hệ thống này, mạng lưới thần kinh đã học cách vẽ thêm hình giống với con người. TS. Triều ví nó như việc quấn một sợi dây quanh một chiếc nắp lọ cứng để giúp con người cầm nắm tốt hơn.

Chia sẻ với New York Times, thiên tài toán học Terence Tao - người đoạt huy chương vàng Olympic trẻ nhất thế giới khi chỉ mới 12 tuổi - cho rằng AlphaGeometry là một “thành tựu tuyệt vời” và đã đạt được “những kết quả đáng ngạc nhiên”.

AlphaGeometry dựng thêm đường phụ để giải bài toán chứng minh tam giác đơn giản. Ảnh: Google.

Theo nhà toán học người Australia gốc Hoa, việc tinh chỉnh hệ thống AI để giải quyết các bài toán Olympic có thể không cải thiện kỹ năng nghiên cứu sâu của nó, nhưng quá trình nghiên cứu sẽ mang lại nhiều giá trị hơn chỉ quan tâm đến đích đến.

Gia nhập đội ngũ của Google

TS. Triều cho rằng suy luận toán học chỉ là một trong rất nhiều loại suy luận của con người. Ưu điểm của nó là dễ kiểm chứng. “Toán học là ngôn ngữ của sự thật”, anh cho biết. Nhà khoa học máy tính cho rằng nếu muốn xây dựng một hệ thống trí tuệ nhân tạo, điều quan trọng là phải xây dựng một AI tìm kiếm sự thật và đáng tin cậy đủ để con người tin tưởng.

Đầu tháng 12, trong lần về thăm trường cũ ở TP.HCM, TS. Lương Minh Thắng đã trình bày AlphaGeometry cho thầy Lê Bá Khánh Trình. Được mệnh danh là "huyền thoại Toán học Việt Nam", ông từng đoạt huy chương vàng Olympic 1979 với số điểm tuyệt đối 40/40, đồng thời đoạt giải đặc biệt về lời giải độc đáo trong kỳ thi.

TS. Lê Bá Khánh Trình đã phân tích một trong những cách chứng minh của AlphaGeometry và nhận thấy nó rất ấn tượng nhưng chưa đủ thỏa mãn. “Ông ấy nghĩ nó quá máy móc, thiếu linh hồn và vẻ đẹp của một lời giải mà con người đang tìm kiếm”, TS. Thắng nhớ lại.

TS. Lương Minh Thắng (bên phải) và thầy Lê Bá Khánh Trình (giữa) thảo luận về AlphaGeometry. Ảnh: Wendy Nguyen.

Mặc dụ ấn tượng với hiệu suất của AlphaGeometry, nhà khoa học thần kinh Stanislas Dehaene tại Collège de France cũng nhận xét rằng hệ thống AI không “hiểu” về không gian hình học của những bài toán được giải. Ông cho rằng nó chỉ xử lý các mã hóa logic và số học dựa trên hình ảnh phẳng. “Hệ thống hoàn toàn không có nhận thức về không gian giữa các đường tròn, đường thẳng và tam giác mà nó thao tác”, nhà khoa học nhận định.

Ghi nhận góp ý, TS. Lương Minh Thắng cho biết AlphaGeometry sẽ được nâng cấp, có thể là trong năm nay, bằng cách sử dụng Gemini của Google - một hệ thống “đa phương thức” xử lý cả văn bản và hình ảnh.

AlphaGeometry đã gia nhập nhóm AI Google DeepMind - vốn nổi tiếng với khả năng giải quyết những vấn đề toán học phức tạp. Hệ thống nổi tiếng nhất của DeepMind là AlphaZero, một thuật toán deep learning (học sâu) đã chinh phục môn cờ vua vào năm 2017. Song, toán học còn là một vấn đề khó hơn vì khả năng và cách thức tìm ra lời giải là vô hạn, trong khi cờ vua chỉ hữu hạn.

Thúy Liên

Google

Nguồn Znews: https://znews.vn/3-tien-si-viet-phat-minh-ai-giai-toan-gioi-nhu-nha-vo-dich-olympic-post1455567.html