Đội đương kim vô địch The International 2018 OG đã thất bại 0-2 trước trí tuệ nhân tạo của OpenAI trong buổi đấu vừa diễn ra.
OpenAI cũng mong muốn mở rộng AI này sang nhiều lĩnh vực hơn ngoài game, và cuối cùng là áp dụng vào thế giới thực. Họ đang nghiên cứu sử dụng thuật toán học tăng cường và các kỹ thuật khác để khiến robot có những chuyển động khéo léo hơn. Họ không chỉ làm AI để thắng trong game, họ còn muốn làm những điều lớn lao hơn thế.
Đây thực sự là bước tiến vô cùng lớn của OpenAI khi lần đầu tiên trong lịch sử, hệ thống trí tuệ nhân tạo của startup này đã chiến thắng trước nhà vô địch DOTA 2 thế giới trong buổi thi đấu OpenAI Five Finals vừa diễn ra tại San Francisco.
Tại buổi đấu, hai phe bao gồm phe "con người" là OG, đội vô địch The International 2018, giải đấu DOTA 2 tầm cỡ thế giới với giải thưởng lên đến hàng chục triệu USD. Đối đầu với OG là phe "máy tính" Open AI Five, được huấn luyện bởi thuật toán học tăng cường (reinforcement learning) và điều khiển độc lập bởi các lớp khác nhau trong cùng một hệ thống.
Học tăng cường là phương pháp tự học bằng những phép thử, gặp sai sót để tự cải thiện, cố gắng đạt kết quả tốt nhất. Theo The Verge thì với cách học tăng cường, AI sẽ được "thả" vào môi trường mà bản thân nó không biết bất cứ gì về cách vận hành game, sau đó được "huấn luyện" bằng hệ thống phần thưởng và các cơ chế khuyến khích để ngày một tốt hơn.
Trận thắng trước đội vô địch thế giới vừa rồi chính là màn trình diễn thành công nhất của OpenAI Five tính đến thời điểm này. Greg Brockman, đồng sáng lập, chủ tịch kiêm giám đốc công nghệ của OpenAI cho biết OpenAI Five tự cải thiện mình bằng cách tự chơi game trong môi trường ảo tốc độ cao.
"OpenAI Five sử dụng thuật toán học tăng cường, nghĩa là chúng tôi không cần viết sẵn mã về cách chơi, chúng tôi chỉ viết mã hướng dẫn nó cách học. Trong 10 tháng, OpenAI Five đã luyện tập tương đương 45.000 năm", Brockman cho biết.
DOTA 2 là tựa game chiến thuật cực kỳ phức tạp với hơn 100 tướng khác nhau, hàng loạt kỹ năng và danh sách vật phẩm đa dạng, điều đó khiến những biến số có thể xảy ra tại bất kỳ thời điểm nào. Để phù hợp với khả năng hiện có, cả hai đội bị giới hạn số tướng được chọn xuống còn 17, chơi ở chế độ Captain's Draft (mỗi đội có thể cấm đối thủ chọn các tướng nhất định trước khi chọn tướng cho mình). Chế độ này giúp đội trưởng xây dựng chiến lược dựa trên tổ hợp tướng, điểm yếu thông qua các đòn tấn công trong khi đối thủ chọn tướng. Tương tự các trận đấu trước, kỹ năng triệu hồi và ảo giác cũng không được sử dụng vì có thể tạo ra biến số mới.
Ngoài những thay đổi trên, mọi thứ diễn ra như một trận DOTA 2 bình thường với mục tiêu là phá hủy căn cứ đối thủ bằng cách tiêu diệt trụ địch và thắng combat (đánh nhau giữa các tướng hai đội).
Trong trận đầu tiên, Open AI Five đã chiến thắng với một số chiến lược thú vị như tích tiền (trong game) để hồi sinh ngay tướng sau khi chết, ngay cả trong giai đoạn đầu trận. Theo ghi nhận, OpenAI Five từng thích các chiến lược mang đến lợi ích ngắn hạn nên bị thua thiệt trước con người rất giỏi lập chiến lược lâu dài. Tuy nhiên, ván đấu này cho thấy sự tính toán dài hạn của OpenAI Five khiến OG mất lợi thế sau 30 phút.
Sang ván thứ hai, OpenAI Five thậm chí còn thể hiện tốt hơn khi giành lợi thế chỉ trong vài phút đầu, và mất một nửa thời gian so với trận đầu để giành chiến thắng. Mike Cook, một "fan cuồng" DOTA 2 cho biết cách gây chiến của OpenAI trong ván 2 khá bất thường, nhưng đã tận dụng tốt những con tướng mà nó có.
Đối với OpenAI, chiến thắng này cho thấy cách tiếp cận của thuật toán học tăng cường mang đến kết quả tốt như thế nào. Dù khẳng định sẽ không tổ chức buổi thi đấu demo nào giống như vậy nữa, song OpenAI cho biết đang phát triển phần mềm cho phép con người cùng chơi với OpenAI để học hỏi những cách chơi, chiến lược mà họ chưa từng biết đến. Chế độ chơi cùng OpenAI trong DOTA 2 mang tên Arena sẽ mở từ ngày 18 đến 21/4.
OpenAI cũng mong muốn mở rộng AI này sang nhiều lĩnh vực hơn ngoài game, và cuối cùng là áp dụng vào thế giới thực. Họ đang nghiên cứu sử dụng thuật toán học tăng cường và các kỹ thuật khác để khiến robot có những chuyển động khéo léo hơn. Họ không chỉ làm AI để thắng trong game, họ còn muốn làm những điều lớn lao hơn thế.
Tags:
Technology