Meta team tạo AI cho game Ngoại giao, đàm phán thắng con người

Việc tạo ra Cicero, mà Meta AI tuyên bố là Trí tuệ nhân tạo [AI] đầu tiên thực hiện ở cấp độ con người trong trò chơi bảng chiến lược Diplomacy, đã được công bố vào ngày 22 tháng 11

Trò chơi đòi hỏi kỹ năng đàm phán giữa các cá nhân phức tạp, vì vậy Cicero phải đạt được một trình độ thông thạo ngôn ngữ nhất định để giành chiến thắng, đây là một thành tích ấn tượng

Các trò chơi trên bàn cờ là một thước đo hữu ích về sự tiến bộ của AI ngay cả trước khi Deep Blue đánh bại Garry Kasparov trong môn cờ vua vào năm 1997. Một rào cản khác đã bị phá vỡ vào năm 2015 khi AlphaGo đánh bại bậc thầy cờ vây Lee Sedol. Mặc dù các quy tắc của cờ vây thường được sắp xếp hợp lý cho AI máy tính, nhưng cả hai trò chơi này đều tuân thủ một bộ quy tắc phân tích khá rõ ràng.

Cuộc đối thoại giữa AI và người chơi trong game Diplomacy. nguồn hình ảnh. kỹ thuật Ars

Tuy nhiên, người chơi trong Ngoại giao phải thể hiện sự đồng cảm, sử dụng ngôn ngữ tự nhiên và tạo dựng các mối quan hệ để thành công, đây là một thách thức đối với máy tính để làm tốt hơn người chơi. Trong bối cảnh này, Meta yêu cầu. "Liệu chúng ta có thể xây dựng các tác nhân hiệu quả và linh hoạt, có thể sử dụng ngôn ngữ để đàm phán, thuyết phục và làm việc với mọi người để đạt được các mục tiêu chiến lược theo cách tương tự như con người không?

Có, theo Meta, Cicero đã đạt được chuyên môn đàm phán khi chơi trò chơi Ngoại giao. ngoại giao. net đã có phiên bản trực tuyến. Thời gian trôi qua, AI được báo cáo là đã đạt được "hơn gấp đôi số điểm trung bình" của những người chơi là con người và luôn nằm trong top 10% những người chơi giỏi nhất

Trong mỗi trò chơi, Cicero kiểm tra trạng thái của bàn trò chơi, lịch sử hội thoại và dự đoán cách những người chơi khác sẽ hành động, kết hợp lý luận chiến lược [tương tự như AlphaGo] và các mô hình AI xử lý ngôn ngữ tự nhiên [tương tự như GPT-3] thành một tác nhân. Để tương tác với những người chơi khác, mô hình AI tạo một kế hoạch thực hiện bằng cách sử dụng mô hình ngôn ngữ có thể tạo ra đoạn hội thoại giống như lời nói của con người

Sơ đồ khối cho bot ngoại giao Cicero hỗ trợ Meta

Giống như GPT-3, Cicero sử dụng kho dữ liệu Internet khá lớn được lấy từ web và Meta đề cập đến khả năng ngôn ngữ tự nhiên của Cicero như một "mẫu đối thoại có thể kiểm soát", là cốt lõi trong tính cách của Cicero. Viết Meta. "Chúng tôi đã bắt đầu với một mô hình ngôn ngữ tương tự như mô hình bộ mã hóa tự động khử nhiễu cho trình sắp xếp thứ tự [BART] của hai mô hình để xây dựng mô hình đối thoại có thể điều khiển được. WebNgoại giao. net lưu trữ 100.000 trò chơi của con người

Meta cho biết: “Cicero có thể suy luận rằng, sau này trong trò chơi, AI sẽ cần sự hỗ trợ của một người chơi cụ thể, sau đó vạch ra chiến lược để giành được sự ủng hộ của người chơi đó”. "Mô hình kết quả đã làm chủ được sự tinh tế của một trò chơi phức tạp. "

Với tiêu đề "Trò chơi ở cấp độ con người trong trò chơi Ngoại giao bằng cách kết hợp các mô hình ngôn ngữ với lý luận chiến lược", nghiên cứu của Meta's Cicero đã được đăng trên tạp chí Science

Theo Meta, nghiên cứu của Cicero có thể "xóa bỏ rào cản giao tiếp" giữa con người và AI, chẳng hạn như trì hoãn một cuộc trò chuyện dài để dạy ai đó một kỹ năng mới hoặc nó có thể cung cấp động năng cho một trò chơi điện tử trong đó các nhân vật trò chơi [NPC] có thể trò chuyện

Dựa trên nhận thức này, Meta hy vọng các nhà nghiên cứu khác có thể xây dựng mã của mình một cách "có trách nhiệm" và cho biết công ty đã thực hiện các bước cần thiết để phát hiện và xóa "tin nhắn độc hại". " Đồng thời, công nghệ này có thể được sử dụng để thao túng con người, mạo danh con người và lừa đảo theo những cách nguy hiểm tiềm ẩn, tùy thuộc vào ngữ cảnh

Những người hâm mộ Nhà ngoại giao trực tuyến, bao gồm cả chúng tôi, cần hết sức thận trọng trên mạng xã hội vì có thể trong tương lai gần, một phiên bản giống như Cicero có thể giao tiếp với chúng tôi, chỉ bằng cách nhập tên của chúng tôi. Meta đã ra mắt một trang web giải thích cách thức hoạt động của Cicero và cũng có mã nguồn mở của Cicero trên GitHub

AI đã thành thạo một số trò chơi phức tạp nhất mà con người biết đến, nhưng mặc dù nó thường vượt trội trong cạnh tranh, nhưng sự hợp tác không đến một cách tự nhiên. Giờ đây, AI từ Meta đã thành thạo trò chơi Ngoại giao, trò chơi yêu cầu bạn phải hợp tác với những người chơi khác để giành chiến thắng

Việc Google thông thạo trò chơi cờ vây được ca ngợi là một cột mốc quan trọng đối với AI, nhưng bất chấp sự phức tạp không thể phủ nhận của nó, theo nhiều cách, nó rất phù hợp với logic tính toán lạnh lùng của một cỗ máy. Đây là một trò chơi thông tin hoàn hảo, nơi bạn có thể nhìn thấy đầy đủ các bước di chuyển của đối thủ và chiến thắng đơn giản có nghĩa là có thể vượt qua một người chơi khác

Ngoại giao, mặt khác, là một vấn đề rắc rối hơn nhiều. Trò chơi trên bàn có tới bảy người chơi đánh chiếm vượt qua các cường quốc quân sự châu Âu và sử dụng quân đội của họ để kiểm soát các thành phố chiến lược. Nhưng người chơi được phép thương lượng với nhau để thành lập và phá vỡ các liên minh nhằm theo đuổi sự thống trị hoàn toàn.

Hơn nữa, tất cả các bước di chuyển của người chơi được thực hiện đồng thời ở mỗi lượt, vì vậy bạn không thể phản ứng đơn giản với những gì người khác làm. Điều này có nghĩa là các trò chơi chiến thắng đòi hỏi sự kết hợp phức tạp giữa tư duy chiến lược, khả năng hợp tác với những người chơi khác và kỹ năng đàm phán thuyết phục. Mặc dù AI đã thành thạo chiến lược thuần túy, nhưng những kỹ năng khác đó tỏ ra khó tái tạo hơn nhiều

Tuy nhiên, một AI mới do các nhà nghiên cứu tại Meta thiết kế có thể đã tiến một bước lớn theo hướng đó. Trong một bài báo được xuất bản tuần trước trong Khoa học, they describe a system called Cicero that ranked in the top 10 percent of players in an online Diplomacy league and achieved more than double the average score of the human players.

Cicero kiên cường, tàn nhẫn và kiên nhẫn,” nhà ngoại giao ba lần vô địch thế giới Andrew Goff said in a video produced by Meta. “It plays without a lot of the human emotion that sometimes makes you make bad decisions. It just assesses the situation and makes the best decision, not only for it, but for the people it’s working with.”

Tạo Cicero yêu cầu các nhà nghiên cứu Meta kết hợp các phương pháp AI tiên tiến từ hai lĩnh vực phụ khác nhau. lý luận chiến lược và xử lý ngôn ngữ tự nhiên. Về cơ bản, hệ thống có một thuật toán lập kế hoạch dự đoán nước đi của những người chơi khác và sử dụng thuật toán này để xác định chiến lược của riêng mình. Thuật toán này được đào tạo bằng cách để AI tự chơi đi chơi lại, đồng thời cố gắng bắt chước cách con người chơi trò chơi

Các nhà nghiên cứu đã chỉ ra rằng chỉ riêng mô-đun lập kế hoạch này đã có thể đánh bại những người chơi chuyên nghiệp trong phiên bản đơn giản hóa của trò chơi. Nhưng trong nghiên cứu mới nhất này, nhóm đã kết hợp nó với một mô hình ngôn ngữ lớn được đào tạo trên lượng lớn văn bản từ internet, sau đó tinh chỉnh bằng cách sử dụng đoạn hội thoại từ 40.000 trò chơi trực tuyến của Diplomacy. Điều này mang lại cho Cicero được nâng cấp khả năng diễn giải các thông báo từ những người chơi khác cũng tạo ra các thông báo của riêng mình to persuade them to work together.

Hệ thống kết hợp bắt đầu bằng cách sử dụng trạng thái hiện tại của bàn cờ và cuộc đối thoại trong quá khứ để dự đoán khả năng mỗi người chơi sẽ làm gì. Sau đó, nó đưa ra một kế hoạch hành động cho cả chính nó và các đối tác trước khi tạo các thông báo được thiết kế để phác thảo ý định của nó và đảm bảo sự hợp tác của những người chơi khác

Hơn 40 trận đấu trong giải đấu trực tuyến, Cicero đã giao tiếp hiệu quả với 82 người chơi khác để giải thích ý định, phối hợp hành động và đàm phán liên minh. Điều quan trọng, các nhà nghiên cứu cho biết họ không thấy bằng chứng nào từ các tin nhắn trong trò chơi cho thấy người chơi nghi ngờ họ đang hợp tác với AI

Tuy nhiên, khả năng giao tiếp của người mẫu không hoàn hảo. Nó không chỉ có khả năng đưa ra những thông điệp vô nghĩa hoặc những thông điệp không phù hợp với mục tiêu của nó, vì vậy các nhà nghiên cứu phải tạo ra nhiều thông điệp ứng cử viên trong mỗi lần di chuyển và sau đó sử dụng các cơ chế lọc khác nhau để loại bỏ rác. Và ngay cả khi đó, các nhà nghiên cứu cũng thừa nhận rằng đôi khi những thông điệp phi logicped.

Điều này cho thấy rằng mô hình ngôn ngữ cốt lõi của Cicero vẫn chưa thực sự hiểu chuyện gì đang xảy ra và chỉ đơn giản là tạo ra những thông điệp nghe có vẻ hợp lý, sau đó cần được kiểm tra để đảm bảo chúng đạt được kết quả mong muốn.

Viết trong The Conversation, nhà nghiên cứu AI Toby Walsh tại Đại học New South Wales ở Úc cũng lưu ý rằng Cicero hoàn toàn trung thực, không giống như . Mặc dù đây là một chiến lược hiệu quả đáng ngạc nhiên, nhưng nó có thể là một điểm yếu lớn nếu các đối thủ nhận ra rằng đối thủ của họ sẽ không bao giờ cố gắng lừa dối họ.

Tuy nhiên, bước tiến này là một bước tiến quan trọng và Facebook hy vọng nó có thể có các ứng dụng vượt xa các trò chơi trên bàn cờ. Trong một bài đăng trên blog, các nhà nghiên cứu cho biết khả năng sử dụng thuật toán lập kế hoạch để kiểm soát việc tạo ngôn ngữ có thể giúp các cuộc trò chuyện với AI chatbot dài hơn và phong phú hơn .

AI có thể đánh bại con người trong trò chơi không?

Tác nhân AI đánh bại các bot Stratego hiện có khác, vốn chơi ở cấp độ nghiệp dư, hơn 97% thời gian, họ báo cáo. Nó thắng 84% thời gian trước những người chơi chuyên nghiệp là con người trên nền tảng trò chơi trực tuyến , đôi khi bằng cách lừa gạt và đánh lừa.

Meta đang làm gì với AI?

Điểm chính. Ngoài việc rót tiền vào metaverse, Meta đang chi hàng tỷ nâng cấp trung tâm dữ liệu của mình để hỗ trợ AI tốt hơn . Kế hoạch là sử dụng AI để cải thiện cách phục vụ nội dung và quảng cáo.

Lần đầu tiên AI có thể chơi trò chơi với con người là khi nào?

1997 . IBM đã phát minh ra cỗ máy Deep Blue đã học chơi cờ vua và đánh bại Garry Kasparov, nhà vô địch thế giới thời đó. Đây là lần đầu tiên AI đánh bại một nhà vô địch thế giới trong một trận đấu. Garry Kasparov chơi cờ với IBM Deep Blue.

Vai trò của AI trong chơi game là gì?

Trong trò chơi điện tử, trí tuệ nhân tạo [AI] được sử dụng để tạo ra các hành vi phản ứng nhanh, thích ứng hoặc thông minh chủ yếu ở các nhân vật không phải người chơi [NPC] tương tự như trí thông minh giống con người.

Chủ Đề