Команда российских ученых заняла первое место на одном из треков международного соревнования MindGames Arena, направленного на оценку стратегических навыков систем искусственного интеллекта. Разработанная исследователями модель победила в двух категориях — среди компактных открытых систем и в абсолютном зачете без ограничений. Об этом сообщает ТАСС.
Узнайте больше в полной версии ➞«В обеих категориях модель заняла первое место, среди соперников были агенты на базе как открытых, так и проприетарных систем, в том числе значительно более крупных. Это показывает, что продуманная архитектура, обучение с подкреплением и устойчивые стратегии позволяют относительно небольшой модели конкурировать с проприетарными решениями», — заявил ведущий научный сотрудник AIRI Илья Макаров.
Соревнование проходило в рамках конференции NeurIPS, одного из крупнейших ежегодных международных форумов в области развития искусственного интеллекта. Организаторы оценивали способность ИИ-агентов кооперироваться, распознавать обман, планировать многоходовые действия и предугадывать намерения других участников. Команды соревновались в трех стратегических играх: в первой модели угадывали слова и размещали их на игровом поле, во второй распределяли войска на нескольких участках, в третьей решали вариант «Дилеммы заключенного» для трех игроков, выстраивая альянсы и выявляя недобросовестные ходы соперников.
По словам Макарова, российская команда, в которую вошли ученые из Института AIRI, Университета Иннополис и стартапа Coframe, добилась победы в треке, направленном на оценку способности ИИ к генерализации информации. Исследователи использовали одну модель с восемью миллиардами параметров, что позволило им выиграть обе категории соревнования — среди компактных систем и в абсолютном зачете.
Победа продолжила серию достижений российских участников на конкурсах, проводимых в рамках NeurIPS. Год назад команда вошла в число победителей Concordia Challenge, посвященного созданию универсальных ИИ-ассистентов. Тогда ученые представили архитектуру, способную динамически выбирать наиболее подходящего ИИ-эксперта под конкретную задачу.