Теперь ИИ могут сражаться друг с другом в реальном времени в рамках проекта LLM Skirmish

631
1
Теперь ИИ могут сражаться друг с другом в реальном времени в рамках проекта LLM Skirmish

Разработчик Кай Макфитерс представил LLM Skirmish — бенчмарк для тестирования больших языковых моделей (LLM) в формате сражений в стратегиях реального времени. В рамках проекта ИИ‑модели управляют юнитами с помощью кода — концепция вдохновлена десятилетней игрой Screeps, MMO‑стратегией для программистов, где участники пишут стратегии на JavaScript, а те исполняются в игровом окружении в реальном времени.

Каждый матч в LLM Skirmish стартует с одинаковой позиции: у участников есть база («спавн»), один боевой юнит и три экономических. Основная задача — уничтожить базу противника. Если за 2 000 игровых кадров этого не произошло, победитель определяется по очкам.

Турнир состоит из пяти раундов. После каждого этапа модели получают доступ к результатам предыдущих матчей — это позволяет им корректировать стратегию и демонстрирует способность ИИ к обучению в контексте.

Как отметил сам Макфитерс на Hacker News, его мотивировал парадокс современных нейросетей: передовые модели способны с ходу создавать полноценные программы, но не могут пройти базовые задачи в Pokémon Red. В LLM Skirmish ключевой навык нынешнего поколения ИИ — написание кода — становится центральным элементом соревнования.

Другие публикации по теме
Китай делает ставку на ИИ и 6G — Си Цзиньпин представил новый пятилетний план
Китай делает ставку на ИИ и 6G — Си Цзиньпин представил новый пятилетний план
Председатель КНР Си Цзиньпин представил новый пятилетний план развития страны на заседании Всекитайское собрание народных представителей. Документ определяет стратегию технологического развития Китая на ближайшие годы.
Сегодня в 19:20
129
0
Форум
Anthropic подаст в суд на правительство США после запрета со стороны Пентагона
Anthropic подаст в суд на правительство США после запрета со стороны Пентагона
ИИ-стартап Anthropic намерен подать в суд на правительство США после решения Министерства обороны включить компанию в список организаций, представляющих риск для цепочки поставок. Такой статус запрещает Пентагону и его подрядчикам использовать технологии компании.
Вчера в 18:30
367
3
Форум
Новая версия GPT-5.4 сможет управлять вашим компьютером
Новая версия GPT-5.4 сможет управлять вашим компьютером
Компания OpenAI анонсировала новую флагманскую модель GPT-5.4. Главной особенностью стала возможность напрямую взаимодействовать с компьютером — нейросеть может «видеть» экран через скриншоты и выполнять действия с помощью виртуальных мыши и клавиатуры.
Вчера в 14:36
553
3
Форум