Neurogen.News

Ленты

ГлавнаяСвежееПопулярноеСообщества

Темы

НовостиГайдыПолезноеВопросы

Участие

Рейтинг авторов
Документы
N.
Войти
Вход и профильПубличная лента доступна сразу, профиль нужен для участия.
ВойтиСоздать профильPremium
Создать профиль и настроить ленту
Документы
  1. Новости
  2. НейроМундиаль 2026: я заставил 10 LLM предсказать чемпиона ЧМ
Новости@Neurogen12 июня 2026 г.НовостьПрактикамРедакционный материал

НейроМундиаль 2026: я заставил 10 LLM предсказать чемпиона ЧМ

Я дал 10 ведущим LLM (GPT-5.5, Gemini 3 Pro, Claude Opus 4.8, DeepSeek, Grok, Qwen, Kimi, GLM, MiniMax и Gemini Flash) один и тот же промпт Дал им реальные группы, реальную сетка, фиксированную дату. И попросил назвать чемпиона, финалистов и группу смерти Половина поставила на Ис

N
@NeurogenПроверенный автор
4 мин 1 0 0
#Telegram#Neurogen

Источник: t.me

НейроМундиаль 2026: я заставил 10 LLM предсказать чемпиона ЧМ
В материале0 комментариев
Что произошлоПочему это важноЧто известно из источниковПрактический выводЕще по теме

Источник: Telegram-канал Neurogen, публикация от 2026-06-12T14:43:21+00:00. Материал расширен в формат лонгрида: добавлен контекст, источники и практические выводы.

Что произошло

Я дал 10 ведущим LLM (GPT-5.5, Gemini 3 Pro, Claude Opus 4.8, DeepSeek, Grok, Qwen, Kimi, GLM, MiniMax и Gemini Flash) один и тот же промпт
Дал им реальные группы, реальную сетка, фиксированную дату. И попросил назвать чемпиона, финалистов и группу смерти
Половина поставила на Испанию, но самое интересное не это
Аргентину в финал или топ-3 засунули 9 из 10 нейросетей
А вот группой смерти 7 из 10 назвали группу I (Франция, Сенегал, Норвегия, Ирак) тут консенсус почти полный
Я собрал все ответы на отдельный сайт с раскладкой по каждой модели, полными разборами и дашбордом консенсуса
👉 https://rzaev77.github.io/neuromundial-2026/
тут на сайте вы можете почитать сам промпт и полный разбор от каждой модели
Финал — 19 июля. После него сделаю вскрытие кто из ии оказался правым, а кто сел в лужу 😏
🚨 Сразу говорю, это не значит что надо идти и заряжать родительскую квартиру на Испанию

Почему это важно

Эта новость отражает общий сдвиг рынка ИИ: модели и инструменты становятся более специализированными, быстрее переходят из лабораторных анонсов в API и локальные сборки, а конкуренция всё чаще идёт не только по бенчмаркам, но и по реальным сценариям: кодинг, мультимодальность, генерация медиа, голос, агенты и стоимость инференса.

Для пользователей Neurogen это важно в прикладном смысле: такие релизы влияют на выбор моделей для разработки, контента, автоматизации, локального запуска и коммерческих продуктов. Поэтому ключевой вопрос не только в том, кто показал лучший score, а в том, где инструмент уже можно проверить, сколько он стоит, какие ограничения есть и насколько он устойчив в длинных задачах.

Что известно из источников

  • НейроМундиаль 2026 — кто из ИИ угадает чемпиона? | Neurogen — 10 ведущих нейросетей предсказали победителя ЧМ по футболу 2026. Один промпт — все топовые LLM. Эксперимент от Neurogen.

Практический вывод

Если речь идёт о модели или API, её стоит оценивать по трём параметрам: качество на ваших задачах, стабильность в длинной сессии и итоговая цена одной полезной операции. Если речь о генерации медиа или голосе, дополнительно важны права использования, скорость, локальный запуск, качество русского языка и повторяемость результата.

Медиа из Telegram

Медиа к новости НейроМундиаль 2026: я заставил 10 LLM предсказать чемпиона ЧМ
Медиа из публикации Neurogen в Telegram
Медиа к новости НейроМундиаль 2026: я заставил 10 LLM предсказать чемпиона ЧМ
Медиа из публикации Neurogen в Telegram

Оригинальная публикация в Telegram

Обсуждение

Обсуждение начнется с первого вопроса или полезного дополнения.

Обсуждение еще не началось

После входа можно будет задать вопрос автору или ответить другим читателям.

Дальше по теме

Еще несколько материалов из этого раздела.

Новость, 0 комментариевGLM-5.2Обновка подъехала, китайский опенсорс кодер, долгие сессии кодинга, авто ресерч и тд. подобрался к Claude Opus 4.8 в плотную Контекст 1М токенов, тренировали модель специально под длинноконтекстные кодинг сценарии Появились уровни thinking effort (включая Max) можно балансироватьНовость, 0 комментариевКак вам новость, что Антропики в июле введут подтверждение личности по паспорту и селфи?С 8 июля компания может потребовать подтверждения возраста или личности пользователя под предлогом повышения уровня безопасности Если не подтвердил личность, обрубают доступ к моделямНовость, 0 комментариевGLM-5.2Обновился китайский флагман для кодинга, пока только анонс, сам релиз на следующей неделе, сейчас в coding plan доступно Модель будет доступна всем тарифам, контекстное окно 1млн токенов, максимальный вывод 131 072 токенов, high и max рассуждения, ну и улучшенный кодинг агентскиеНовость, 0 комментариевДоступ к Fable 5 закрыт не американцамMythos 5 и Fable 5 экстренно отключены по требованию правительства США для всех не граждан Америки Официальной версии нет, но все, включая антропиков говорят о джайлбрейке благодаря которому модели ищут уязвимости в любых базах Антропики с этим решением не согласны и обещают как
N
@Neurogen

Проверенный автор

Проверенный автор0 кармыРедакционный материал

Реакции

Реакций пока нет

Навигация

Что произошлоH2Почему это важноH2Что известно из источниковH2Практический выводH2Медиа из TelegramH2Комментарии 0

Еще почитать

GLM-5.20 комментариевКак вам новость, что Антропики в июле введут подтверждение личности по паспорту и селфи?0 комментариевGLM-5.20 комментариев