Neurogen.News

Ленты

ГлавнаяСвежееПопулярноеСообщества

Темы

НовостиГайдыПолезноеВопросы

Участие

Рейтинг авторов
Документы
N.
Войти
Вход и профильПубличная лента доступна сразу, профиль нужен для участия.
ВойтиСоздать профильPremium
Создать профиль и настроить ленту
Документы
  1. Изображения
  2. Microsoft Lens как обучить SOTA text-to-image в 3.8B параметров и не сжечь дата-центр
Изображения@muzaffar26 мая 2026 г.НовостьПрактикамРедакционный материал

Microsoft Lens как обучить SOTA text-to-image в 3.8B параметров и не сжечь дата-центр

Microsoft Research выкатили text-to-image модель в ответ на гонку 12B+ диффузионок. Генерирует в нативном 1440x1440 при 3.8В параметров Цензура очень слабая, можно сказать нету Собственный корпус у нее состоит из 800М пар (картинка + длинная подпись от GPT-4.1), внутри также энко

M
@muzaffarПроверенный автор
4 мин 0 0 0
#Telegram#Neurogen

Источник: t.me

Microsoft Lens как обучить SOTA text-to-image в 3.8B параметров и не сжечь дата-центр
В материале0 комментариев
Что произошлоПочему это важноЧто известно из источниковПрактический выводЕще по теме

Источник: Telegram-канал Neurogen, публикация от 2026-05-26T06:27:45+00:00. Материал расширен в формат лонгрида: добавлен контекст, источники и практические выводы.

Что произошло

Microsoft Research выкатили text-to-image модель в ответ на гонку 12B+ диффузионок. Генерирует в нативном 1440x1440 при 3.8В параметров
Цензура очень слабая, можно сказать нету
Собственный корпус у нее состоит из 800М пар (картинка + длинная подпись от GPT-4.1), внутри также энкодер GPT-OSS, FLUX.2 semantic VAE для латентов с семантикой и еще пару фишек
Каждая картинка приходит с длинным описанием от GPT-4.1, это увеличивает полезный сигнал на токен в разы по сравнению с шумными alt-тегами LAION-эпохи
Сильные стороны читаемый текст внутри картинки, фотореалистичная макросъёмка и сложные сцены с массой объектов
🔘Три чекпоинта
- Lens — основной, RL-tuned, 20 шагов, CFG 5.0
- Lens-Turbo — дистиллят, 4 шага, CFG 1.0
- Lens-Base — голый supervised, 50 шагов
Попробовать - принимает нецензурные промпты
HuggingFace
Github

Почему это важно

Эта новость отражает общий сдвиг рынка ИИ: модели и инструменты становятся более специализированными, быстрее переходят из лабораторных анонсов в API и локальные сборки, а конкуренция всё чаще идёт не только по бенчмаркам, но и по реальным сценариям: кодинг, мультимодальность, генерация медиа, голос, агенты и стоимость инференса.

Для пользователей Neurogen это важно в прикладном смысле: такие релизы влияют на выбор моделей для разработки, контента, автоматизации, локального запуска и коммерческих продуктов. Поэтому ключевой вопрос не только в том, кто показал лучший score, а в том, где инструмент уже можно проверить, сколько он стоит, какие ограничения есть и насколько он устойчив в длинных задачах.

Что известно из источников

  • Lens - a Hugging Face Space by multimodalart — This app lets you type a description and creates a matching picture using Microsoft’s Lens or Lens‑Turbo text‑to‑image models. You can choose resolution, aspect ratio, number of steps, guidance str...
  • microsoft/Lens · Hugging Face — We’re on a journey to advance and democratize artificial intelligence through open source and open science.
  • GitHub - microsoft/Lens: Lens is a 3.8B-parameter text-to-image diffusion model that achieves quality competitive with and in several cases surpassing models like FLUX and SD3, whi — Lens is a 3.8B-parameter text-to-image diffusion model that achieves quality competitive with and in several cases surpassing models like FLUX and SD3, while requiring significantly less training compute. Key ideas include maximizing data information density per batch and accelerating convergence. - GitHub - microsoft/

Практический вывод

Если речь идёт о модели или API, её стоит оценивать по трём параметрам: качество на ваших задачах, стабильность в длинной сессии и итоговая цена одной полезной операции. Если речь о генерации медиа или голосе, дополнительно важны права использования, скорость, локальный запуск, качество русского языка и повторяемость результата.

Медиа из Telegram

Оригинальная публикация в Telegram

Обсуждение

Обсуждение начнется с первого вопроса или полезного дополнения.

Обсуждение еще не началось

После входа можно будет задать вопрос автору или ответить другим читателям.

Дальше по теме

Еще несколько материалов из этого раздела.

Новость, 0 комментариевIdeogram 4.0Первая open-weight модель от Ideogram, их линейка давно лидирует в рендеринге текста на изображениях и 4.0 поднимает планку ещё выше Не дообучение существующей модели, а полностью новая foundation-модель, обученная с нуля на 9.3 миллиарда параметров Впервые на моей памяти можно уНовость, 0 комментариевGrok Imagine 1Grok Imagine 1.5 Крупное обновление генератора видео от Маска, новый имейджн мгновенно занял #1 место на img2vid Arena, обогнав ByteDance Seedance 2.0, Alibaba HappyHorse и Google Veo. Прирост рейтинга +52 Elo относительно версии 1.0 Проапгрейдили аудио…Новость, 0 комментариевGemini Omni В Gemini засветилась новая модель Gemini Omni в интерфейсе нашли строки "Powered by Omni” и “CreaGemini Omni В Gemini засветилась новая модель Gemini Omni в интерфейсе нашли строки "Powered by Omni” и “Create with Gemini Omni”. По описанию, она умеет генерировать видео, ремиксить видео, редактировать их прямо в чате и запускать шаблоны Если утечка подтвердится…Пост, 0 комментариевОтзыв остриса, того самого помешанного психа на создании лор для генераторов, о новой HiDream-O1Сама рецензия от него крайне положительная, значит что скоро моделька появится в AI Toolkit и можно будет хорошенько запастись качественными лорами для нее Ждем с нетерпением, уверен с лорами она будет хороша
M
@muzaffar

Проверенный автор

Проверенный автор0 кармыРедакционный материал

Реакции

Реакций пока нет

Навигация

Что произошлоH2Почему это важноH2Что известно из источниковH2Практический выводH2Медиа из TelegramH2Комментарии 0

Еще почитать

Ideogram 4.00 комментариевGrok Imagine 10 комментариевGemini Omni В Gemini засветилась новая модель Gemini Omni в интерфейсе нашли строки "Powered by Omni” и “Crea0 комментариев
ООО "Эмпатра"ИНН 3849110584ОГРН 125380001637018+

Документы

  • Юридические документы
  • Правила пользования
  • Персональные данные
  • Согласие на обработку ПДн
  • Cookies
  • Условия Premium
  • Реквизиты

Правила

  • Правила площадки
  • Регламент модерации
  • Рекомендательные технологии
  • Редакционная политика
  • Авторские права

Контакты

  • work@empatra.ai
  • Полные реквизиты

Мы используем cookies и похожие технологии для входа, безопасности, работы интерфейса и аналитики. Обязательные cookies нужны для корректной работы сайта. Подробнее — в Политике cookies.

Подробнее