IBM Granite: семействo open-weights LLM

IBM Granite: исследование семейства open-weights LLM (3B–32B), метрик, архитектуры, рынка и резонанса (октябрь 2024)

В рамках исследования семейства моделей Granite были представлены некоторые ключевые метрики и цифры:

Размеры и параметры моделей: объявлены Granite Micro (3B/3B), Granite Tiny (7B/1B), Granite Small (32B/9B активных параметров).
Бенчмарки (AI Analysis Index):
- Granite Small: 28 баллов.
- Granite Micro: 16 баллов.
Токенная эффективность: Granite Small – 5.2M токенов на одну задачу, Granite Micro – 6.7M.
Контекстное окно: все новые Granite поддерживают до 128 000 токенов в промпте.
Объём данных для обучения: обучение на 85 млн PDF-файлов и 26 млн синтетических пар «вопрос–ответ».
Доступность моделей: Granite Small доступна на Replicate, все модели выложены на Hugging Face.

Архитектура: Granite — авторегрессионные трансформеры с только декодирующей частью.

Ветви и разновидности: General purpose, специализированные Guardian и Mixture-of-Experts.
Multimodal: Granite VLM — поддержка анализа изображений и документов.
Speeds optimized: присутствуют модели с ускорением inference.

Контекст: 128K токенов.

IBM: «Модели Granite могут превзойти или сравниться с аналогами от ведущих поставщиков».

Российское ИТ-сообщество: отмечает уникальный баланс между открытостью и оптимизациями.
Международные платформы: на Reddit Granite названы «недооценёнными альтернативами».
Аналитики: Granite называются «first truly open, scalable LLM family from a major enterprise vendor».

Документооборот и юриспруденция: применение Granite VLM для автоматизации ввода и анализа документов.

Модель	Размер (B)	Ядро лицензии	Бенч AI Index	Базовая цена	Где доступна	Специализация
Granite Small	32/9	Apache 2.0	28	$X*/1M токенов	Replicate, HF	Enterprise, OCR, QA
Gemma 27B	27	Semi-Open (G)	22	NDA	GCP, HF	General
Mistral Small	~10–30	Apache 2.0	29	~$X	HF, Ollama	Reasoning
Qwen3 30B	30	Apache 2.0[CC]	37	~$X	HF	Multilingual, Reasoning
Llama-3 8B/70B	8/70	Meta Custom	~20/42	NDA	HF, Ollama	General

Доля рынка: Granite быстро завоёвывает сектор enterprise-LLM за счет лицензии.

Reddit: Granite Micro отмечают как «удивительно быстрый запуск».
Habrahabr: разработчики позитивно оценивают open-weight-подход.
Профессиональные сообщества: основная похвала — «честное лицензирование, широкий выбор нагрузок».
Международные обзоры: Granite 3.0/3.2 называют новым стандартом enterprise open-weight.
Критика: недостаток «reasoning»-метрик.