IBM Granite: исследование семейства open-weights LLM (3B–32B), метрик, архитектуры, рынка и резонанса (октябрь 2024)
Оглавление
- Конкретные метрики и цифры
- Технические детали (архитектура, спецификации, API)
- Экспертные мнения и аналитика
- Практические кейсы и внедрения
- Рыночный контекст: конкуренты, ценообразование, доля рынка
- Временная линия (кратко)
- Социальный резонанс: обсуждения, критика, ожидания
1. Конкретные метрики и цифры
В рамках исследования семейства моделей Granite были представлены некоторые ключевые метрики и цифры:
- Размеры и параметры моделей: объявлены Granite Micro (3B/3B), Granite Tiny (7B/1B), Granite Small (32B/9B активных параметров).
- Бенчмарки (AI Analysis Index):
- Granite Small: 28 баллов.
- Granite Micro: 16 баллов.
- Токенная эффективность: Granite Small – 5.2M токенов на одну задачу, Granite Micro – 6.7M.
- Контекстное окно: все новые Granite поддерживают до 128 000 токенов в промпте.
- Объём данных для обучения: обучение на 85 млн PDF-файлов и 26 млн синтетических пар «вопрос–ответ».
- Доступность моделей: Granite Small доступна на Replicate, все модели выложены на Hugging Face.
2. Технические детали (архитектура, спецификации, API)
Архитектура: Granite — авторегрессионные трансформеры с только декодирующей частью.
- Ветви и разновидности: General purpose, специализированные Guardian и Mixture-of-Experts.
- Multimodal: Granite VLM — поддержка анализа изображений и документов.
- Speeds optimized: присутствуют модели с ускорением inference.
Контекст: 128K токенов.
- API и интеграции: доступны весовые файлы, open API через IBM watsonx.ai.
- Лицензия: Apache 2.0.
3. Экспертные мнения и аналитика
IBM: «Модели Granite могут превзойти или сравниться с аналогами от ведущих поставщиков».
- Российское ИТ-сообщество: отмечает уникальный баланс между открытостью и оптимизациями.
- Международные платформы: на Reddit Granite названы «недооценёнными альтернативами».
- Аналитики: Granite называются «first truly open, scalable LLM family from a major enterprise vendor».
4. Практические кейсы и внедрения
Документооборот и юриспруденция: применение Granite VLM для автоматизации ввода и анализа документов.
- Организационный ассистент: интеграция в виртуальных помощниках.
- Healthcare: использование для конфиденциальных задач.
- Разработка ПО: Granite Code models тестируются на задачи GitHub Copilot.
5. Рыночный контекст: конкуренты, ценообразование, доля рынка
| Модель | Размер (B) | Ядро лицензии | Бенч AI Index | Базовая цена | Где доступна | Специализация |
|---|---|---|---|---|---|---|
| Granite Small | 32/9 | Apache 2.0 | 28 | $X*/1M токенов | Replicate, HF | Enterprise, OCR, QA |
| Gemma 27B | 27 | Semi-Open (G) | 22 | NDA | GCP, HF | General |
| Mistral Small | ~10–30 | Apache 2.0 | 29 | ~$X | HF, Ollama | Reasoning |
| Qwen3 30B | 30 | Apache 2.0[CC] | 37 | ~$X | HF | Multilingual, Reasoning |
| Llama-3 8B/70B | 8/70 | Meta Custom | ~20/42 | NDA | HF, Ollama | General |
Доля рынка: Granite быстро завоёвывает сектор enterprise-LLM за счет лицензии.
6. Временная линия (кратко)
- Сентябрь 2023: первый релиз Granite (13B).
- Май 2024: публикация Granite Code (от 3 до 34B).
- Осень 2024: Granite 3.0/3.2 — open-weight LLM.
- Q4 2024–2025: выход на рынок через Red Hat RHEL AI 1.5.
7. Социальный резонанс: обсуждения, критика, ожидания
- Reddit: Granite Micro отмечают как «удивительно быстрый запуск».
- Habrahabr: разработчики позитивно оценивают open-weight-подход.
- Профессиональные сообщества: основная похвала — «честное лицензирование, широкий выбор нагрузок».
- Международные обзоры: Granite 3.0/3.2 называют новым стандартом enterprise open-weight.
- Критика: недостаток «reasoning»-метрик.