IBM Granite: семействo open-weights LLM

IBM Granite: исследование семейства open-weights LLM (3B–32B), метрик, архитектуры, рынка и резонанса (октябрь 2024)

Оглавление

1. Конкретные метрики и цифры

В рамках исследования семейства моделей Granite были представлены некоторые ключевые метрики и цифры:

  • Размеры и параметры моделей: объявлены Granite Micro (3B/3B), Granite Tiny (7B/1B), Granite Small (32B/9B активных параметров).
  • Бенчмарки (AI Analysis Index):
    • Granite Small: 28 баллов.
    • Granite Micro: 16 баллов.
  • Токенная эффективность: Granite Small – 5.2M токенов на одну задачу, Granite Micro – 6.7M.
  • Контекстное окно: все новые Granite поддерживают до 128 000 токенов в промпте.
  • Объём данных для обучения: обучение на 85 млн PDF-файлов и 26 млн синтетических пар «вопрос–ответ».
  • Доступность моделей: Granite Small доступна на Replicate, все модели выложены на Hugging Face.

2. Технические детали (архитектура, спецификации, API)

Архитектура: Granite — авторегрессионные трансформеры с только декодирующей частью.

  • Ветви и разновидности: General purpose, специализированные Guardian и Mixture-of-Experts.
  • Multimodal: Granite VLM — поддержка анализа изображений и документов.
  • Speeds optimized: присутствуют модели с ускорением inference.

Контекст: 128K токенов.

  • API и интеграции: доступны весовые файлы, open API через IBM watsonx.ai.
  • Лицензия: Apache 2.0.

3. Экспертные мнения и аналитика

IBM: «Модели Granite могут превзойти или сравниться с аналогами от ведущих поставщиков».

  • Российское ИТ-сообщество: отмечает уникальный баланс между открытостью и оптимизациями.
  • Международные платформы: на Reddit Granite названы «недооценёнными альтернативами».
  • Аналитики: Granite называются «first truly open, scalable LLM family from a major enterprise vendor».

4. Практические кейсы и внедрения

Документооборот и юриспруденция: применение Granite VLM для автоматизации ввода и анализа документов.

  • Организационный ассистент: интеграция в виртуальных помощниках.
  • Healthcare: использование для конфиденциальных задач.
  • Разработка ПО: Granite Code models тестируются на задачи GitHub Copilot.

5. Рыночный контекст: конкуренты, ценообразование, доля рынка

Модель Размер (B) Ядро лицензии Бенч AI Index Базовая цена Где доступна Специализация
Granite Small 32/9 Apache 2.0 28 $X*/1M токенов Replicate, HF Enterprise, OCR, QA
Gemma 27B 27 Semi-Open (G) 22 NDA GCP, HF General
Mistral Small ~10–30 Apache 2.0 29 ~$X HF, Ollama Reasoning
Qwen3 30B 30 Apache 2.0[CC] 37 ~$X HF Multilingual, Reasoning
Llama-3 8B/70B 8/70 Meta Custom ~20/42 NDA HF, Ollama General

Доля рынка: Granite быстро завоёвывает сектор enterprise-LLM за счет лицензии.

6. Временная линия (кратко)

  • Сентябрь 2023: первый релиз Granite (13B).
  • Май 2024: публикация Granite Code (от 3 до 34B).
  • Осень 2024: Granite 3.0/3.2 — open-weight LLM.
  • Q4 2024–2025: выход на рынок через Red Hat RHEL AI 1.5.

7. Социальный резонанс: обсуждения, критика, ожидания

  • Reddit: Granite Micro отмечают как «удивительно быстрый запуск».
  • Habrahabr: разработчики позитивно оценивают open-weight-подход.
  • Профессиональные сообщества: основная похвала — «честное лицензирование, широкий выбор нагрузок».
  • Международные обзоры: Granite 3.0/3.2 называют новым стандартом enterprise open-weight.
  • Критика: недостаток «reasoning»-метрик.