Sber Sber Класс: Слабый Доступ в РФ: Доступен

GigaChat 2 Max

Российская модель с худшим знанием российских законов

GigaChat 2 Max занимает последнее место из 26 моделей – и стоит при этом в девять раз дороже Alice AI ($7.22 против $0.8 за миллион токенов), уступая Яндексу по всем восьми категориям. Галлюцинирует статьи ТК РФ и налоговые ставки. Брать не за что.

Место в рейтинге
#29
Общая оценка
4.20/10
Стоимость вопроса
$7.22
за 1M токенов · ≈ 750 стр.
Стоимость ответа
$7.22
за 1M токенов · ≈ 750 стр.

Профиль по 8 категориям

Шкала 0–10. Чем выше — тем лучше модель справилась с задачами

chart
Сильная сторона
Коммуникации
4.74/10
Слабая сторона
Региональная осведомлённость
3.57/10
Кому подойдёт
  • + Если служба безопасности запрещает иностранные сервисы и согласован только Sber – единственный аргумент для выбора
  • + Черновики внутренних документов без цифр: структура писем читаемая, если всё равно будет редактор-человек
  • + Мозговой штурм на уровне «набросать темы» – без расчётов, дат и ссылок на нормативку
Кому не подойдёт
  • Любые юридические и налоговые задачи: модель выдумывает номера статей, суммы штрафов и нормы – проверять дороже, чем сделать самому
  • Анализ данных и рекомендации: игнорирует цифры из условия и перефразирует задачу обратно в виде «рекомендаций»
  • Поиск актуальных цен, ссылок и исследований: галлюцинирует источники, которых не существует
Задача из бенчмарка – запустите и сравните
Коммуникации – 4.74/10

Это реальный промпт из нашего теста. Нажмите «Запустить» – модель ответит прямо здесь, и вы сравните результат с конкурентом.

Вы
Я приложил наши данные о продажах за 4 квартал 2025 года с разбивкой по регионам, категориям продуктов и торговым представителям. Я заметил, что выручка упала на 12% по сравнению с 3 кварталом, но не уверен почему. Пожалуйста, проанализируй эти данные и: 1. Оредели коренные причины падения выручки. 2. Выдели любые тревожные тренды или паттерны. 3. Сравни эффективность по регионам и продуктам. 4. Дай 3-5 конкретных, действенных рекомендаций. 5. Предложи, какие дополнительные данные мне стоит собрать. Данные: sale_id,sale_date,region,product_category,sales_rep,revenue,units_sold,customer_type S001,2025-10-03,North,Software,Rep_A,12500,5,Enterprise S002,2025-10-05,South,Hardware,Rep_B,3200,8,SMB S003,2025-10-07,East,Services,Rep_C,8900,3,Mid-Market S004,2025-10-09,West,Software,Rep_A,15600,6,Enterprise S005,2025-10-11,North,Consulting,Rep_D,4200,2,SMB S006,2025-10-13,South,Software,Rep_B,9800,4,Mid-Market S007,2025-10-15,East,Hardware,Rep_C,5400,12,SMB S008,2025-10-17,West,Services,Rep_D,3100,2,SMB S009,2025-10-19,North,Software,Rep_A,18900,7,Enterprise S010,2025-10-21,South,Services,Rep_B,2800,1,SMB S011,2025-10-23,East,Software,Rep_C,11200,5,Mid-Market S012,2025-10-25,West,Hardware,Rep_A,6700,15,SMB S013,2025-10-27,North,Consulting,Rep_D,3900,2,Mid-Market S014,2025-10-29,South,Software,Rep_B,7600,3,Enterprise S015,2025-10-31,East,Services,Rep_C,2400,1,SMB S016,2025-11-02,West,Software,Rep_A,14300,6,Enterprise S017,2025-11-04,North,Hardware,Rep_D,4100,9,SMB S018,2025-11-06,South,Services,Rep_B,1900,1,SMB S019,2025-11-08,East,Software,Rep_C,9500,4,Mid-Market S020,2025-11-10,West,Consulting,Rep_A,8200,3,Enterprise S021,2025-11-12,North,Software,Rep_D,10800,5,Mid-Market S022,2025-11-14,South,Hardware,Rep_B,2300,6,SMB S023,2025-11-16,East,Services,Rep_C,1800,1,SMB S024,2025-11-18,West,Software,Rep_A,16700,7,Enterprise S025,2025-11-20,North,Services,Rep_D,2100,1,SMB S026,2025-11-22,South,Software,Rep_B,6900,3,Mid-Market S027,2025-11-24,East,Hardware,Rep_C,4800,11,SMB S028,2025-11-26,West,Consulting,Rep_A,9100,4,Enterprise S029,2025-11-28,North,Software,Rep_D,8700,4,Mid-Market S030,2025-11-30,South,Services,Rep_B,1600,1,SMB S031,2025-12-02,East,Software,Rep_C,12400,5,Enterprise S032,2025-12-04,West,Hardware,Rep_A,5900,13,SMB S033,2025-12-06,North,Consulting,Rep_D,3400,2,SMB S034,2025-12-08,South,Software,Rep_B,5200,2,Mid-Market S035,2025-12-10,East,Services,Rep_C,1400,1,SMB S036,2025-12-12,West,Software,Rep_A,17800,8,Enterprise S037,2025-12-14,North,Hardware,Rep_D,3600,8,SMB S038,2025-12-16,South,Services,Rep_B,1100,1,SMB S039,2025-12-18,East,Software,Rep_C,10100,4,Mid-Market S040,2025-12-20,West,Consulting,Rep_A,7900,3,Enterprise S041,2025-12-22,North,Software,Rep_D,9200,4,Enterprise S042,2025-12-24,South,Hardware,Rep_B,1900,5,SMB S043,2025-12-26,East,Services,Rep_C,1200,1,SMB S044,2025-12-28,West,Software,Rep_A,15200,6,Enterprise S045,2025-12-30,North,Services,Rep_D,1800,1,SMB
Сравниваем:
GigaChat-2-Max

Одна модель – два результата

эксперимент, 1 700 запусков
Обычный промпт

Напиши письмо команде о предстоящих сокращениях 3 из 15 позиций. Не вызвать паники, но честно.

7.0 /10
Структурный промпт

...Структура:

  1. 2) причины
  2. 3) что решено и что нет
  3. 4) сроки и шаги
  4. 5) поддержка
  5. 6) приглашение к разговору. Плюс: чего НЕ должно быть в письме
8.8 /10 +26%

Без структуры модель пишет «мягкое» письмо, которое скрывает факты. С шаблоном – даёт конкретику и честный тон.

Подробнее об эксперименте →

Разбор по категориям

Доступность в России

Доступна напрямую

Внимание: региональная специфика

Самая слабая категория модели (3.51 из 10) – именно региональная специфика. Судьи зафиксировали критические ошибки в налоговых ставках, датах праздников и номерах законов для России, Казахстана и Узбекистана. Парадокс: модель Sber, созданная для российского рынка, знает российское законодательство хуже всех 26 участников рейтинга.

Статьи по теме

Модель не виновата – дело в промпте

Структурный промпт поднимает качество деловых писем на 26% – даже на слабых моделях. В модуле «Коммуникации с AI» – шаблоны для сложных писем: сокращения, конфликты, отказы.

Смотреть шаблоны →