Mistral AI Mistral AI Класс: Средний Доступ в РФ: Через посредника

Mistral Medium 3.5

Уверенный эксперт, который выдумывает законы – и звучит убедительно

Платите в 20 раз больше, чем за соседку Gemma 4 31B при одинаковом итоговом балле – 7.19 против 7.20. Единственное оправдание: в аналитике и сценарном планировании Mistral реально силён, но стоит только добавить цифру или закон – и модель начинает выдумывать с профессорским видом.

Место в рейтинге
#23
Общая оценка
6.86/10
Стоимость вопроса
$1.50
за 1M токенов · ≈ 750 стр.
Стоимость ответа
$7.50
за 1M токенов · ≈ 750 стр.

Профиль по 8 категориям

Шкала 0–10. Чем выше — тем лучше модель справилась с задачами

chart
Сильная сторона
Анализ и решения
7.50/10
Слабая сторона
Региональная осведомлённость
5.70/10
Кому подойдёт
  • + Подготовка сценарного анализа и матриц решений для стратегических совещаний – структура ответов близка к экспертному уровню
  • + Скрипты трудных разговоров с командой: увольнение, снижение бонуса, конфликт – здесь модель выдаёт детальные и реалистичные диалоги
  • + Черновики аналитических записок для внутреннего обсуждения, где итоговые факты всё равно проверяются вручную
Кому не подойдёт
  • Любой вопрос по ТК РФ, налогам или трудовым спорам – назовёт несуществующие статьи с интонацией юриста
  • Подготовка материалов для руководства со ссылками на отчёты и исследования – выдумает источники, которых не существует
  • Задачи с жёсткими дедлайнами и конкретными цифрами: перепутает даты, сроки и суммы, не предупредив об этом
Задача из бенчмарка – запустите и сравните
Анализ и решения – 7.50/10

Это реальный промпт из нашего теста. Нажмите «Запустить» – модель ответит прямо здесь, и вы сравните результат с конкурентом.

Вы
Я могу инвестировать 80 000 долларов в автоматизацию [процесса: например, "процесс ежемесячной отчетности"]. Что я знаю: - Текущий процесс занимает 3 человека × 2 дня/месяц = 48 часов/месяц - Автоматизация сократит это до 4 часов/месяц (заявление вендора, не проверено) - Внедрение займет 3 месяца и потребует 20% времени одного разработчика - Риск: Процесс может измениться при следующей реорганизации (по слухам, через 6-12 месяцев) - Команда скептически настроена после неудачного проекта автоматизации в прошлом году Чего я не знаю: - Точная экономия времени (заявления вендоров разнятся) - Скрытые затраты на обслуживание - Влияние на качество данных - Будет ли процесс существовать после реорганизации Пожалуйста: 1. Порекомендуй, стоит ли инвестировать, и если да, то при каких условиях. 2. Предложи, как структурировать пилотный или поэтапный подход. 3. Определи точку безубыточности и срок окупаемости. 4. Порекомендуй, как управлять скептицизмом команды. 5. Предложи критерии принятия решения для раннего закрытия проекта, если он не работает.
Сравниваем:
mistral-medium-3-5 · gemini-3-flash-preview

Одна модель – два результата

эксперимент, 1 700 запусков
Обычный промпт

Выручка упала на 18%, трафик вырос на 12%, средний чек снизился с 8700 до 6200. Что происходит и что делать?

6.8 /10
Структурный промпт

...Формат:

  • § Диагноз (2-3 предложения)
  • § Корневые причины (что + почему + данные)
  • § Рекомендации (действие, результат в цифрах, срок, ответственный)
  • § Чего я не знаю
8.6 /10 +24%

Наивный промпт получает общие советы. Структурный – причинно-следственный анализ с цифрами и сроками.

Подробнее об эксперименте →

Разбор по категориям

Доступность в России

Через OpenRouter

Внимание: региональная специфика

В ходе оценки модель называла несуществующие статьи ТК РФ, путала налоговые ставки и цитировала выдуманные нормативные акты – при этом без малейшей оговорки о неуверенности. Любой вывод о российском праве или регуляторике требует обязательной проверки в первоисточнике.

Статьи по теме

Анализ данных – не вопрос модели

Промпт определяет 70% результата. В модуле «Анализ и решения с AI» – 6 фреймворков анализа с готовыми промптами: от диагностики выручки до root cause analysis.

Смотреть фреймворки →