Цена DeepSeek R1 — $0.55 за миллион входных токенов и $2.19 за миллион выходных. Для сравнения, GPT-5.5 Pro стоит $15 / $120. Разница в 27 раз по входу и в 55 раз по выходу — в среднем грубо в 70 раз дешевле на типовом запросе. При этом R1 — не урезанная игрушечная модель, а полноценная LLM с reasoning'ом, которая на ряде задач не уступает топ-моделям.
Это слишком хорошо чтобы быть правдой? Не совсем — у R1 есть свои ограничения. Но в правильно подобранных задачах он реально заменяет дорогие модели. Разбираем где работает, а где нет.
Что такое DeepSeek и почему R1 настолько дешёвый
DeepSeek — китайская AI-лаборатория, которая в 2024-2026 годах выпустила несколько моделей, ставших серьёзным конкурентом OpenAI и Anthropic. R1 — их топовая reasoning-модель, специально обученная на цепочках рассуждения.
Главное архитектурное отличие R1 от обычной LLM: модель сначала «думает» — генерирует длинную цепочку chain-of-thought (CoT) — а потом выдаёт финальный ответ. В API это видно как два поля в response: reasoning_content (внутренние рассуждения) и content (финальный ответ). Внутренние рассуждения могут быть в 5-10 раз длиннее самого ответа.
Почему дешёво: открытые веса, мощная оптимизация инференса, дешёвые GPU в Китае, агрессивное ценообразование на завоевание рынка. Это политика DeepSeek — пока непонятно, насколько устойчива в долгосрочной перспективе. На середину 2026 цены такие.
В EPIHEN мы интегрировали R1 как один из доступных sub-agent моделей с алиасом r1. Подробнее про sub-agents — в отдельной статье.
Где R1 справляется отлично
Главное правило: R1 силён там, где задача формализуется и требует пошагового рассуждения. Это включает:
1. Математика и формальная логика
Алгебра, дифференциальные уравнения, теория вероятностей, дискретная математика — R1 решает на уровне топ-моделей. На задачах олимпиадного типа (AMC, AIME) — конкурирует с GPT-5.5 Pro.
Если вы студент или инженер, которому нужно проверить решение или вывести формулу, R1 — самый разумный выбор. Не нужно жечь $5 на Opus, когда $0.10 на R1 даёт тот же результат.
2. Code review с анализом логики
Дайте R1 функцию и спросите: «найди баги, объясни почему именно они баги, предложи фикс». Он разбирает код по шагам, видит edge-cases, иногда замечает то, что Sonnet или GPT-5.5 пропускают.
Особенно силён на алгоритмическом коде — сортировки, поиск, динамическое программирование. На бизнес-логике (CRUD, API endpoints) разница с обычными моделями меньше, но R1 всё равно в порядке.
3. Анализ алгоритмов
«Какая сложность у этого алгоритма?», «как оптимизировать этот запрос к БД?», «здесь race condition?» — все классические алгоритмические вопросы R1 решает хорошо. Цепочка рассуждения видна, что облегчает проверку.
4. Multi-step reasoning в нечётких задачах
«У меня есть три варианта решения проблемы X. Распиши плюсы и минусы каждого, учитывая контекст Y». R1 строит структурированное сравнение, ему помогает явная стадия CoT. Не путается в логике, как иногда делают модели без explicit reasoning.
5. Решение головоломок и логических задач
От Sudoku до парадоксов теории игр. Если задача формально решаема и не требует свежих фактов о мире — R1 справится.
Где R1 проигрывает другим моделям
1. Творческие тексты
Художественная литература, сценарии, посты в стиле «как лучший копирайтер» — R1 пишет суше, штампованнее, без особого стиля. Здесь Claude Opus на голову выше. Если вам нужен живой текст — R1 не для этого.
2. Длинный контекст
Контекстное окно R1 — 128K токенов. Это много для типовых задач, но мало для огромных документов. Если вам нужно прокачать через модель PDF на 500 страниц — Gemini Pro единственная разумная опция.
3. Tool use в агентных сценариях
R1 не имеет нативной поддержки function calling / tool use в том виде, в каком это есть у Claude и GPT. Использовать R1 как «главный агент с инструментами» сложно. Поэтому в EPIHEN R1 работает только как sub-agent (делегированная задача), не как главный агент.
4. Многоязычные задачи кроме английского и китайского
R1 обучен преимущественно на английском и китайском. На русском, испанском, немецком — приличный, но не выдающийся. На редких языках начинает плыть.
5. Время отклика
Из-за длинной reasoning-цепочки R1 отвечает медленно. 10-30 секунд на запрос — обычное дело. На интерактивных задачах (живой чат) это утомляет. Лучше использовать через sub-agent, чтобы главный агент (быстрый Sonnet) делегировал в R1 только тяжёлые подзадачи.
Reasoning-content: что с ним делать
R1 возвращает два поля. reasoning_content — это цепочка мысли модели, обычно длинная, иногда местами рваная (модель «думает вслух»). content — финальный причёсанный ответ.
В EPIHEN мы отдаём пользователю только content. Reasoning не нужен в чате — он засоряет разговор и хуже читается. Но в специальных режимах (debug, образование) есть смысл показать reasoning: видно как модель пришла к ответу, можно проверить корректность.
Биллинг считает оба поля как output-токены, так что reasoning тоже оплачивается. Но даже с учётом этого R1 дешевле всех альтернатив.
Сравнение в цифрах: R1 vs альтернативы
Возьмём типовую задачу: «реши систему из трёх дифференциальных уравнений с начальными условиями». Размеры: ~3K input, ~5K output (включая reasoning у R1).
- R1: $0.55 × 3 + $2.19 × 5 = $0.0017 + $0.0110 = $0.013.
- Claude Opus 4.7: $15 × 3 + $75 × 5 = $0.045 + $0.375 = $0.420.
- GPT-5.5 Pro: $15 × 3 + $120 × 5 = $0.045 + $0.600 = $0.645.
- Claude Sonnet 4.6: $3 × 3 + $15 × 5 = $0.009 + $0.075 = $0.084.
R1 дешевле Opus в 32 раза, дешевле GPT-Pro в 50 раз, дешевле Sonnet в 6 раз. При сопоставимом качестве на математике. Цифры говорят сами за себя.
Безопасность и приватность
Один момент, который часто беспокоит: DeepSeek — китайская компания, и при API-вызовах данные уходят на их сервера. Если вы работаете с чувствительной информацией (NDA, медицинские данные, корпоративные секреты) — стоит знать. По публичным policy DeepSeek данные могут использоваться для дообучения, если явно не отказаться через специальный API-флаг.
В EPIHEN мы устанавливаем флаг «не использовать для тренинга» при всех вызовах R1 — это стандарт в production. Но если ваша compliance-команда категорически против китайских моделей в принципе, можно явно отключить R1 в настройках проекта (для тарифов Pro+).
Кейсы использования из реальных чатов
Кейс 1. Студент готовится к экзамену по теорверу. Раньше он 30 раз в день спрашивал ChatGPT, тратя по $0.05 на запрос — итого $1.50 в день. С R1 — $0.03 в день. Год — экономия $500+.
Кейс 2. Backend-команда делает code review автоматически перед merge. Каждый PR — это ~5000 токенов input + 3000 output. На Sonnet это $0.06 за PR, на R1 — $0.01. При 50 PR в день это разница в $750 в месяц.
Кейс 3. Финансовый аналитик использует R1 для проверки расчётов в моделях. Большая часть его запросов — формальные («докажи что этот вывод следует из этих данных»). На R1 уходит ~$5 в месяц. На Opus это было бы ~$150.
Когда НЕ использовать R1
Просуммируем:
- Если нужны творческие тексты с тоном и стилем.
- Если контент превышает 100K токенов.
- Если задача — управление агентом с инструментами.
- Если приоритет — скорость отклика, не цена.
- Если работаете с критично чувствительными данными и compliance запрещает китайских провайдеров.
В остальных случаях, особенно для рутинных reasoning-задач, R1 — лучший выбор по соотношению цена / качество в 2026 году.
Резюме
DeepSeek R1 — главное открытие 2025-2026 в плане «AI стал дешевле». $0.55 за миллион токенов — это уровень, при котором можно встроить reasoning в каждую внутреннюю процедуру без беспокойства за бюджет. Для математики, формальной логики, code review, анализа алгоритмов — R1 либо равен топ-моделям, либо отстаёт незначительно.
В EPIHEN мы используем R1 как «дешёвого эксперта» для делегирования — главный агент Sonnet или Opus вызывает R1 на reasoning-подзадачи и получает результат за копейки. Это позволяет держать продукт быстрым и относительно дешёвым.
В следующих статьях разбираем Gemini long-context и архитектуру sub-agents.