Если вы хоть раз пользовались ChatGPT, Claude или Gemini, вы знаете эту боль: открываете новый чат, начинаете писать — и сначала минут пять объясняете модели, кто вы, над чем работаете и о чём вы вчера разговаривали. Каждый раз заново. Модель умнее любого справочника, но память у неё короче, чем у золотой рыбки в анекдоте.
EPIHEN решает именно эту проблему. Это AI-агент, построенный вокруг идеи, что память должна переживать сессии — и переживать не как смутное воспоминание, а как структурированное знание, которое агент может использовать в любой момент. Плюс к этому — изоляция проектов, автоматическая маршрутизация запросов между разными моделями и встроенные инструменты от поиска в интернете до выполнения SSH-команд. В этой статье разберём что это всё значит на практике и кому может быть полезно.
Чем EPIHEN отличается от обычного чата с LLM
Обычный чат с большой языковой моделью — это stateless-разговор. Внутри одного диалогового окна модель помнит всё, что вы написали; закрываете вкладку — и память исчезает. В следующий раз вы либо начинаете с нуля, либо вручную копируете куски прошлого разговора, чтобы напомнить.
В EPIHEN работа устроена иначе. Каждое сообщение проходит через четырёхслойную систему памяти, которая решает, что стоит запомнить и в каком виде. Когда вы возвращаетесь через неделю и спрашиваете «помнишь, мы обсуждали миграцию базы данных?» — агент действительно помнит. Не потому, что у него феноменальная контекстная память, а потому что суть прошлых обсуждений была заранее извлечена и сохранена.
Это меняет тип задач, которые можно поручать AI. Разовые вопросы вроде «переведи этот абзац» и обычный ChatGPT решает отлично. А вот «веди со мной проект архитектуры API в течение трёх недель» — задача уже совсем другого класса. Контекст накапливается, решения связаны между собой, нельзя каждый день начинать с пустого листа.
Четыре слоя памяти
Внутри EPIHEN живут четыре независимых слоя памяти, каждый со своей логикой работы. Подробно мы разбираем их в отдельной статье, здесь — короткое описание.
Кратковременная память — это текущий разговор. Технически она почти не отличается от привычного чата: всё, что вы написали в этой сессии, остаётся в окне контекста.
Оперативная память хранит факты в пределах одного чата. Если вы упомянули «меня зовут Аня, я backend-разработчик», эта информация попадает в оперативную память и будет доступна агенту в любом дальнейшем сообщении этого чата, даже если первое сообщение «вылетит» из окна контекста.
Долговременная память — главная фишка EPIHEN. Это база знаний, которая хранится между всеми сессиями и проектами пользователя. Сюда попадают факты о вас как личности (профессия, интересы, стиль работы), важные решения, ваши предпочтения. Агент пишет туда не каждое слово, а только то, что прошло порог «достойно запоминания» — иначе база раздулась бы до неюзабельного состояния.
Проектная память — изолированный слой для каждого проекта. О ней дальше.
Изоляция проектов: зачем разделять работу и личное
Представьте, что вы используете один и тот же чат и для рабочих задач (код, дедлайны, договоры с заказчиками), и для личного (диета, путешествия, советы по отношениям). В обычном LLM-чате эти контексты смешиваются: агент может в рабочем разговоре про API случайно упомянуть, что вы на диете, или наоборот в личном чате выдать кусок NDA по работе.
В EPIHEN есть концепция проектов. Каждый проект — это отдельная зона памяти, отдельный набор инструментов, отдельный набор знаний. Чат, открытый в проекте «Работа», не видит ни одного факта из проекта «Личное», даже если оба проекта принадлежат одному пользователю.
Это даёт два важных эффекта. Первый — приватность: чувствительные данные одного проекта физически не утекают в другой. Второй — фокусировка: агент не «шумит» лишним контекстом и даёт более релевантные ответы. Если вы в проекте «Marketing» спросили «дай идеи для лендинга», агент не будет тянуть знания из проекта «DevOps» — ему есть на что опереться внутри текущего проекта.
Маршрутизация между моделями: правильная модель под правильную задачу
Сегодня нет одной идеальной AI-модели. Есть как минимум пять-семь сильных игроков, и каждый лучше других в чём-то своём. Claude 4.7 Opus — топ по сложному коду и архитектурным решениям, но в пять раз дороже Sonnet. GPT-5.5 хорош на формальных текстах и презентациях. Gemini 2.5 Pro единственный реально работает с двумя миллионами токенов контекста. DeepSeek R1 даёт reasoning почти на уровне Opus, но в семьдесят раз дешевле.
EPIHEN не заставляет вас выбирать модель вручную. По умолчанию работает автомаршрутизация: для каждого запроса агент анализирует тип задачи и выбирает оптимальную модель. Короткий вопрос → быстрая и дешёвая Haiku. Сложная архитектурная задача → Opus. Анализ длинного PDF → Gemini. Бытовое рассуждение → R1 или Sonnet.
Вы можете и явно выбрать модель — если знаете, что хотите конкретно Opus, например для критичного решения. Но в большинстве случаев маршрутизатор справляется лучше, чем человек, который не следит за бенчмарками каждый день.
Подробнее про модели — в обзоре бенчмарков 2026 года и в разборе когда брать Opus, а когда Sonnet.
Sub-agents: когда главный агент делегирует задачи
Иногда задача слишком большая или слишком разнородная, чтобы её решать одним «прогоном» модели. Например: «проанализируй три репозитория, найди в них типовые баги и сделай отчёт». Это три отдельные подзадачи плюс синтез.
EPIHEN умеет делегировать. Главный агент может вызвать sub-agent с другой моделью и другим контекстом — например, отправить Haiku разбираться с первым репозиторием, Sonnet — со вторым, R1 — синтезировать общий отчёт. Каждый sub-agent работает изолированно, не видит лишнего и возвращает результат главному агенту. Это и быстрее (параллелизм), и дешевле (правильные модели под правильные подзадачи).
Подробнее про это — в статье про sub-agents.
Инструменты: всё внутри одного диалога
Чистая LLM умеет только генерировать текст. EPIHEN — полноценный агент, у которого есть набор реальных инструментов:
- Поиск в интернете — не только Google-style выдача, но и глубокое чтение страниц с пониманием контекста.
- Генерация изображений — через интегрированные модели вроде Imagen и аналогов.
- Исполнение Python-кода в изолированной среде — посчитать, отрисовать график, обработать данные.
- SSH-доступ к вашим серверам, если вы сохранили connection. Агент может зайти, посмотреть логи, выполнить команду.
- Работа с документами — читать PDF, DOCX, XLSX, генерировать собственные.
- Marketplace search — найти товар на Wildberries, Ozon или Yandex Market по описанию или фото.
Главное — все эти инструменты работают внутри одного диалога. Вы не переключаетесь между разными приложениями. Вы пишете «найди мне новые наушники до 5000 рублей с шумодавом», и агент сам идёт в маркетплейсы, фильтрует, возвращает вам три-четыре подходящих варианта со ссылками и ценами.
Кому это нужно
EPIHEN — не для каждого случая. Если вам нужно один раз перевести абзац или придумать пять заголовков для поста — обычного бесплатного ChatGPT хватит за глаза.
EPIHEN имеет смысл, когда:
- Вы используете AI системно, не разово — каждый день или почти каждый день.
- У вас параллельно идут несколько проектов, и смешивать их контексты не хочется.
- Вы хотите, чтобы агент со временем «узнавал» вас и работал лучше — не повторяя одни и те же вопросы про контекст.
- Вам нужны не только тексты, но и реальные действия: поиск, код, SSH, документы.
- Вы готовы платить за качество — но не хотите подписываться отдельно на ChatGPT Plus, Claude Pro, Gemini Advanced и DeepSeek API. EPIHEN даёт доступ ко всем моделям через одну подписку.
Что дальше
Это была общая картина. В следующих статьях разбираем по частям:
- Как устроены четыре слоя памяти.
- Как работает изоляция проектов.
- Когда вызывать sub-agents и какую модель выбирать для делегирования.
- Сравнения отдельных моделей — Opus vs Sonnet, бенчмарки 2026, DeepSeek R1, Gemini long-context.
Если есть конкретные вопросы по продукту — пишите в support, отвечаем без бота.