Что такое EPIHEN: AI-агент с памятью между сессиями

Если вы хоть раз пользовались ChatGPT, Claude или Gemini, вы знаете эту боль: открываете новый чат, начинаете писать — и сначала минут пять объясняете модели, кто вы, над чем работаете и о чём вы вчера разговаривали. Каждый раз заново. Модель умнее любого справочника, но память у неё короче, чем у золотой рыбки в анекдоте.

EPIHEN решает именно эту проблему. Это AI-агент, построенный вокруг идеи, что память должна переживать сессии — и переживать не как смутное воспоминание, а как структурированное знание, которое агент может использовать в любой момент. Плюс к этому — изоляция проектов, автоматическая маршрутизация запросов между разными моделями и встроенные инструменты от поиска в интернете до выполнения SSH-команд. В этой статье разберём что это всё значит на практике и кому может быть полезно.

Чем EPIHEN отличается от обычного чата с LLM

Обычный чат с большой языковой моделью — это stateless-разговор. Внутри одного диалогового окна модель помнит всё, что вы написали; закрываете вкладку — и память исчезает. В следующий раз вы либо начинаете с нуля, либо вручную копируете куски прошлого разговора, чтобы напомнить.

В EPIHEN работа устроена иначе. Каждое сообщение проходит через четырёхслойную систему памяти, которая решает, что стоит запомнить и в каком виде. Когда вы возвращаетесь через неделю и спрашиваете «помнишь, мы обсуждали миграцию базы данных?» — агент действительно помнит. Не потому, что у него феноменальная контекстная память, а потому что суть прошлых обсуждений была заранее извлечена и сохранена.

Это меняет тип задач, которые можно поручать AI. Разовые вопросы вроде «переведи этот абзац» и обычный ChatGPT решает отлично. А вот «веди со мной проект архитектуры API в течение трёх недель» — задача уже совсем другого класса. Контекст накапливается, решения связаны между собой, нельзя каждый день начинать с пустого листа.

Четыре слоя памяти

Внутри EPIHEN живут четыре независимых слоя памяти, каждый со своей логикой работы. Подробно мы разбираем их в отдельной статье, здесь — короткое описание.

Кратковременная память — это текущий разговор. Технически она почти не отличается от привычного чата: всё, что вы написали в этой сессии, остаётся в окне контекста.

Оперативная память хранит факты в пределах одного чата. Если вы упомянули «меня зовут Аня, я backend-разработчик», эта информация попадает в оперативную память и будет доступна агенту в любом дальнейшем сообщении этого чата, даже если первое сообщение «вылетит» из окна контекста.

Долговременная память — главная фишка EPIHEN. Это база знаний, которая хранится между всеми сессиями и проектами пользователя. Сюда попадают факты о вас как личности (профессия, интересы, стиль работы), важные решения, ваши предпочтения. Агент пишет туда не каждое слово, а только то, что прошло порог «достойно запоминания» — иначе база раздулась бы до неюзабельного состояния.

Проектная память — изолированный слой для каждого проекта. О ней дальше.

Изоляция проектов: зачем разделять работу и личное

Представьте, что вы используете один и тот же чат и для рабочих задач (код, дедлайны, договоры с заказчиками), и для личного (диета, путешествия, советы по отношениям). В обычном LLM-чате эти контексты смешиваются: агент может в рабочем разговоре про API случайно упомянуть, что вы на диете, или наоборот в личном чате выдать кусок NDA по работе.

В EPIHEN есть концепция проектов. Каждый проект — это отдельная зона памяти, отдельный набор инструментов, отдельный набор знаний. Чат, открытый в проекте «Работа», не видит ни одного факта из проекта «Личное», даже если оба проекта принадлежат одному пользователю.

Это даёт два важных эффекта. Первый — приватность: чувствительные данные одного проекта физически не утекают в другой. Второй — фокусировка: агент не «шумит» лишним контекстом и даёт более релевантные ответы. Если вы в проекте «Marketing» спросили «дай идеи для лендинга», агент не будет тянуть знания из проекта «DevOps» — ему есть на что опереться внутри текущего проекта.

Маршрутизация между моделями: правильная модель под правильную задачу

Сегодня нет одной идеальной AI-модели. Есть как минимум пять-семь сильных игроков, и каждый лучше других в чём-то своём. Claude 4.7 Opus — топ по сложному коду и архитектурным решениям, но в пять раз дороже Sonnet. GPT-5.5 хорош на формальных текстах и презентациях. Gemini 2.5 Pro единственный реально работает с двумя миллионами токенов контекста. DeepSeek R1 даёт reasoning почти на уровне Opus, но в семьдесят раз дешевле.

EPIHEN не заставляет вас выбирать модель вручную. По умолчанию работает автомаршрутизация: для каждого запроса агент анализирует тип задачи и выбирает оптимальную модель. Короткий вопрос → быстрая и дешёвая Haiku. Сложная архитектурная задача → Opus. Анализ длинного PDF → Gemini. Бытовое рассуждение → R1 или Sonnet.

Вы можете и явно выбрать модель — если знаете, что хотите конкретно Opus, например для критичного решения. Но в большинстве случаев маршрутизатор справляется лучше, чем человек, который не следит за бенчмарками каждый день.

Подробнее про модели — в обзоре бенчмарков 2026 года и в разборе когда брать Opus, а когда Sonnet.

Sub-agents: когда главный агент делегирует задачи

Иногда задача слишком большая или слишком разнородная, чтобы её решать одним «прогоном» модели. Например: «проанализируй три репозитория, найди в них типовые баги и сделай отчёт». Это три отдельные подзадачи плюс синтез.

EPIHEN умеет делегировать. Главный агент может вызвать sub-agent с другой моделью и другим контекстом — например, отправить Haiku разбираться с первым репозиторием, Sonnet — со вторым, R1 — синтезировать общий отчёт. Каждый sub-agent работает изолированно, не видит лишнего и возвращает результат главному агенту. Это и быстрее (параллелизм), и дешевле (правильные модели под правильные подзадачи).

Подробнее про это — в статье про sub-agents.

Инструменты: всё внутри одного диалога

Чистая LLM умеет только генерировать текст. EPIHEN — полноценный агент, у которого есть набор реальных инструментов:

Поиск в интернете — не только Google-style выдача, но и глубокое чтение страниц с пониманием контекста.
Генерация изображений — через интегрированные модели вроде Imagen и аналогов.
Исполнение Python-кода в изолированной среде — посчитать, отрисовать график, обработать данные.
SSH-доступ к вашим серверам, если вы сохранили connection. Агент может зайти, посмотреть логи, выполнить команду.
Работа с документами — читать PDF, DOCX, XLSX, генерировать собственные.
Marketplace search — найти товар на Wildberries, Ozon или Yandex Market по описанию или фото.

Главное — все эти инструменты работают внутри одного диалога. Вы не переключаетесь между разными приложениями. Вы пишете «найди мне новые наушники до 5000 рублей с шумодавом», и агент сам идёт в маркетплейсы, фильтрует, возвращает вам три-четыре подходящих варианта со ссылками и ценами.

Кому это нужно

EPIHEN — не для каждого случая. Если вам нужно один раз перевести абзац или придумать пять заголовков для поста — обычного бесплатного ChatGPT хватит за глаза.

EPIHEN имеет смысл, когда:

Вы используете AI системно, не разово — каждый день или почти каждый день.
У вас параллельно идут несколько проектов, и смешивать их контексты не хочется.
Вы хотите, чтобы агент со временем «узнавал» вас и работал лучше — не повторяя одни и те же вопросы про контекст.
Вам нужны не только тексты, но и реальные действия: поиск, код, SSH, документы.
Вы готовы платить за качество — но не хотите подписываться отдельно на ChatGPT Plus, Claude Pro, Gemini Advanced и DeepSeek API. EPIHEN даёт доступ ко всем моделям через одну подписку.

Что дальше

Это была общая картина. В следующих статьях разбираем по частям:

Как устроены четыре слоя памяти.
Как работает изоляция проектов.
Когда вызывать sub-agents и какую модель выбирать для делегирования.
Сравнения отдельных моделей — Opus vs Sonnet, бенчмарки 2026, DeepSeek R1, Gemini long-context.

Если есть конкретные вопросы по продукту — пишите в support, отвечаем без бота.