Alpha · Ранний доступ

Оркестратор локальных
ИИ агентов

100% приватность · полный оффлайн режим

Иерархическая оркестрация с динамическим планированием задач, персистентной памятью с семантическим ретривалом и замкнутым контуром коррекции поведения агентов.

Soul Studio в работе — демо скоро

Ключевые возможности

Архитектура, а не обёртка

01HTN Planning

Продвинутые агенты на базе локальных моделей

Каждый агент — автономный вычислительный модуль с инкапсулированным состоянием, специализированным system prompt и изолированным пространством инструментов. Архангел — HTN-планировщик: строит граф подзадач с явными зависимостями, аллоцирует агентов по специализации, координирует через общую шину состояния.

02Parallel Execution

Повышение эффективности работы локальных моделей

Три ортогональных механизма: (i) контекстное окно управляется через семантический ретривал — в inference-time подаётся взвешенная выборка по relevance score; (ii) параллельное исполнение узлов DAG с синхронизацией на барьерах зависимостей; (iii) адаптивный роутинг задач по профилю latency/quality/VRAM.

03ANN Retrieval

Безлимитная система контекста — агент помнит всегда

Четыре уровня памяти: рабочая (inference window), эпизодическая (extractive summarization), семантическое хранилище (векторная БД, ANN, cosine similarity с temporal decay), процедурная (паттерны поведения). Ретривал — задача ранжирования: k релевантных фрагментов в пределах бюджета токенов.

04Real-time Observability

Система мониторинга продуктивности локальных моделей

Observability-стек в реальном времени: task completion rate, confidence calibration score, tool invocation success ratio, context utilization efficiency, VRAM·время. Детекция галлюцинаций — кросс-валидация между агентами и consistency checking по фактическим утверждениям.

05Closed-loop Control

Алгоритм Live корректировки поведения модели

Поведенческий монитор — замкнутый контрольный контур: вычисляет topic drift score, uncertainty expression rate, task alignment index. При выходе за пороги: модификация system prompt в runtime, перестройка retrieval-стратегии, изменение tool access scope. При reasoning loop — принудительный context reset.

06Air-gap Architecture

100% оффлайн — полная приватность данных

Весь inference-стек, ретривал, вызовы инструментов и межагентная координация замкнуты на localhost без исходящих соединений. Телеметрия отсутствует архитектурно. GDPR, HIPAA, SOC 2 compliance — структурное следствие изолированной среды исполнения.

07DAG Scheduler

Оркестратор агентов — комплексные многоуровневые проекты

Планировщик строит DAG с учётом зависимостей, приоритетов и ресурсных ограничений. Агенты исполняют узлы параллельно; передача артефактов — через типизированные интерфейсы с верификацией схемы. Online replanning: перестраивается только затронутое поддерево, не весь пайплайн.

08Plugin Architecture

Интеграция с более чем 40 сервисами и системами

Unified tool-calling интерфейс поверх REST, GraphQL и WebSocket адаптеров. Каждый коннектор инкапсулирует авторизацию, rate-limit handling и retry с экспоненциальным откатом. Новые интеграции добавляются без модификации ядра оркестратора.

09Local SD/FLUX

Встроенный безлимитный генератор изображений

Локальный inference на Stable Diffusion / FLUX. Интегрирован как первоклассный инструмент с программным вызовом агентом. Управление VRAM при параллельном LLM-инференсе и генерации — через динамический offloading весов между GPU и CPU.

10Whisper / Vocoder

Полная голосовая коммуникация — агенты слышат и говорят

STT — Whisper-совместимые архитектуры с локальным инференсом; TTS — нейросетевые вокодерные модели с малой задержкой. Голосовой ввод десериализуется в structured intent. Синтез ответов асинхронен — стриминг аудио по мере генерации.

11Multi-model Cascade

Vision для любых моделей — даже слабых

Каскадный мультимодельный pipeline: модели малого размера анализируют структуру изображения, результаты агрегируются в structured text description для text-only LLM-агента. Vision capabilities без мультимодальной LLM в основном стеке — существенно снижает порог по VRAM.

12Model Catalog

Огромная библиотека локальных моделей + поиск по специализации

Каталог с метаданными: бенчмарки (MMLU, HumanEval, GSM8K, MATH) по задачам, VRAM при разных уровнях квантизации (Q4_K_M, Q5_K_M, Q8_0, F16), throughput на референсном железе. Поиск — матчинг профиля задачи к характеристикам модели с учётом ресурсных ограничений.

13Unified LLM Layer

Полная поддержка облачных моделей — Gemini, Anthropic, OpenAI, Grok, DeepSeek

Unified LLM abstraction layer: единый интерфейс для локальных и облачных провайдеров. Оркестратор роутит задачи по многокритериальной функции: стоимость, latency, capability-профили, ограничения на приватность. Конфигурация роутинга задаётся декларативно.

Сценарии применения

Что строят на Soul Studio

01
Web Development

Разработка продвинутых вебсайтов и лендингов

Code-агент оперирует на уровне архитектуры: граф компонентов, API-контракты, схема зависимостей, ADR в долгосрочной памяти. Итерирует по результатам статического анализа, тестового покрытия и метрик производительности автономно.

02
Rapid Prototyping

Разработка прототипов — идеальное решение для стартапов

Полный стек: схема БД, миграции, API-слой с валидацией, auth, UI, инфраструктурные конфиги. Генерируемый код включает обработку исключений, структурированное логирование и базовую security-модель.

03
Game Dev

Разработка компьютерных игр

Game-агент оперирует паттернами ECS, конечными автоматами поведения, event-driven системами. Генерирует игровую логику, behaviour tree для NPC, процедурную генерацию. В связке с генератором изображений и TTS.

04
Workflow Automation

Управление и автоматизация рабочих процессов

Workflow-агент строит event-driven пайплайны с ветвлением, обработкой исключений и rollback. Поведение адаптируется на основе истории исполнений в процедурной памяти — параметризуемая логика с обучением на прецедентах.

05
Data Processing

Мониторинг и обработка данных

Агент как непрерывный consumer: парсит источники по расписанию или событийному триггеру, нормализует к целевой схеме, обнаруживает аномалии (z-score, IQR, isolation forest), генерирует алерты с полным контекстом.

06
Integrations

Интеграция: Gmail, Google Calendar, Monday, AirTable, Notion...

Семантически согласованные транзакции через несколько сервисов: входящий документ → extraction → кросс-референс с CRM → обновление статуса → задача → уведомление. Атомарность с точки зрения бизнес-логики.

07
Research & Writing

Написание книг и научных статей

Research-агент строит knowledge graph из корпуса источников, отслеживает consistency утверждений, сохраняет стилистический профиль в долгосрочной памяти. Генерирует библиографию в произвольном citation format.

08
Web Scraping

Сканирование вебсайтов — извлечение и структуризация данных

Playwright-бэкенд: JS-рендеринг, обход пагинации, динамический контент. Дедупликация по content hash, нормализация к целевой схеме. Горизонтальное масштабирование через параллельные browser-сессии.

09
Marketing

Разработка и запуск рекламных кампаний

Генерация вариативного контента по параметрам аудитории, A/B матрица гипотез, creative-пакеты под форматы плейсментов. Анализирует performance-метрики и предлагает итерации на основе статистической значимости.

10
Music Generation

Написание музыки

Генерация MIDI-секвенций, гармонических прогрессий, мелодических линий и аранжировок через специализированные генеративные модели. Агент сохраняет музыкальный контекст (тональность, метр, тематический материал) и итерирует как со-автор.

Версии

Три версии. Одна студия.

Coming Soon02

Soul Studio
Cloud

Та же мощь — через браузер

Идентичная оркестрационная архитектура с inference на управляемой инфраструктуре. API-совместима с Local: конфигурации агентов переносимы без модификации.

  • Любое устройство
  • Браузер
  • Командная работа
  • Multi-user workspaces
В разработке
Lightweight03

Soul Studio
Mini

Та же архитектура — для слабого железа

Оркестрационная архитектура с оптимизацией под CPU-inference. Модели 1B–4B с агрессивной квантизацией Q4. Паритет по архитектуре памяти и поведенческой коррекции.

  • CPU-inference
  • 8 GB RAM
  • Q4 квантизация
  • Полный оффлайн
В разработке

Видение

Операционная система для AI-работы

Современный ландшафт систем автоматизации на основе LLM характеризуется фундаментальным структурным противоречием: при достаточном уровне качества локальных open-source моделей для решения значительной части production-задач отсутствует инфраструктурный уровень, обеспечивающий их эффективную оркестрацию.

Эмпирически установлено, что специализированная модель класса 7B параметров превосходит неспециализированные коммерческие системы на профильных задачах. Модели класса 34B с применением методов квантизации конкурентоспособны с лучшими коммерческими предложениями на значительной части стандартных бенчмарков.

Soul Studio реализует этот инфраструктурный уровень.

01

Оркестрация как детерминант системного интеллекта

Производительность мультиагентной системы с корректно реализованным планировщиком превосходит отдельную монолитную модель значительно большего размера — за счёт параллелизма исполнения и специализации агентов по типам задач.

02

Персистентная иерархическая память как необходимое условие агентного поведения

Система без долгосрочной памяти с семантическим ретривалом является stateless функцией, а не автономным агентом. Накопление институциональных знаний через эпизодическую и процедурную память — ключевое условие роста эффективности агента во времени.

03

Локальный inference как архитектурное преимущество, а не компромисс

Детерминированная среда исполнения, нулевая latency на вызовы инструментов, отсутствие rate-limit ограничений и полный контроль над execution environment представляют самостоятельную ценность — независимо от соображений приватности.

Роадмап

Куда движется Soul Studio

Каждая фаза — завершённый функциональный уровень, а не промежуточное состояние. Мы строим снизу вверх: сначала production-ready ядро, затем вертикальные специализации и открытая экосистема. Ни одна фаза не начинается до стабилизации предыдущей.

01Текущая фаза
LiveAlpha

Foundation

production-ready оркестратор, 40+ адаптеров, Local + Cloud

02Фаза 2
Q3 2025

Vertical Agents

Отраслевые agent packages: Legal, Healthcare, FinTech, eCommerce

03Фаза 3
Q1 2026

Ecosystem

SDK для кастомных агентов, маркетплейс специализаций

04Фаза 4
2026+

Federation

Распределённые агентные сети, федерация узлов, P2P-координация

01Текущая фаза
LiveAlpha

Foundation

production-ready оркестратор, 40+ адаптеров, Local + Cloud

02Фаза 2
Q3 2025

Vertical Agents

Отраслевые agent packages: Legal, Healthcare, FinTech, eCommerce

03Фаза 3
Q1 2026

Ecosystem

SDK для кастомных агентов, маркетплейс специализаций

04Фаза 4
2026+

Federation

Распределённые агентные сети, федерация узлов, P2P-координация

О команде

Практики, не теоретики

Soul Studio разрабатывается командой практикующих инженеров, накопивших систематический опыт работы с существующими решениями в области агентных систем — LangChain, AutoGPT, LM Studio, Open WebUI — и пришедших к выводу об их принципиальной ограниченности для production-применения.

Ни одно из существующих решений не обеспечивает одновременно: production-ready оркестрацию множества специализированных агентов, иерархическую персистентную память с семантическим ретривалом, замкнутый контур поведенческой коррекции и полную изоляцию среды исполнения. Soul Studio строится как ответ на эту совокупность требований — не инкрементальное улучшение.

40+инструментальных адаптеров
4уровня иерархической памяти
100%локальный inference
Без венчурного финансированияРешения — из инженерной целесообразностиИспользуем в production каждый день

Планы

Без скрытых условий

Upgrade

$39единовременно

Апгрейд до текущей версии для существующих пользователей

  • Обновление до последней версии
  • Все новые агенты и инструменты
  • Сохранение конфигураций
  • Миграция данных памяти

Subscription

$19в месяц

Постоянные обновления и полный доступ ко всем продуктам Soul

  • Soul Studio Local + Cloud + Mini
  • Все обновления всех версий
  • Ранний доступ к новым функциям
  • Тестовые утилиты и beta-релизы
  • Приоритетный канал поддержки

Возврат средств — 14 дней без вопросов