Справочник SENAR: Модель эффективности

Методики оценки эффективности внедрения SENAR. Все модели используют относительные коэффициенты и множители, а не абсолютные денежные величины — организации подставляют свои числа в любой валюте.

A. Измерения эффективности

Эффективность SENAR измеряется по четырём направлениям:

Направление	Что измеряется	Ключевой показатель
Пропускная способность	Выработка на единицу	Задач на пару «Супервайзер+AI» vs задач на разработчика
Качество	Затраты на предотвращение и обнаружение дефектов	Стоимость раннего обнаружения дефекта vs позднего
Знания	Сохранение накопленного опыта	Доля повторно используемых знаний: записи, которые предотвращают повторение ошибок
Накладные расходы	Доля процессных затрат	Время на церемонии и шлюзы как % от продуктивного времени сессии

B. Модель пропускной способности

B.1 Сравнение производственных единиц

Модель	Производственная единица	Типичный состав
Традиционная	Команда разработки	5–9 инженеров + QA + PM
SENAR	Пара «Супервайзер+AI»	1 супервайзер + AI-агент(ы)

Множитель пропускной способности:

T_multiplier = Tasks_per_Pair_per_period / Tasks_per_Developer_per_period

Организации РЕКОМЕНДУЕТСЯ измерять этот коэффициент в пилотном проекте, чтобы установить базовую линию. Коэффициент сильно зависит от сложности предметной области, возможностей AI-инструментов, опыта супервайзера и качества контекста.

B.2 Эффективность масштабирования

Традиционное масштабирование: каждый новый разработчик даёт убывающую отдачу (закон Брукса — коммуникационные накладные расходы растут как n²).

Масштабирование в SENAR: каждая новая пара «Супервайзер+AI» даёт почти линейную отдачу вплоть до предела координации федерации, потому что пары работают независимо, а зависимости отслеживаются программно.

Traditional: Effective_capacity = n × Developer_output × (1 - communication_overhead(n))
SENAR:       Effective_capacity = n × Pair_output × (1 - federation_overhead(n))

Где federation_overhead(n) растёт медленнее, чем communication_overhead(n), потому что зависимости отслеживаются программно, а не через совещания.

C. Эффективность качества

C.1 Соотношение затрат на обнаружение дефектов

Чем раньше найден дефект, тем дешевле его исправить. Это соотношение устойчиво в разных организациях:

Точка обнаружения	Относительная стоимость
В процессе генерации AI (та же сессия)	1× (базовая линия)
В ходе обзора качества (периодический аудит)	3–5×
В ходе приёмочного тестирования	5–10×
В продакшене	10–50×

ROI шлюзов качества:

Gate_ROI = (Defects_caught × Avg_late_detection_cost) / Gate_operation_cost

Организациям РЕКОМЕНДУЕТСЯ измерять количество дефектов на каждом этапе и рассчитывать собственные коэффициенты затрат.

C.2 Эффективность первого прохода

Более высокая доля успеха с первого раза (FPSR) означает меньше переделок:

Rework_cost = Tasks_total × (1 - FPSR) × Avg_rework_cost_per_task
Efficiency_gain = Rework_cost_before_SENAR - Rework_cost_after_SENAR

FPSR улучшается по мере повышения качества контекста (более чёткие критерии приёмки, богатая база знаний, задокументированные тупиковые подходы).

D. Эффективность знаний

D.1 Повторное использование тупиковых подходов

Каждый задокументированный тупик (Dead End) не даёт будущим супервайзерам повторить ту же ошибку.

Dead_End_ROI = Documented_dead_ends × Avg_times_would_be_repeated × Avg_exploration_cost

Хорошо задокументированные тупики используются повторно почти в 100% случаев — практически каждый из них предотвращает минимум одно повторение в организации.

D.2 Эффект накопления знаний

По мере роста базы знаний качество контекста улучшается, что повышает FPSR и сокращает переделки:

Session N:    FPSR = f(KB_size_at_N, Context_quality)
Session N+K:  FPSR' > FPSR  (if KB is maintained and growing)

Так возникает эффект сложного процента — каждый инкремент эффективнее предыдущего, пока не наступает плато, на котором большинство типовых паттернов и подводных камней уже задокументированы.

E. Модель накладных расходов

E.1 Коэффициент накладных расходов на процесс

Overhead_ratio = Time_on_ceremonies_and_gates / Total_session_time

Целевой показатель: накладные расходы < 15% времени сессии для Базовой/Начальной, < 20% для Командной.

Активность	Базовая/Начальная	Командная
Начало сессии	2–5 мин	2–5 мин
Завершение сессии	5–10 мин	5–10 мин
Проверки шлюзов качества	Автоматически (0 мин)	Автоматически (0 мин)
Обзор качества	Периодически (амортизировано)	Периодически (амортизировано)
Синхронизация федерации	Н/Д	5–10 мин на синхронизацию
Планирование инкремента	Амортизировано	1 сессия на инкремент
Ретроспектива	Амортизировано	30–60 мин на инкремент

E.2 Точка безубыточности накладных расходов

Накладные расходы SENAR окупаются, когда экономия от предотвращения дефектов превышает стоимость процесса:

Break_even: Gate_cost + Ceremony_cost < Defects_prevented × Avg_defect_cost

Организациям РЕКОМЕНДУЕТСЯ рассчитывать этот показатель по итогам 3 инкрементов с измеренными данными.

F. Система сравнения

F.1 Традиционная команда vs команда SENAR

Для сравнения эффективности поставки при одинаковом объёме:

Метрика	Традиционная команда	Команда SENAR	Как измерять
Численность	N разработчиков + QA + PM	M супервайзеров + роли поддержки	Подсчёт
Пропускная способность	Задач за период	Задач за период	Одинаковая гранулярность задач
Доля дефектов	Дефектов на 100 задач	Дефектов на 100 задач	Одинаковый метод подсчёта
Время исполнения	Требование → продакшен	Требование → продакшен	Одинаковые контрольные точки
Доля переделок	% задач, требующих переделки	% задач, требующих переделки (1 - FPSR)	Одинаковое определение
Сохранение знаний	Bus-фактор, время онбординга	Покрытие базы знаний, время онбординга	Измеряемое

F.2 Критерии принятия решения

SENAR эффективнее, когда:

AI-инструменты способны генерировать большую часть артефактов реализации в данной области
Множитель пропускной способности (B.1) превышает коэффициент накладных расходов (E.1) — чистый выигрыш в продуктивности
Экономия от предотвращения дефектов (C.1) превышает затраты на шлюзы — чистый выигрыш в качестве
Накопление знаний (D.2) даёт эффект сложного процента со временем

SENAR менее эффективен, когда:

Предметная область плохо подходит для AI-генерации (исследования, строго регламентированные ручные процессы)
Затраты на AI-инструменты превышают выигрыш от роста пропускной способности
Организация не может вложиться в инструментальную инфраструктуру (трекер задач, CI/CD, база знаний)
Команда слишком мала, чтобы процесс приносил пользу (1 разработчик на побочном проекте)

G. Рабочий лист оценки

Организации, оценивающие SENAR, РЕКОМЕНДУЕТСЯ измерять следующие показатели на пилоте (минимум 3 инкремента):

Метрика	Пилотное значение	Базовая линия (до SENAR)	Дельта
Задач на пару за сессию	___	___ (на разработчика)	×___
FPSR	___%	Н/Д (новая метрика)	—
Доля утечки дефектов (DER)	___%	___%	___%
Доля переделок	___%	___%	___%
Накладные расходы сессии (мин)	___	Н/Д	—
Создано записей знаний	___	0	+___
Задокументировано тупиковых подходов	___	0	+___

Правило принятия решения

IF throughput_multiplier > 1.0 + overhead_ratio
AND defect_escape_rate <= baseline_defect_rate
THEN SENAR is providing net efficiency gain → consider scaling

H. Тревожные сигналы

Признаки того, что SENAR снижает эффективность вместо того, чтобы повышать её:

Тревожный сигнал	Что это означает	Действие
Коэффициент накладных расходов > 30%	Процесс обходится дороже, чем приносит пользы	Упростить: свести к MVS, автоматизировать церемонии
FPSR снижается со временем	Качество контекста падает	Проверить базу знаний и качество критериев приёмки
Множитель пропускной способности < 1.0	Пары медленнее обычных разработчиков	Область не подходит для AI, или супервайзер недостаточно подготовлен
Доля обходов шлюзов > 20%	Шлюзы не соответствуют реальности	Перекалибровать критерии шлюзов
Записей знаний = 0	Фиксация знаний заброшена	Как минимум восстановить документирование тупиков
Сессии систематически превышают лимит	Нет дисциплины	Включить контрольные точки, разобраться в причинах