Справочник SENAR: Модель эффективности

Методики оценки эффективности внедрения SENAR. Все модели используют относительные коэффициенты и множители, а не абсолютные денежные величины — организации подставляют свои числа в любой валюте.


A. Измерения эффективности

Эффективность SENAR измеряется по четырём направлениям:

НаправлениеЧто измеряетсяКлючевой показатель
Пропускная способностьВыработка на единицуЗадач на пару «Супервайзер+AI» vs задач на разработчика
КачествоЗатраты на предотвращение и обнаружение дефектовСтоимость раннего обнаружения дефекта vs позднего
ЗнанияСохранение накопленного опытаДоля повторно используемых знаний: записи, которые предотвращают повторение ошибок
Накладные расходыДоля процессных затратВремя на церемонии и шлюзы как % от продуктивного времени сессии

B. Модель пропускной способности

B.1 Сравнение производственных единиц

МодельПроизводственная единицаТипичный состав
ТрадиционнаяКоманда разработки5–9 инженеров + QA + PM
SENARПара «Супервайзер+AI»1 супервайзер + AI-агент(ы)

Множитель пропускной способности:

T_multiplier = Tasks_per_Pair_per_period / Tasks_per_Developer_per_period

Организации РЕКОМЕНДУЕТСЯ измерять этот коэффициент в пилотном проекте, чтобы установить базовую линию. Коэффициент сильно зависит от сложности предметной области, возможностей AI-инструментов, опыта супервайзера и качества контекста.

B.2 Эффективность масштабирования

Традиционное масштабирование: каждый новый разработчик даёт убывающую отдачу (закон Брукса — коммуникационные накладные расходы растут как n²).

Масштабирование в SENAR: каждая новая пара «Супервайзер+AI» даёт почти линейную отдачу вплоть до предела координации федерации, потому что пары работают независимо, а зависимости отслеживаются программно.

Traditional: Effective_capacity = n × Developer_output × (1 - communication_overhead(n))
SENAR:       Effective_capacity = n × Pair_output × (1 - federation_overhead(n))

Где federation_overhead(n) растёт медленнее, чем communication_overhead(n), потому что зависимости отслеживаются программно, а не через совещания.


C. Эффективность качества

C.1 Соотношение затрат на обнаружение дефектов

Чем раньше найден дефект, тем дешевле его исправить. Это соотношение устойчиво в разных организациях:

Точка обнаруженияОтносительная стоимость
В процессе генерации AI (та же сессия) (базовая линия)
В ходе обзора качества (периодический аудит)3–5×
В ходе приёмочного тестирования5–10×
В продакшене10–50×

ROI шлюзов качества:

Gate_ROI = (Defects_caught × Avg_late_detection_cost) / Gate_operation_cost

Организациям РЕКОМЕНДУЕТСЯ измерять количество дефектов на каждом этапе и рассчитывать собственные коэффициенты затрат.

C.2 Эффективность первого прохода

Более высокая доля успеха с первого раза (FPSR) означает меньше переделок:

Rework_cost = Tasks_total × (1 - FPSR) × Avg_rework_cost_per_task
Efficiency_gain = Rework_cost_before_SENAR - Rework_cost_after_SENAR

FPSR улучшается по мере повышения качества контекста (более чёткие критерии приёмки, богатая база знаний, задокументированные тупиковые подходы).


D. Эффективность знаний

D.1 Повторное использование тупиковых подходов

Каждый задокументированный тупик (Dead End) не даёт будущим супервайзерам повторить ту же ошибку.

Dead_End_ROI = Documented_dead_ends × Avg_times_would_be_repeated × Avg_exploration_cost

Хорошо задокументированные тупики используются повторно почти в 100% случаев — практически каждый из них предотвращает минимум одно повторение в организации.

D.2 Эффект накопления знаний

По мере роста базы знаний качество контекста улучшается, что повышает FPSR и сокращает переделки:

Session N:    FPSR = f(KB_size_at_N, Context_quality)
Session N+K:  FPSR' > FPSR  (if KB is maintained and growing)

Так возникает эффект сложного процента — каждый инкремент эффективнее предыдущего, пока не наступает плато, на котором большинство типовых паттернов и подводных камней уже задокументированы.


E. Модель накладных расходов

E.1 Коэффициент накладных расходов на процесс

Overhead_ratio = Time_on_ceremonies_and_gates / Total_session_time

Целевой показатель: накладные расходы < 15% времени сессии для Базовой/Начальной, < 20% для Командной.

АктивностьБазовая/НачальнаяКомандная
Начало сессии2–5 мин2–5 мин
Завершение сессии5–10 мин5–10 мин
Проверки шлюзов качестваАвтоматически (0 мин)Автоматически (0 мин)
Обзор качестваПериодически (амортизировано)Периодически (амортизировано)
Синхронизация федерацииН/Д5–10 мин на синхронизацию
Планирование инкрементаАмортизировано1 сессия на инкремент
РетроспективаАмортизировано30–60 мин на инкремент

E.2 Точка безубыточности накладных расходов

Накладные расходы SENAR окупаются, когда экономия от предотвращения дефектов превышает стоимость процесса:

Break_even: Gate_cost + Ceremony_cost < Defects_prevented × Avg_defect_cost

Организациям РЕКОМЕНДУЕТСЯ рассчитывать этот показатель по итогам 3 инкрементов с измеренными данными.


F. Система сравнения

F.1 Традиционная команда vs команда SENAR

Для сравнения эффективности поставки при одинаковом объёме:

МетрикаТрадиционная командаКоманда SENARКак измерять
ЧисленностьN разработчиков + QA + PMM супервайзеров + роли поддержкиПодсчёт
Пропускная способностьЗадач за периодЗадач за периодОдинаковая гранулярность задач
Доля дефектовДефектов на 100 задачДефектов на 100 задачОдинаковый метод подсчёта
Время исполненияТребование → продакшенТребование → продакшенОдинаковые контрольные точки
Доля переделок% задач, требующих переделки% задач, требующих переделки (1 - FPSR)Одинаковое определение
Сохранение знанийBus-фактор, время онбордингаПокрытие базы знаний, время онбордингаИзмеряемое

F.2 Критерии принятия решения

SENAR эффективнее, когда:

  • AI-инструменты способны генерировать большую часть артефактов реализации в данной области
  • Множитель пропускной способности (B.1) превышает коэффициент накладных расходов (E.1) — чистый выигрыш в продуктивности
  • Экономия от предотвращения дефектов (C.1) превышает затраты на шлюзы — чистый выигрыш в качестве
  • Накопление знаний (D.2) даёт эффект сложного процента со временем

SENAR менее эффективен, когда:

  • Предметная область плохо подходит для AI-генерации (исследования, строго регламентированные ручные процессы)
  • Затраты на AI-инструменты превышают выигрыш от роста пропускной способности
  • Организация не может вложиться в инструментальную инфраструктуру (трекер задач, CI/CD, база знаний)
  • Команда слишком мала, чтобы процесс приносил пользу (1 разработчик на побочном проекте)

G. Рабочий лист оценки

Организации, оценивающие SENAR, РЕКОМЕНДУЕТСЯ измерять следующие показатели на пилоте (минимум 3 инкремента):

МетрикаПилотное значениеБазовая линия (до SENAR)Дельта
Задач на пару за сессию______ (на разработчика)×___
FPSR___%Н/Д (новая метрика)
Доля утечки дефектов (DER)___%___%___%
Доля переделок___%___%___%
Накладные расходы сессии (мин)___Н/Д
Создано записей знаний___0+___
Задокументировано тупиковых подходов___0+___

Правило принятия решения

IF throughput_multiplier > 1.0 + overhead_ratio
AND defect_escape_rate <= baseline_defect_rate
THEN SENAR is providing net efficiency gain → consider scaling

H. Тревожные сигналы

Признаки того, что SENAR снижает эффективность вместо того, чтобы повышать её:

Тревожный сигналЧто это означаетДействие
Коэффициент накладных расходов > 30%Процесс обходится дороже, чем приносит пользыУпростить: свести к MVS, автоматизировать церемонии
FPSR снижается со временемКачество контекста падаетПроверить базу знаний и качество критериев приёмки
Множитель пропускной способности < 1.0Пары медленнее обычных разработчиковОбласть не подходит для AI, или супервайзер недостаточно подготовлен
Доля обходов шлюзов > 20%Шлюзы не соответствуют реальностиПерекалибровать критерии шлюзов
Записей знаний = 0Фиксация знаний заброшенаКак минимум восстановить документирование тупиков
Сессии систематически превышают лимитНет дисциплиныВключить контрольные точки, разобраться в причинах