traces.solutions
Метрологічний фреймворк · Стаття 1

TRACE: інженерний
фреймворк довіреного
агентного ШІ.

Крос-доменна референсна архітектура для ШІ в операційно-критичних контекстах — чотири шари (з поділом L2 на класичний ML і LLM-валідатори), 17 метрик довіри, зокрема перша повноцінна формалізація коефіцієнта обчислювальної парсимонії, і три референсні інстанси (клінічний, промисловий багатодоменний, судовий).

Читати фреймворк →ПублікаціїСтаття 1 → препринт arXiv
4
Шари
L1 · L2a/L2b · L3 · L4
5+1
Принципи
5 в акронімі + 1 проєктне обмеження
17
Метрики
12 шарових · 4 крос · 1 економічна
3
Інстанси
A клінічний · B промисловий · C судовий
Ланцюг простежуваності
SI
Первинні еталони
GUM · VIM · ISO/IEC 17025
L1
Детерміноване ядро
правила · інваріанти
L2a
Класичний ML
GUM-верифіковна калібровка
L2b
LLM-валідатори
семантичні перевірки / узгодженість
L3
Ярусна оркестрація
станова політика ескалації
L4
Людський нагляд
калібрований нагляд
Δ
Доменний інстанс
A клінічний · B промисловий · C судовий
§0 · Анотація

TRACE організовує агентні ШІ-системи в чотиришарову референсну архітектуру з явним поділом навченого ярусу на класичний ML (L2a) і LLM-валідатори (L2b) — станова політика оркестрації (L3) діє над інвентарем L2, а людський нагляд (L4) несе вимірюване навантаження.

Фреймворк ґрунтується на усталеній метрології — GUM, VIM, ISO/IEC 17025 — і трактує довіру як інженеровану й вимірювану, а не декларовану. П’ять акронімних принципів (Trustworthy · Reasoned · Accountable · Context-bound · Escalated) дисциплінуються внутрішнім проєктним обмеженням — Model Parsimony — кількісно вираженим коефіцієнтом обчислювальної парсимонії (CPR): першою повноцінною метрикою компромісу складність–якість у довіреному ШІ.

Три інстанси — клінічна підтримка рішень (Інстанс A), промислова багатодоменна платформа (Інстанс B) і судове розширення підтримки рішень (Інстанс C) — демонструють доменну нейтральність. Архітектура дає структурну основу для пошарового GUM-поширення невизначеності у напрямі формальної сертифікації.

§1

Референсна архітектура — п’ять шарів × три інстанси

Рядки — архітектурні шари (з поділом L2 на класичний ML і LLM-валідатори); стовпці — референсні інстанси. Кожна клітинка називає конкретний артефакт, що заповнює шар у цьому інстансі.

шар \ інстанс
Інстанс A
Клінічна підтримка рішень
Інстанс B
Промисловий багатодоменний
Інстанс C
Судова підтримка рішень
L4
Людський нагляд
Нагляд акредитованого оператора — ISO/IEC 17025
Лікар як фінальний рецензент; узгоджено з фреймворком людина–ШІ TRIAD
Бурильник, супервайзер, HSE-офіцер (технологія / операції); юрист, офіцер закупівель (адміністрування); врядування DNV-RP-0671
Суддя або помічник судді як фінальний рецензент; емпіричний прецедент: Kolkman et al. (Justitia, 2024)
L3
Ярусна оркестрація
Ієрархічні ланцюги калібрування
Рутинні випадки через калібрований L2a; межова впевненість → валідатор L2b; спільне high-risk ∧ high-confidence або неузгодженість L2a/L2b → обов’язкова передача клініцисту
Маршрутизація за ярусами вартості по піддоменах; стійка аномалія + high-risk → сигнал бурильнику; порушення SLA → ескалація оператору; високоризикові клаузули → юрист / комплаєнс-офіцер
L2a/NER відбирає релевантні прецеденти; валідатор L2b — обов’язкова перевірка на галюцинації; високоризикова вимога з упевненою рекомендацією → юридичний перегляд
L2b
LLM-валідатори
Етап суб’єктивної інспекції в метрологічному аудиті
LLM-валідатор над вільнотекстовими клінічними нотатками; перевірки узгодженості з анамнезом пацієнта
Семантична кореляція журналів буріння з наративами інцидентів; видобуток клаузул і diff документів в адміністративному піддомені
LLM для аналізу матеріалів справ, семантична кореляція прецедентів, підготовка проєктів документів
L2a
Класичний ML
Характеризація приладу — GUM
Оцінки ризику, часові ряди вітальних показників, класифікатори лабораторних даних; NER над структурованим текстом клінічних записів
Виявлення аномалій, класифікатори предиктивного обслуговування, моделі залишкового ресурсу; CNN/LSTM над сигналами MWD/LWD; оцінювання ризику постачальників
Класифікація документів, ранжування релевантності прецедентів, NER над матеріалами справ
L1
Детерміноване / фізичне ядро
Еталонні матеріали, простежувані стандарти
Орієнтована на правила клінічна логіка; простежуваність у дусі FUTURE-AI
Керування на основі фізики: пріоритетний контролер, автоматизація буріння, діапазони параметрів; запобіжні блокування; комплаєнс-каркас для закупівель і контрактів
Процесуальні та матеріальні правові норми; Етична хартія CEPEJ як орієнтир врядування
§2

П’ять принципів + одне проєктне обмеження

Акронім TRACE відображає п’ять видимих користувачеві властивостей. Model Parsimony — кількісно виражене внутрішнє проєктне обмеження, що дисциплінує вибір L2a / L2b.

01
T · Trustworthy
Простежуваність доказів

Кожна приписова дія несе машиночитабельний ланцюг доказів — дані → висновок → рішення.

→ ETC · Повнота ланцюга доказів
02
R · Reasoned
Обмежений людський нагляд

Людський нагляд — архітектурний шар із вимірюваним навантаженням і правом перекриття, а не косметичний запобіжник.

→ OvR · Частка перекриттів
03
A · Accountable
Поетапна автономія

Авторитет здобувається через накопичені дані стабільності та явну кваліфікацію — а не надається за замовчуванням на релізі.

→ ABC · Дотримання меж автономії
04
C · Context-bound
Обмежений контекст

Вхідний контекст явно специфікований, датований і оновлюваний як частина оболонки безпеки.

→ CFI · Індекс свіжості контексту
05
E · Escalated
Метрологічна підзвітність

Кожна властивість якості специфікується, вимірюється, калібрується й моніториться в часі.

→ CE · Похибка калібрування
Внутрішнє проєктне обмеження — поза акронімом TRACE
06
Парсимонія моделі

Тип навченого компонента (класичний ML, спеціалізована нейромережа, LLM, гібрид) обирається за відповідністю задачі — а не за презумпцією LLM.

Внутрішнє проєктне обмеження — кількісно через CPR, поза акронімом TRACE.

Кількісно через
CPR · Коефіцієнт обчислювальної парсимонії
CPR = 1 — оптимум
CPR ≪ 1 — архітектурний overhead
§3

Метрики довіри

Сімнадцять вимірюваних показників: дванадцять пошарових, чотири крос-шарові та одна економічна (CPR). Фільтруйте за шаром або типом.

Шар
Тип
17 із 17
ABC
Дотримання меж автономії
Крос-шар
Відповідність
Частка дій, виконаних у межах визначеної автономії системи.
CE
Похибка калібрування
Крос-шар
Калібрування
Відхилення заявленої впевненості від емпіричної точності.
CFI
Індекс свіжості контексту
L2
Свіжість
Зважена свіжість даних в активному контексті.
CPR
Коефіцієнт обчислювальної парсимонії
Економіка
Парсимонія
Відношення вартості ресурсів найекономічнішої моделі, що задовольняє вимоги задачі (точність, калібрування, операційна надійність), до фактичної вартості розгорнутої моделі. CPR = 1 — оптимум; CPR ≪ 1 — архітектурний overhead. Перша повноцінна формалізація компромісу складність–якість як метрики в довіреному ШІ.
CRP
Точність релевантності контексту
L2
Точність
Частка елементів контексту, дійсно релевантних задачі.
EP
Точність ескалації
L3
Точність
Частка ескалацій, що дійсно потребували вищого ярусу.
ETC
Повнота ланцюга доказів
Крос-шар
Простежуваність
Частка виходів із повним ланцюгом доказів (дані → рішення).
FPA
Послаблення хибних спрацювань
L3
Фільтрація
Придушення хибно-позитивних ескалацій через повторний виклик компонентів L2 за політикою.
IPSR
Стабільність до збурень входу
L2
Стабільність
Частка відповідей, стабільних до перефразування й збурення входу.
OSI
Індекс операційної стабільності
Крос-шар
Дрейф
Варіація ключових метрик довіри в часі.
OvR
Частка перекриттів
L4
Поведінка
Частка виходів ШІ, змінених людьми-рецензентами.
RBI
Індекс навантаження рецензента
L4
Навантаження
Середній час рецензента на справу на людському ярусі.
RCI
Індекс узгодженості правил
L1
Стабільність
Стабільність виходу правил під час оновлень системи.
RCR
Покриття правилами
L1
Покриття
Частка сценаріїв, покритих явними правилами детермінованого ядра.
SNR
Відношення сигнал/шум
L4
Фільтрація
Відношення критичних справ до загального потоку, що сягає людського ярусу.
TCC
Коефіцієнт вартості ярусу
L3
Вартість
Сукупна обчислювальна вартість обраного шляху ескалації.
UTC
Коефіцієнт простежуваності оновлень
L1
Простежуваність
Частка змін правил із задокументованим обґрунтуванням і простежуваним походженням.
§4

Референсні інстанси

Дві фундаментальні реалізації (A клінічна, B промислова багатодоменна) мотивували формалізацію. Третя (C судова) демонструє перенесення в домен з принципово іншим контекстом врядування.

Інстанс A
Клінічна підтримка рішень
Фундаментальний інстанс
Лідер
Заболотній, Голінко, Антоненко
Статус
Стаття 0 · журнал IMM — на рецензії
Інстанс B
Промисловий багатодоменний
Фундаментальний інстанс · нафтогаз
Лідер
А. Щербань
Статус
Патент у розгляді · UA u 2025 04038 · депозит U.S. Copyright Office (бер. 2026)
Інстанс C
Судова підтримка рішень
Часткове розширення
Лідер
Заболотній (з Верховним Судом України, за фінансування Expertise France)
Статус
Модернізація порталу «База правових позицій»
§4·B

Інстанс B детально — піддомен × шар

Промислова платформа охоплює три операційні піддомени. Чотиришарова архітектура інстансується по-різному в кожному: домінантний шар зсувається з типом доказів — ілюструючи принцип Model Parsimony.

шар \ піддомен
Технологія
Upstream: буріння, видобуток, операції зі свердловинами
Операції
Рішення з обслуговування, моніторинг обладнання, відстеження KPI
Адміністрування
Документообіг, закупівлі, життєвий цикл контрактів, комплаєнс
L1
Детерміноване / фізичне ядро
ACTIVE
Ядро керування на основі фізики: пріоритетна логіка, діапазони параметрів, межі допусків
ACTIVE
Процедури обслуговування, регуляторні інтервали, запобіжні блокування
DOMINANT
Комплаєнс-каркас: правила закупівель, віхи життєвого циклу контрактів, вимоги до аудит-треку (формально специфіковані, не навчені)
L2a
Класичний ML
DOMINANT
Класичний ML над структурованими сигналами сенсорів і станів обладнання — верифіковний за калібруванням і відтворюваністю
DOMINANT
Класичний ML над структурованими сигналами обладнання й процесів — предиктивне обслуговування, виявлення аномалій, оцінка залишкового ресурсу
PRESENT
Класичний ML для структурованих сигналів над даними закупівель і постачальників
L2b
LLM-валідатори
PRESENT
LLM-валідатори, що залучаються асинхронно для наративного ретроспективного перегляду
PRESENT
LLM-валідатори над вільнотекстовими звітами про інциденти та історичними журналами
DOMINANT
LLM-валідатори для перегляду вільнотекстових контрактів і документів (семантичний diff, виявлення нестандартних умов)
L3
Ярусна оркестрація
ACTIVE
Маршрутизація за смугами допуску; стійка аномалія ∧ high-risk запускає передачу людині; покомпонентна оркестрація незалежна від класу моделі L2
ACTIVE
Маршрутизація за ярусами вартості; порушення SLA, спільне risk ∧ confidence або неузгодженість L2a/L2b запускає ескалацію оператору; повний аудит-трек
ACTIVE
Маршрутизація за ярусами ризику; стандартний контракт через L1; нестандартні клаузули маршрутизуються до компонентів L2; високоризикові позначки запускають обов’язкову передачу юристу
L4
Людський нагляд
ACTIVE
Бурильник / супервайзер з правом перекриття
ACTIVE
Супервайзер операцій як фінальний рецензент
ACTIVE
Юрист / офіцер закупівель / комплаєнс-офіцер як фінальний рецензент
Технологія
Upstream: буріння, видобуток, операції зі свердловинами
L1 · Детерміноване / фізичне ядроACTIVE
Ядро керування на основі фізики: пріоритетна логіка, діапазони параметрів, межі допусків
L2a · Класичний MLDOMINANT
Класичний ML над структурованими сигналами сенсорів і станів обладнання — верифіковний за калібруванням і відтворюваністю
L2b · LLM-валідаториPRESENT
LLM-валідатори, що залучаються асинхронно для наративного ретроспективного перегляду
L3 · Ярусна оркестраціяACTIVE
Маршрутизація за смугами допуску; стійка аномалія ∧ high-risk запускає передачу людині; покомпонентна оркестрація незалежна від класу моделі L2
L4 · Людський наглядACTIVE
Бурильник / супервайзер з правом перекриття
Операції
Рішення з обслуговування, моніторинг обладнання, відстеження KPI
L1 · Детерміноване / фізичне ядроACTIVE
Процедури обслуговування, регуляторні інтервали, запобіжні блокування
L2a · Класичний MLDOMINANT
Класичний ML над структурованими сигналами обладнання й процесів — предиктивне обслуговування, виявлення аномалій, оцінка залишкового ресурсу
L2b · LLM-валідаториPRESENT
LLM-валідатори над вільнотекстовими звітами про інциденти та історичними журналами
L3 · Ярусна оркестраціяACTIVE
Маршрутизація за ярусами вартості; порушення SLA, спільне risk ∧ confidence або неузгодженість L2a/L2b запускає ескалацію оператору; повний аудит-трек
L4 · Людський наглядACTIVE
Супервайзер операцій як фінальний рецензент
Адміністрування
Документообіг, закупівлі, життєвий цикл контрактів, комплаєнс
L1 · Детерміноване / фізичне ядроDOMINANT
Комплаєнс-каркас: правила закупівель, віхи життєвого циклу контрактів, вимоги до аудит-треку (формально специфіковані, не навчені)
L2a · Класичний MLPRESENT
Класичний ML для структурованих сигналів над даними закупівель і постачальників
L2b · LLM-валідаториDOMINANT
LLM-валідатори для перегляду вільнотекстових контрактів і документів (семантичний diff, виявлення нестандартних умов)
L3 · Ярусна оркестраціяACTIVE
Маршрутизація за ярусами ризику; стандартний контракт через L1; нестандартні клаузули маршрутизуються до компонентів L2; високоризикові позначки запускають обов’язкову передачу юристу
L4 · Людський наглядACTIVE
Юрист / офіцер закупівель / комплаєнс-офіцер як фінальний рецензент
ІнтенсивністьDOMINANTосновний шлях рішенняACTIVEрегулярний внесокPRESENTвузька / допоміжна роль

Та сама чотиришарова архітектура інстансується по-різному в кожному піддомені: домінантний шар зсувається з типом доказів — класичний ML для структурованих сигналів, L1+LLM-валідатори для роботи, зв’язаної з правилами та мовою. Покомпонентну методологію та операційну статистику окремо звітує розробник системи (Стаття 2).

§5

Дорожня карта з чотирьох статей

Стаття 1 (супутник цього сайту) — крос-доменний синтез фреймворку. Стаття 0 заземлює його у клінічному фундаментальному інстансі; Статті 2 і 3 — доменне та метрологічне поглиблення.

[paper 0]
Клінічна фундаментальна
Заболотній, Голінко, Антоненко · IEEE Instrumentation & Measurement Magazine — спецвипуск «A Measure of Trust in Healthcare»
На рецензії · вер. 2026
[paper 1]
Синтез фреймворку
Опубліковано на arXiv (трав. 2026) — цей сайт є супутником
[paper 2]
Промислове багатодоменне поглиблення
Промислова багатодоменна агентна платформа для upstream-нафтогазу: інстанс TRACE
Щербань (лідер), Заболотній · Scopus-індексований журнал з промислового ШІ
Заплановано · Q3 2026
[paper 3]
Метрологічне поглиблення
Пошарове GUM-поширення у TRACE: формальний бюджет невизначеності для агентних ШІ-систем
Заболотній (лідер), Щербань · IEEE Transactions on Instrumentation and Measurement
Заплановано (опційно)