Метрологічний фреймворк · Стаття 1

TRACE: інженерний
фреймворк довіреного
агентного ШІ.

Крос-доменна референсна архітектура для ШІ в операційно-критичних контекстах — чотири шари (з поділом L2 на класичний ML і LLM-валідатори), 17 метрик довіри, зокрема перша повноцінна формалізація коефіцієнта обчислювальної парсимонії, і три референсні інстанси (клінічний, промисловий багатодоменний, судовий).

Читати фреймворк →ПублікаціїСтаття 1 → препринт arXiv

Шари

L1 · L2a/L2b · L3 · L4

5+1

Принципи

5 в акронімі + 1 проєктне обмеження

Метрики

12 шарових · 4 крос · 1 економічна

Інстанси

A клінічний · B промисловий · C судовий

Ланцюг простежуваності

Первинні еталони

GUM · VIM · ISO/IEC 17025

Детерміноване ядро

правила · інваріанти

L2a

Класичний ML

GUM-верифіковна калібровка

L2b

LLM-валідатори

семантичні перевірки / узгодженість

Ярусна оркестрація

станова політика ескалації

Людський нагляд

калібрований нагляд

Доменний інстанс

A клінічний · B промисловий · C судовий

§0 · Анотація

TRACE організовує агентні ШІ-системи в чотиришарову референсну архітектуру з явним поділом навченого ярусу на класичний ML (L2a) і LLM-валідатори (L2b) — станова політика оркестрації (L3) діє над інвентарем L2, а людський нагляд (L4) несе вимірюване навантаження.

Фреймворк ґрунтується на усталеній метрології — GUM, VIM, ISO/IEC 17025 — і трактує довіру як інженеровану й вимірювану, а не декларовану. П’ять акронімних принципів (Trustworthy · Reasoned · Accountable · Context-bound · Escalated) дисциплінуються внутрішнім проєктним обмеженням — Model Parsimony — кількісно вираженим коефіцієнтом обчислювальної парсимонії (CPR): першою повноцінною метрикою компромісу складність–якість у довіреному ШІ.

Три інстанси — клінічна підтримка рішень (Інстанс A), промислова багатодоменна платформа (Інстанс B) і судове розширення підтримки рішень (Інстанс C) — демонструють доменну нейтральність. Архітектура дає структурну основу для пошарового GUM-поширення невизначеності у напрямі формальної сертифікації.

§1

Референсна архітектура — п’ять шарів × три інстанси

Рядки — архітектурні шари (з поділом L2 на класичний ML і LLM-валідатори); стовпці — референсні інстанси. Кожна клітинка називає конкретний артефакт, що заповнює шар у цьому інстансі.

шар \ інстанс

Інстанс A

Клінічна підтримка рішень

Інстанс B

Промисловий багатодоменний

Інстанс C

Судова підтримка рішень

Людський нагляд

Нагляд акредитованого оператора — ISO/IEC 17025

Лікар як фінальний рецензент; узгоджено з фреймворком людина–ШІ TRIAD

Бурильник, супервайзер, HSE-офіцер (технологія / операції); юрист, офіцер закупівель (адміністрування); врядування DNV-RP-0671

Суддя або помічник судді як фінальний рецензент; емпіричний прецедент: Kolkman et al. (Justitia, 2024)

Ярусна оркестрація

Ієрархічні ланцюги калібрування

Рутинні випадки через калібрований L2a; межова впевненість → валідатор L2b; спільне high-risk ∧ high-confidence або неузгодженість L2a/L2b → обов’язкова передача клініцисту

Маршрутизація за ярусами вартості по піддоменах; стійка аномалія + high-risk → сигнал бурильнику; порушення SLA → ескалація оператору; високоризикові клаузули → юрист / комплаєнс-офіцер

L2a/NER відбирає релевантні прецеденти; валідатор L2b — обов’язкова перевірка на галюцинації; високоризикова вимога з упевненою рекомендацією → юридичний перегляд

L2b

LLM-валідатори

Етап суб’єктивної інспекції в метрологічному аудиті

LLM-валідатор над вільнотекстовими клінічними нотатками; перевірки узгодженості з анамнезом пацієнта

Семантична кореляція журналів буріння з наративами інцидентів; видобуток клаузул і diff документів в адміністративному піддомені

LLM для аналізу матеріалів справ, семантична кореляція прецедентів, підготовка проєктів документів

L2a

Класичний ML

Характеризація приладу — GUM

Оцінки ризику, часові ряди вітальних показників, класифікатори лабораторних даних; NER над структурованим текстом клінічних записів

Виявлення аномалій, класифікатори предиктивного обслуговування, моделі залишкового ресурсу; CNN/LSTM над сигналами MWD/LWD; оцінювання ризику постачальників

Класифікація документів, ранжування релевантності прецедентів, NER над матеріалами справ

Детерміноване / фізичне ядро

Еталонні матеріали, простежувані стандарти

Орієнтована на правила клінічна логіка; простежуваність у дусі FUTURE-AI

Керування на основі фізики: пріоритетний контролер, автоматизація буріння, діапазони параметрів; запобіжні блокування; комплаєнс-каркас для закупівель і контрактів

Процесуальні та матеріальні правові норми; Етична хартія CEPEJ як орієнтир врядування

§2

П’ять принципів + одне проєктне обмеження

Акронім TRACE відображає п’ять видимих користувачеві властивостей. Model Parsimony — кількісно виражене внутрішнє проєктне обмеження, що дисциплінує вибір L2a / L2b.

T · Trustworthy

Простежуваність доказів

Кожна приписова дія несе машиночитабельний ланцюг доказів — дані → висновок → рішення.

→ ETC · Повнота ланцюга доказів

R · Reasoned

Обмежений людський нагляд

Людський нагляд — архітектурний шар із вимірюваним навантаженням і правом перекриття, а не косметичний запобіжник.

→ OvR · Частка перекриттів

A · Accountable

Поетапна автономія

Авторитет здобувається через накопичені дані стабільності та явну кваліфікацію — а не надається за замовчуванням на релізі.

→ ABC · Дотримання меж автономії

C · Context-bound

Обмежений контекст

Вхідний контекст явно специфікований, датований і оновлюваний як частина оболонки безпеки.

→ CFI · Індекс свіжості контексту

E · Escalated

Метрологічна підзвітність

Кожна властивість якості специфікується, вимірюється, калібрується й моніториться в часі.

→ CE · Похибка калібрування

Внутрішнє проєктне обмеження — поза акронімом TRACE

Парсимонія моделі

Тип навченого компонента (класичний ML, спеціалізована нейромережа, LLM, гібрид) обирається за відповідністю задачі — а не за презумпцією LLM.

Внутрішнє проєктне обмеження — кількісно через CPR, поза акронімом TRACE.

Кількісно через

CPR · Коефіцієнт обчислювальної парсимонії

CPR = 1 — оптимум
CPR ≪ 1 — архітектурний overhead

§3

Метрики довіри

Сімнадцять вимірюваних показників: дванадцять пошарових, чотири крос-шарові та одна економічна (CPR). Фільтруйте за шаром або типом.

Шар

Тип

17 із 17

ABC

Дотримання меж автономії

Крос-шар

Відповідність

Частка дій, виконаних у межах визначеної автономії системи.

Похибка калібрування

Крос-шар

Калібрування

Відхилення заявленої впевненості від емпіричної точності.

CFI

Індекс свіжості контексту

Свіжість

Зважена свіжість даних в активному контексті.

CPR

Коефіцієнт обчислювальної парсимонії

Економіка

Парсимонія

Відношення вартості ресурсів найекономічнішої моделі, що задовольняє вимоги задачі (точність, калібрування, операційна надійність), до фактичної вартості розгорнутої моделі. CPR = 1 — оптимум; CPR ≪ 1 — архітектурний overhead. Перша повноцінна формалізація компромісу складність–якість як метрики в довіреному ШІ.

CRP

Точність релевантності контексту

Точність

Частка елементів контексту, дійсно релевантних задачі.

Точність ескалації

Точність

Частка ескалацій, що дійсно потребували вищого ярусу.

ETC

Повнота ланцюга доказів

Крос-шар

Простежуваність

Частка виходів із повним ланцюгом доказів (дані → рішення).

FPA

Послаблення хибних спрацювань

Фільтрація

Придушення хибно-позитивних ескалацій через повторний виклик компонентів L2 за політикою.

IPSR

Стабільність до збурень входу

Стабільність

Частка відповідей, стабільних до перефразування й збурення входу.

OSI

Індекс операційної стабільності

Крос-шар

Дрейф

Варіація ключових метрик довіри в часі.

OvR

Частка перекриттів

Поведінка

Частка виходів ШІ, змінених людьми-рецензентами.

RBI

Індекс навантаження рецензента

Навантаження

Середній час рецензента на справу на людському ярусі.

RCI

Індекс узгодженості правил

Стабільність

Стабільність виходу правил під час оновлень системи.

RCR

Покриття правилами

Покриття

Частка сценаріїв, покритих явними правилами детермінованого ядра.

SNR

Відношення сигнал/шум

Фільтрація

Відношення критичних справ до загального потоку, що сягає людського ярусу.

TCC

Коефіцієнт вартості ярусу

Вартість

Сукупна обчислювальна вартість обраного шляху ескалації.

UTC

Коефіцієнт простежуваності оновлень

Простежуваність

Частка змін правил із задокументованим обґрунтуванням і простежуваним походженням.

§4

Референсні інстанси

Дві фундаментальні реалізації (A клінічна, B промислова багатодоменна) мотивували формалізацію. Третя (C судова) демонструє перенесення в домен з принципово іншим контекстом врядування.

Інстанс A

Клінічна підтримка рішень

Фундаментальний інстанс

Лідер

Заболотній, Голінко, Антоненко

Статус

Стаття 0 · журнал IMM — на рецензії

Інстанс B

Промисловий багатодоменний

Фундаментальний інстанс · нафтогаз

Лідер

А. Щербань

Статус

Патент у розгляді · UA u 2025 04038 · депозит U.S. Copyright Office (бер. 2026)

Інстанс C

Судова підтримка рішень

Часткове розширення

Лідер

Заболотній (у рамках проекту ПрАТ «Фінпорт Текнолоджіс Інк.» для підтримки Верховного Суду України за фінансування Expertise France)

Статус

Модернізація порталу «База правових позицій»

§4·B

Інстанс B детально — піддомен × шар

Промислова платформа охоплює три операційні піддомени. Чотиришарова архітектура інстансується по-різному в кожному: домінантний шар зсувається з типом доказів — ілюструючи принцип Model Parsimony.

шар \ піддомен

Технологія

Upstream: буріння, видобуток, операції зі свердловинами

Операції

Рішення з обслуговування, моніторинг обладнання, відстеження KPI

Адміністрування

Документообіг, закупівлі, життєвий цикл контрактів, комплаєнс

Детерміноване / фізичне ядро

ACTIVE

Ядро керування на основі фізики: пріоритетна логіка, діапазони параметрів, межі допусків

ACTIVE

Процедури обслуговування, регуляторні інтервали, запобіжні блокування

DOMINANT

Комплаєнс-каркас: правила закупівель, віхи життєвого циклу контрактів, вимоги до аудит-треку (формально специфіковані, не навчені)

L2a

Класичний ML

DOMINANT

Класичний ML над структурованими сигналами сенсорів і станів обладнання — верифіковний за калібруванням і відтворюваністю

DOMINANT

Класичний ML над структурованими сигналами обладнання й процесів — предиктивне обслуговування, виявлення аномалій, оцінка залишкового ресурсу

PRESENT

Класичний ML для структурованих сигналів над даними закупівель і постачальників

L2b

LLM-валідатори

PRESENT

LLM-валідатори, що залучаються асинхронно для наративного ретроспективного перегляду

PRESENT

LLM-валідатори над вільнотекстовими звітами про інциденти та історичними журналами

DOMINANT

LLM-валідатори для перегляду вільнотекстових контрактів і документів (семантичний diff, виявлення нестандартних умов)

Ярусна оркестрація

ACTIVE

Маршрутизація за смугами допуску; стійка аномалія ∧ high-risk запускає передачу людині; покомпонентна оркестрація незалежна від класу моделі L2

ACTIVE

Маршрутизація за ярусами вартості; порушення SLA, спільне risk ∧ confidence або неузгодженість L2a/L2b запускає ескалацію оператору; повний аудит-трек

ACTIVE

Маршрутизація за ярусами ризику; стандартний контракт через L1; нестандартні клаузули маршрутизуються до компонентів L2; високоризикові позначки запускають обов’язкову передачу юристу

Людський нагляд

ACTIVE

Бурильник / супервайзер з правом перекриття

ACTIVE

Супервайзер операцій як фінальний рецензент

ACTIVE

Юрист / офіцер закупівель / комплаєнс-офіцер як фінальний рецензент

Технологія

Upstream: буріння, видобуток, операції зі свердловинами

L1 · Детерміноване / фізичне ядроACTIVE

Ядро керування на основі фізики: пріоритетна логіка, діапазони параметрів, межі допусків

L2a · Класичний MLDOMINANT

L2b · LLM-валідаториPRESENT

LLM-валідатори, що залучаються асинхронно для наративного ретроспективного перегляду

L3 · Ярусна оркестраціяACTIVE

L4 · Людський наглядACTIVE

Бурильник / супервайзер з правом перекриття

Операції

Рішення з обслуговування, моніторинг обладнання, відстеження KPI

L1 · Детерміноване / фізичне ядроACTIVE

Процедури обслуговування, регуляторні інтервали, запобіжні блокування

L2a · Класичний MLDOMINANT

L2b · LLM-валідаториPRESENT

LLM-валідатори над вільнотекстовими звітами про інциденти та історичними журналами

L3 · Ярусна оркестраціяACTIVE

L4 · Людський наглядACTIVE

Супервайзер операцій як фінальний рецензент

Адміністрування

Документообіг, закупівлі, життєвий цикл контрактів, комплаєнс

L1 · Детерміноване / фізичне ядроDOMINANT

L2a · Класичний MLPRESENT

Класичний ML для структурованих сигналів над даними закупівель і постачальників

L2b · LLM-валідаториDOMINANT

L3 · Ярусна оркестраціяACTIVE

L4 · Людський наглядACTIVE

Юрист / офіцер закупівель / комплаєнс-офіцер як фінальний рецензент

ІнтенсивністьDOMINANTосновний шлях рішенняACTIVEрегулярний внесокPRESENTвузька / допоміжна роль

Та сама чотиришарова архітектура інстансується по-різному в кожному піддомені: домінантний шар зсувається з типом доказів — класичний ML для структурованих сигналів, L1+LLM-валідатори для роботи, зв’язаної з правилами та мовою. Покомпонентну методологію та операційну статистику окремо звітує розробник системи (Стаття 2).

§5

Дорожня карта з чотирьох статей

Стаття 1 (супутник цього сайту) — крос-доменний синтез фреймворку. Стаття 0 заземлює його у клінічному фундаментальному інстансі; Статті 2 і 3 — доменне та метрологічне поглиблення.

[paper 0]

Клінічна фундаментальна

Від довіри «чорної скриньки» до вимірюваної довіри в клінічному ШІ: фреймворк доказів, нагляду та поетапної автономії

Заболотній, Голінко, Антоненко · IEEE Instrumentation & Measurement Magazine — спецвипуск «A Measure of Trust in Healthcare»

На рецензії · вер. 2026

[paper 1]

Синтез фреймворку

TRACE: метрологічно обґрунтований інженерний фреймворк довіреного агентного ШІ в операційно-критичних доменах

Заболотній (одноосібно) · препринт arXiv

Опубліковано на arXiv (трав. 2026) — цей сайт є супутником

[paper 2]

Промислове багатодоменне поглиблення

Промислова багатодоменна агентна платформа для upstream-нафтогазу: інстанс TRACE

Щербань (лідер), Заболотній · Scopus-індексований журнал з промислового ШІ

Заплановано · Q3 2026

[paper 3]

Метрологічне поглиблення

Пошарове GUM-поширення у TRACE: формальний бюджет невизначеності для агентних ШІ-систем

Заболотній (лідер), Щербань · IEEE Transactions on Instrumentation and Measurement

Заплановано (опційно)

Автори та внески →

TRACE: інженернийфреймворк довіреногоагентного ШІ.

Референсна архітектура — п’ять шарів × три інстанси

П’ять принципів + одне проєктне обмеження

Метрики довіри

Референсні інстанси

Інстанс B детально — піддомен × шар

Дорожня карта з чотирьох статей

TRACE: інженерний
фреймворк довіреного
агентного ШІ.