Ukrainian Journal of Information Systems and Data Science

Параметризація граф-схем алгоритмів цифрових пристроїв керування

Роман Бабаков — 2025-05-22

Розглядається науково-практична задача визначення множини параметрів граф-схем алгоритмів у контексті подальшої псевдовипадкової генерації граф-схем для дослідження ефективності методів синтезу і оптимізації цифрових пристроїв керування. Розглянуто структурні компоненти та визначено загальні параметри граф-схем алгоритмів, які традиційно використовуються для опису алгоритмів роботи цифрових пристроїв керування. Проаналізовано основні класи цифрових пристроїв керування, як-от мікропрограмний автомат (автомат з жорсткою логікою), мікропрограмний пристрій керування (автомат з програмувальною логікою) та композиційний мікропрограмний пристрій керування. Для зазначених класів пристроїв розглянуто основні методи оптимізації апаратурних витрат, серед яких кодування наборів мікрооперацій, заміна вхідних змінних, операційне перетворення кодів станів тощо. Для кожного з розглянутих класів пристроїв керування та методів оптимізації запропоновані набори параметрів граф-схеми алгоритму, які впливають на ефективність застосування відповідних структур і методів та характеризують як функцію переходів, так і функцію виходів пристрою керування. Для окремих параметрів визначено допустимий діапазон змін та співвідношення або взаємовиключність з іншими параметрами граф-cхем. Наведені ілюстративні приклади визначення окремих параметрів за заданою граф-схемою. Надано рекомендації щодо використання запропонованих параметрів для псевдовипадкової генерації граф-схем алгоритмів. Визначено такі загальні вимоги щодо коректної псевдовипадкової генерації граф-схем алгоритмів: можливість досягнення кінцевої вершини з будь-якої іншої вершини; відсутність вершин, у яких вхід не зв’язаний з виходом іншої вершини; відсутність повторення логічних умов у послідовно розташованих вершинах; наявність хоча б однієї операторної вершини тощо.

Експрес-ідентифікація реальних функцій українських наукових фахових видань на основі аналізу статистичних розподілів

Сергій Штовба — 2025-05-22

В Україні налічується майже 1 700 наукових фахових видань, приблизно 10% з яких належать до категорії А. Наукові журнали, окрім базової функції з поширення нових знань та фіксації пріоритету наукового результату, виконують і обліково-залікові та комерційні функції. Під час управління академічною діяльністю виникають питання, чи потрібна саме така кількість національних наукових журналів, чи повною мірою вони виконують усі свої функції і наскільки ефективно. Для відповіді на ці питання необхідно знати не лише загальну кількість національних наукових журналів, але і їх спектр – належність до тих чи інших галузей та спеціальностей, а також їх зв’язок з іншими показниками академічної діяльності. Нами зібрано експериментальні дані і побудовано за ними статистичні розподіли кількості вітчизняних фахових видань, нормованої кількості вітчизняних фахових видань, кількості експертів Національного агентства із забезпечення якості вищої освіти та кількості захистів PhD-дисертації. Нормована кількість вітчизняних фахових видань розглядається як груба оцінка кількості фахових публікацій у розрізі спеціальностей, статистичні дані за якими нам недоступні. Усі розподіли виявилися нерівномірними з квартильними коефіцієнтами від 14.8 до 81.7. Схожість розподілів оцінено за індексом Чекановського. Виявлено високу схожість розподілу кількості фахових журналів, а відповідно – і дотичного до нього розподілу членів редколегій, з розподілом кількості експертів Національного агентства із забезпечення якості вищої освіти, що дає змогу висунути гіпотезу про подібність мотивів цих двох академічних спільнот. Імовірно, головним мотивом є набуття додаткової статусності, відчуття деякої престижності від входження в ці спільноти. Також виявлено високу схожість розподілів нормованої кількості фахових журналів та кількості захищених PhD-дисертацій, що дає змогу висунути гіпотезу про те, що фахові видання позиціонуються саме як майданчик для аспірантських статей.

Повідомлення про ретракцію статті «Вплив інтелектуального світлофорного регулювання на пропускну здатність міського перехрестя»

Сергій Штовба — 2025-05-22

Статтю Ніколюка П. К. «Вплив інтелектуального світлофорного регулювання на пропускну здатність міського перехрестя» ретраговано з першого номера журналу «Ukrainian Journal of Information Systems and Data Science» за 2023 р.

Титул і зміст

Журнал "Ukrainian Journal of Information Systems and Data Science", №2 за 2024 р. містить статті за напрямами: алгоритми і структури даних, інформаційні ресурси, машинне навчання, технології обробки природньої мови.

Увесь випуск

Інженерія MLOps: метасинтез інструментів, практик та архітектур для автоматизації машинного навчання

Данило Олегович Ганчук — 2025-05-08

Автоматизація повного життєвого циклу моделей машинного навчання критично важлива для їх ефективного впровадження в робочому середовищі. За останні роки з’явилися різноманітні інструменти, фреймворки та архітектури для підтримки практик Machine Learning Operations (MLOps). У цій статті представлено метасинтез оглядів для комплексного аналізу технологій, що забезпечують реалізацію MLOps. Проведено порівняння можливостей та функцій, що пропонуються популярними комерційними та відкритими MLOps-платформами. Ідентифіковано шаблони в архітектурі MLOps та філософіях проєктування. Розглянуто роль контейнеризації, оркестрації, управління конфігурацією та автоматизації інфраструктури в ML-конвеєрах. Також обговорюються підходи до розгортання моделей у хмарі та на периферійних пристроях. Основні отримані результати: 1) проведено метасинтез систематичних оглядів для узагальнення знань щодо практик MLOps та визначено, що MLOps є перспективним підходом для ефективного розгортання моделей машинного навчання, який вимагає подальших досліджень; 2) проаналізовано зв’язки між принципами, процесами та практиками MLOp та запропоновано схему взаємозв’язків між ключовими принципами, етапами розробки і впровадження моделей та основними практиками MLOps; 3) визначено найбільш ефективні практики MLOps для розгортання моделей – безперервна інтеграція / доставка, версіонування моделей і даних, автоматизація конвеєрів машинного навчання, моніторинг продуктивності, управління експериментами, життєвим циклом, безпека та конфіденційність даних, пояснюваність моделей, управління якістю даних, конфігурацією, стратегії розгортання, автоматизація інфраструктури, співпраця, управління ризиками. Отримані результати мають теоретичну значущість в узагальненні та систематизації знань про практики MLOps і практичну значущість для впровадження та вдосконалення процесів MLOps в організаціях.

Еволюція нейронних моделей генерування тексту: систематичний огляд досліджень 2022–2024 років

Артем Слободянюк — 2025-05-22

Останні роки характеризуються значним прогресом у сфері нейронного генерування тексту завдяки появі великих мовних моделей та зростанню інтересу до цієї галузі. Цей систематичний огляд ідентифікує та узагальнює сучасні тенденції, підходи та методи нейронного генерування тексту за період 2022–2024 рр., доповнюючи попередній огляд за 2015–2021 рр. Відповідно до методології PRISMA, для аналізу було початково відібрано 89 статей з бази даних Scopus, із яких після перевірки критеріїв включення та виключення залишилося 43 статті. Виявлено зміщення акценту в бік інноваційних архітектур моделей, як-от Transformer-based (GPT-2, GPT-3, BERT), механізмів уваги та контрольованого генерування тексту. Метрики BLEU, ROUGE та оцінювання людиною залишаються найпопулярнішими. Але з’явилися і нові метрики, поміж яких виділимо BERTScore. Набори даних охоплюють різноманітні домени і типи даних; спостерігається зростання інтересу до неанотованих даних. Сфери застосування розширилися до областей генерування тексту на основі таблиць та графів знань, синтезу анотацій та машинного перекладу. У галузевому плані виділяється генерування медичних текстів. Хоча англійська мова продовжує домінувати, але спостерігається зростання досліджень для низькоресурсних мов, зокрема до німецької та китайської. Огляд також висвітлює актуальні виклики в цій галузі, зокрема адаптацію моделей для низькоресурсних мов, генерування тексту за умов обмеженості навчальних даних та етичні аспекти використання потужних мовних моделей. Автори підкреслюють важливість розробки більш ефективних та інтерпретовних архітектур, вдосконалення методів контрольованого генерування тексту та створення нових оцінювальних метрик. Результати дослідження підкреслюють швидку еволюцію методів нейронного генерування тексту, розширення сфер його застосування. В огляді також окреслено перспективні напрями для майбутніх досліджень з урахуванням актуальних викликів та етичних принципів.