Ukrainian Journal of Information Systems and Data Science https://jujisds.donnu.edu.ua/ <p>Журнал “<strong><em>Ukrainian Journal of Information Systems and Data Science</em></strong>” є міжнародним виданням, заснованим Донецьким національним університетом імені Василя Стуса. Журнал публікує оригінальні наукові статті та огляди за такою тематикою:<br />алгоритми та структури даних;<br />інформаційні ресурси;<br />моделі прийняття рішень;<br />мета-евристична оптимізація;<br />моделювання та оптимізація мережевих систем;<br />безпечність та надійність складних систем;<br />людино-комп’ютерна взаємодія;<br />інформаційні системи на основі інтернету речей;<br />машинне навчання;<br />інженерія знань;<br />технології обробки природної мови.<br />Періодичність виходу журналу: 2 рази на рік.<em><strong><br />Публікація в журналі є безкоштовною.<br /></strong></em>Журнал індексується в Google Scholar, Crossref, Dimensions та Mendeley.<br />ISSN 2786-9482 УДК 004<br />Acceptance rate = 0.77</p> Донецький національний університет імені Василя Стуса uk-UA Ukrainian Journal of Information Systems and Data Science 2786-9482 Методи розв’язання задачі управління запасами на основі нейро-асоціативного навчання і навчання з підкріпленням https://jujisds.donnu.edu.ua/article/view/16369 <p>Сьогодні актуальним завданням є розробка інтелектуальних методів, спрямованих на розв’язання задач управління запасами. Багато сучасних компаній для вдосконалення та оптимізації своїх бізнес-процесів використовують технологію теорії обмежень, яка забезпечує динамічне управління буфером запасів і використовується для управління ланцюгами поставок. Метою роботи є підвищення ефективності управління запасами за допомогою нейро-асоціативного навчання на основі обмеженої машини Коші та навчання з підкріпленням на основі Q-навчання та SARSA. Для досягнення поставленої мети створено метод на основі обмеженої машини Коші для управління буфером запасів, метод на основі Q-навчання та метод на основі SARSA для загальних задач управління запасами. Запропонована нейромережева модель обмеженої машини Коші має гетероасоціативну пам’ять без обмежень на ємність і забезпечує високу точність управління буфером запасів. Модель використовує розподіл Коші, що покращує збіжність методу параметричної ідентифікації, порівняно з традиційною обмежено машиною Больцмана. На відміну від повної машини Коші, обмежена машина Коші дає змогу працювати з більшим обсягом пам'яті. Модифікація методів Q-навчання та SARSA за рахунок динамічних параметрів дає змогу підвищити швидкість навчання за заданого рівня середньоквадратичної помилки. Проведені обчислювальні експерименти показали, що керування важливістю нагороди, параметром швидкості навчання, параметром для <em>e</em>--жадібного підходу для методів Q-навчання та SARSA дає змогу на початкових стадіях зробити пошук рішення більш глобальним, а на заключних стадіях зробити пошук рішення більш локальним. Запропоновані методи дають змогу розширити сферу застосування нейро-асоціативного навчання та навчання з підкріпленням, що підтверджується їх адаптацією для задач управління запасами та сприяє підвищенню ефективності інтелектуальних комп’ютерних систем загального і спеціального призначення. Перспективами подальших досліджень є застосування запропонованих методів для інших задач прийняття рішень, зокрема й у області штучного інтелекту.</p> Євген Федоров Тетяна Уткіна Ольга Нечипоренко Авторське право (c) 2024 2024-10-10 2024-10-10 1 63–77 63–77 10.31558/2786-9482.2024.1.5 Різноманіття псевдовипадкових блукань шахового коня для скремблювання багатовимірних даних https://jujisds.donnu.edu.ua/article/view/16364 <p>Задача відкритого циклу шахового коня полягає у побудові послідовності ходів шахового коня, яка повністю покриває шахову дошку без повторів, де початкове та кінцеве положення є завжди різними. Розв’язок задачі відкритого циклу шахового коня подібний до послідовності псевдовипадкових чисел, за якими можна відобразити дані у корисну інформацію без можливості її читання. Задача відкритого циклу шахового коня для певного стартового положення має різноманіття розв’язків, кількість яких залежить від розміру шахової дошки. Розв’язки задачі відкритого циклу шахового коня виглядають як його псевдовипадкове блукання або як випадкова послідовність його положень. Ці розв’язки використовуються для подальшого покращення балансу простоти скремблювання та продуктивності, де головними показниками є ймовірність зламу та індекс подібності. Ймовірність зламу суттєво зменшується завдяки різноманіттю псевдовипадкових блукань шахового коня для певного стартового положення на даній шаховій дошці. Песимістична оцінка ймовірності зламу для шахової дошки розміром 8×8 є меншою за 10<sup>-16</sup>. Аналогічна оцінка для шахової дошки розміром 8×8×8 є меншою за 10<sup>-26</sup>. Конкретна реалізація псевдовипадкового блукання шахового коня будується в режимі онлайн за заданого початкового цілого для генератора псевдовипадкових чисел. Вектор даних після скремблювання також будується в режимі онлайн за лінійної часової складності. Індекс подібності є прийнятним. Він стрімко падає зі зростанням розміру шахової дошки (для більших масивів багатовимірних даних). Конкретне псевдовипадкове блукання шахового коня визначається розміром шахової дошки, початковим положенням, методом векторизації псевдовипадкового блукання шахового коня, а також початковим цілим для генератора псевдовипадкових чисел. Ці параметри визначають специфічний рух коня у ситуаціях, коли постають множинні варіанти подальшого руху. Скремблер на основі відкритого циклу шахового коня має від 10<sup>16 </sup>до 10<sup>21 </sup>разів меншу ймовірність зламу, порівняно зі звичайним псевдовипадковим генератором, залежно від розміру шахової дошки та початкового положення шахового коня.</p> Вадим Романюк Авторське право (c) 2024 https://creativecommons.org/licenses/by-nc/4.0 2024-10-10 2024-10-10 1 1–13 1–13 10.31558/2786-9482.2024.1.1 Дослідження ефективності розпаралелювання процесорозалежних задач мовою Python на основі механізму потоків https://jujisds.donnu.edu.ua/article/view/16365 <p>Метою роботи є дослідження ефективності застосування паралельної обробки даних на основі потоків у мові Python для розв’язання задач, які потребують значних ресурсів центрального процесора. В якості такої задачі розглядалась задача обробки двовимірного масиву великих розмірів стандартними засобами Python без використання спеціалізованих бібліотек на кшталт Numpy. Виявлено непрогнозоване зменшення часу виконання багатопотокової програми на 30% у порівнянні з послідовною (непаралельною) реалізацією розв’язуваної задачі. Це дає змогу поставити під сумнів загальновідоме твердження про те, що багатопотокове розв’язання процесорозалежних задач саме в мові Python не є ефективним, оскільки не приводить до зменшення часу роботи програм. Раніше вважалося, що завдяки використанню так званого глобального замка (GIL) інтерпретатор мови Python у разі виконання багатопотокових програм із застосуванням модуля Threading спрямовує усі потоки програми на одне процесорне ядро, що виключає фізичне паралельне виконання потоків і за жодних умов не дає змоги зменшити час роботи програми. Відомою рекомендацією для отримання реального виграшу в часі є використання розпаралелювання на основі механізму процесів і модуля «multiprocessing», який допомагає задіяти кілька фізичних ядер процесора. Однак такий підхід потребує додаткових ресурсів процесора (ядер) та додаткових витрат часу на обмін даними між процесами, що може звести нанівець ефект від багатоядерної обробки. Проведені авторами експерименти довели, що застосування багатопотокового підходу також може бути доцільним у випадку процесорозалежних задач, оскільки виграш у часі, що досягається, не потребує додаткових ресурсів з боку центрального процесора комп’ютера та зайвих витрат часу на обмін даними між потоками.</p> Роман Бабаков Олександр Баркалов Авторське право (c) 2024 2024-10-10 2024-10-10 1 15–26 15–26 10.31558/2786-9482.2024.1.2 Залежність швидкодії програм від інструментальних засобів розробки та синтаксичних конструкцій https://jujisds.donnu.edu.ua/article/view/16366 <p>Запропоновано реалізацію автоматизованої інформаційної системи, що дає змогу досліджувати та аналізувати вплив інструментальних засобів розробки та синтаксичних конструкцій на швидкодію роботи програм. У системі застосовано архітектуру трирівневих баз даних. Спеціалізований додаток LST Client використано як клієнт, LST Web Service як сервер додатків, а MySQL як реляційна СУБД. Взаємодія додатка LST Client з LST Web Service відбувається за допомогою Web API з використанням Application Key. Application Key являє собою унікальний ключ, який створюється для кожного пристрою, що бере участь у дослідженні. Для тих випадків, коли у досліджені має взяти участь пристрій, розташований поза межами intranet-мережі, підключення здійснюється аналогічним способом, але через спеціально налаштований SSH-тунель. Для кожного пристрою створюється відповідний користувач з авторизацією за особистим RSA-ключем максимальної довжини. Дослідження проведено для мов програмування C, C++, Fortran, Java, C#, JavaScript, PHP, Python з використанням компіляторів та інтерпретаторів, що належать до x64 архітектури під керуванням Windows&nbsp;10 для освітніх установ. Результати експериментів засвідчили, що на швидкодію програми впливає версія компілятора чи інтерпретатора, та набір синтаксичних конструкцій, що використовується, наприклад, ++i та i++. Лише компілятори мов програмування C, C++ та Fortran змогли оптимізувати код та не виконувати зайві цикли. Розроблена система дає змогу максимально автоматизувати процес тестування швидкодії програмного коду. Запропонована система може бути використана для оцінювання нових версій мов програмування та програмного забезпечення. Вона також може бути задіяна під час викладання дисциплін, пов’язаних із програмуванням, для звернення уваги студентів на слабкі та сильні місця мов програмування та інструментальних засобів розробки.</p> Юрій Антонов Авторське право (c) 2024 2024-10-10 2024-10-10 1 27–39 27–39 10.31558/2786-9482.2024.1.3 Експрес-підбір опонентів для разових рад із захисту PhD-дисертацій https://jujisds.donnu.edu.ua/article/view/16367 <p>Сьогодні ради із захисту PhD-дисертацій формують у ручному режимі. Це обумовлює як корупційні ризики, так і значні витрати часу на пошук та аналіз кандидатів з великими шансами пропустити кваліфікованих опонентів. Тому виникає зацікавленість у автоматизації формування разових рад для усунення зазначених ризиків впливу людського фактора. Стаття фокусується на експрес-підборі рад, коли потрібно сильно звузити великий список кандидатів. Подальший короткий список можна аналізувати або вручну, або передавати на процедуру тонкого підбору, яка є ресурсно-витратною і вимагає значно більшого об’єму початкової інформації. Пропонується метод призначення команди рецензентів за їх відповідністю тематиці дисертації, який, на відміну від ізольованого підбору кандидатів, враховує здатність саме колективу рецензентів спільно оцінити роботу за всіма аспектами її тематики. Метод є збалансованим за критеріями якості підбору і витратами ресурсів на пошук членів ради. Метод включає три етапи. На першому етапі здійснюється категоризація дисертації та потенційних членів ради шляхом представлення їх тематик векторами у просторі наукових спеціальностей з ANZSRC-2020. На другому етапі розраховується рівень відповідності кандидатів тематиці дисертації з урахуванням спорідненості наукових спеціальностей ANZSRC-2020. На третьому етапі підбирається склад ради, яка відповідає тематиці дисертації з максимально можливим ступенем. Для реалізації третього етапу запропоновано кілька алгоритмів оптимізації. Тестування алгоритмів на сформованому датасеті із 67 PhD-дисертацій показало, що найкращий баланс за критеріями якості підбору й витрат ресурсів на пошук колективу забезпечують жадібний алгоритм без елітизму та повний перебір на прорідженій множині кандидатів. Внаслідок оптимізації вдалося покращити склад разових рад у середньому на 13–34% залежно від типу використаного алгоритму.</p> Сергій Штовба Микола Петричко Авторське право (c) 2024 2024-10-10 2024-10-10 1 41–62 41–62 10.31558/2786-9482.2024.1.4