Том 8

Permanent URI for this collection

https://ekmair.ukma.edu.ua/handle/123456789/38090

Browse

Now showing 1 - 20 of 32

Передмова
(2025) Глибовець, Микола
Передмова до Т. 8 наукового журналу "Наукові записки НаУКМА. Комп’ютерні науки". Пропонуємо вашій увазі випуск наукового журналу "Наукові записки НаУКМА. Комп’ютерні науки". Цей збірник відображає творчі досягнення вчених і магістрів факультету інформатики Національного університету "Києво-Могилянська академія", а також провідних науковців із різних наукових центрів України, що взаємодіють із нашим університетом у галузі інформатики, кібернетики та програмування.
MorphoNAS-Bench: a Benchmark Suite for Morphogenetic Neural Network Generation
(2025) Medvid, Serhii
We present MorphoNAS-Bench, a benchmark and toolkit for neural architecture search (NAS) using a generative, developmentally inspired design space. Unlike current NAS benchmark datasets (NAS-Bench-101, NATS-Bench) that use static graph encodings of networks, in MorphoNAS-Bench networks are simple, compact genomes that drive morphogenetic development, allowing for a variety of richly defined, spatially embedded recurrent architectures that emerge through different forms of deterministic growth. The following local developmental rules are used in MorphoNAS to grow genomes: morphogen diffusion, cell division, differentiation, and axon guidance as key mechanisms. The seed benchmark dataset presented in this work consists of 1,000 genome-architecture pairs, taken from a pool of over 50,000 generation attempts using the following quality thresholds: a minimum 5 neurons, 3 edges, and 70% out-degree coverage. The dataset was constructed using Latin Hypercube Sampling (LHS) with orthogonal array design to ensure comprehensive parameter space coverage. The attempts were conducted using both fully stratified parameter sampling and a biologically inspired Genome.random() sampling method, ensuring a reasonable level of coverage of the search space while being plausible. Each sample includes detailed annotations of graph entropy, hierarchy scores, core-periphery structure, transitivity, reciprocity, and structural balance metrics. We share an analysis of the emergent properties like size, modularity, grouping, and efficiency, demonstrating that both generation strategies can produce structured networks that are rich in their nontriviality. The provided Python toolkit provides the means of investigation to test how genomes develop into neural networks, with associated structural analysis, framing MorphoNAS-Bench as a reproducible and biologically inspired testbed for any research studies exploring architecture diversity, evolution, and emergent structure in NAS.
Програмна система класифікації текстів на основі машинного навчання та рекурентної нейронної мережі
(2025) Глибовець, Андрій; Дубовик, Андрій; Афонін, Андрій
У цій роботі описано побудову та результати тестування програмної системи автоматичної класифікації текстів, яка полягає в розподілі текстів за певними категоріями, зокрема текстів українською мовою. Наш застосунок побудований на використанні трьох моделей — Naive Bayes, Support Vector Machine, LSTM — архітектури рекурентної нейронної мережі Recurrent Neural Network (RNN) та їх комбінації. Він дає змогу доволі швидко і точно класифікувати тексти, надавати користувачу можливість зручним способом натренувати систему на власних даних і досить просто налаштувати параметри для оптимальних результатів. Для ефективного опрацювання вхідних даних і реалізації алгоритму класифікації ми вибрали мову програмування Python. Основними бібліотеками реалізації функціоналу застосунку стали TensorFlow, scikit-learn (для надання простого та зрозумілого інтерфейсу), Natural Language Toolkit (nltk), NumPy, Pandas. Matplotlib і seaborn застосовували для візуалізації даних і побудови графіків. Розроблений графічний застосунок здатен розпізнавати тексти (англійською або українською мовою) чотирьох категорій (World, Sports, Science / Technology, Business) з точністю близько 92 %. Для навчання моделей ми застосували AG News Classification Dataset із kaggle.com. Тестування застосунку підтвердило припущення, що спеціалізовані моделі, крім того, що є значно ефективнішими в плані використання ресурсів, також можуть демонструвати кращий результат у класифікації текстів, ніж LLM. Система також може бути швидко адаптована й до задачі фільтрації спаму. За декілька секунд можна отримати SVM модель, яка зможе розпізнавати типові спам-повідомлення з точністю близько 99 %. Так само були протестовані можливості системи при розпізнаванні емоційної забарвленості тексту. Вдалося досягти точності 87,75 %.
Modern Approaches to Controllable Emotional Speech Synthesis
(2025) Ivashchenko, Dmytro; Marchenko, Oleksandr
The generation of emotionally expressive and controllable speech is one of the most dynamic and technically demanding areas in the intersection of artificial intelligence, natural language processing, and speech synthesis. Recent progress in emotional text-to-speech (TTS) systems has enabled increasingly natural and emotionally nuanced voice generation, shifting from early concatenative methods to advanced neural models. This review provides a structured overview of the state of the art in controllable emotional TTS, highlighting key architectural paradigms. A special focus is placed on emotional control mechanisms, including discrete emotional tagging with categorical or dimensional labels, reference-based control which conditions synthesis on prosodic or stylistic exemplars, and prompt-based techniques that leverage the capabilities of large language models for flexible and intuitive emotional specification. Despite substantial improvements in synthesis quality and emotional expressiveness, several critical challenges remain unresolved. These include the disentanglement of emotional, speaker, and prosodic features, the lack of standardized evaluation metrics for emotional clarity and naturalness, and the significant computational demands associated with training high-fidelity models. Furthermore, the scarcity of diverse and emotion-labeled speech data, especially for low-resource and morphologically rich languages, continues to limit the generalizability of current approaches. This review not only summarizes existing methods and their trade-offs but also outlines promising research directions, aiming to support the development of more robust, efficient, and emotionally expressive speech generation systems.
Hybrid AI Model for Financial Market Prediction
(2025) Voitishyn, Mykyta; Kuzmenko, Dmytro
Financial time series modeling is increasingly complex due to volatility, unexpected breakouts, and the impact of external factors, such as macroeconomic indicators, investor sentiment, company fundamentals, and extreme shocks, like geopolitical events or market manipulations. This paper introduces a hybrid artificial intelligence framework that integrates traditional statistical methods, machine learning models, and Bayesian neural networks (BNNs) to improve predictive performance and uncertainty quantification in financial forecasting. The model leverages a variety of engineered features, including rolling statistics, technical indicators, anomaly scores, interpolated macroeconomic data, and transformer-based sentiment scores. A complete ablation study compares various architectures, including ARIMA, SARIMA, MLR, SNN, and BNN, across multiple prediction windows (1, 3, 5 days) and feature combinations. Results show that while linear models yield the lowest MSE for short-term predictions, they fail to capture non-linear dependencies and uncertainty. In contrast, BNNs offer more reliable mid-term predictions by estimating predictive distributions. The best BNN configuration (Normal distribution, constant variation, TanH activation, 1 hidden layer) achieved an MSE of 0.00022, confirming the advantage of uncertainty-adjusted modeling. Sentiment analysis and anomaly detection were especially impactful when combined with macroeconomic indicators, improving signal reliability and behavioral insight. Our findings highlight the importance of integrating diverse data sources and accounting for predictive uncertainty in financial applications. Additionally, the experiments revealed that compact network architectures often outperform deeper ones when paired with engineered features. All experiments were systematically tracked to ensure reproducibility and facilitate future model benchmarking.
Застосування графових баз даних і Explainable AI у створенні рекомендаційної системи з гібридним способом фільтрації
(2025) Глибовець, Микола; Сидорова, Єлізавєта
У дослідженні описано побудову рекомендаційної системи з гібридним способом фільтрації, що використовує гетерогенні графові структури, нейронні мережі та Explainable AI заради підвищення персоналізації та прозорості рішень. Базова методологія оптимізації рекомендацій ґрунтується на сучасних методах машинного навчання, які здатні ефективно моделювати залежності між об’єктами. Предметна область задачі охоплює мультимедійні рекомендації, зосереджені на персоналізованому підході. Представлена архітектура системи дає можливість ефективно обробляти множину вузлів різних типів і зв’язків (набір взаємодій, належність елементів до жанру, подібність), що відображають комплексні ознаки поведінкових і контекстуальних даних. Результати експериментального тестування підтвердили ефективність запропонованого підходу: система демонструє високі показники персоналізації, новизни рекомендацій та здатності виявляти подібних користувачів.
Validating Architectural Hypotheses in Neural Decision Trees with Neural Architecture Search
(2025) Mykytyshyn, Artem; Shvai, Nadiia
This article introduces an automated and unbiased framework for validating architectural hypotheses for neural network models, with a particular focus on Neural Decision Trees (NDTs). The proposed methodology employs Neural Architecture Search (NAS) as an unbiased tool to explore architectural variations and empirically assess theoretical claims. To demonstrate this framework, we investigate a hypothesis found in the literature: that the complexity of decision nodes in NDTs decreases monotonically with tree depth. This assumption, initially motivated by the task of monocular depth estimation, suggests that deeper nodes in the tree require fewer parameters due to simpler split functions. To rigorously test this hypothesis, we conduct a series of NAS campaigns over the CIFAR-10 image and fully connected layers, while all other architectural components are held constant to isolate the effect of node depth. By applying Tree-structured Parzen Estimator (TPE)-based NAS and evaluating over 300 architectures, we quantify complexity metrics across tree levels and analyze their correlations using Spearman’s rank coefficient. The results provide no statistical or visual evidence supporting the hypothesized trend: node complexity does not decrease with depth. Instead, complexity remains nearly constant across levels, regardless of tree depth or search space size. These results suggest that assumptions derived from specific applications may not generalize to other domains, underscoring the importance of empirical validation and careful searchspace design. The presented framework may serve as a foundation for verifying other structural assumptions across various neural network families and applications.
Robustness of Neural Decision Trees to Noise in Input Data for Image Classification Tasks
(2025) Mokryi, Mykhailo; Shvai, Nadiia
Neural networks, particularly convolutional neural networks (CNNs), have demonstrated high effectiveness in image classification tasks. However, they are known to be vulnerable to input data perturbations and have weak interpretability due to their black-box nature. In contrast, traditional decision trees (DTs) provide transparent decision-making processes, but are limited to low-dimensional or tabular data, restricting their field of application in computer vision tasks such as image classification. To address this gap, a hybrid architecture known as Neural Decision Trees (NDTs) has emerged, combining strong generalization and learning capabilities of neural networks, with transparent hierarchical inference and interpretability of DTs. The article investigates the robustness of NDTs to noise in input data for image classification tasks. Despite the extensive studies covering the robustness of both CNNs and traditional DTs against various forms of input perturbations, the robustness of NDT models remains a largely underexplored area. This study provides two robust training methods to improve robustness: constant noise learning and incremental noise learning, originally developed for CNNs, but which can be effectively applied to NDT-based architectures and significantly improve the robustness to noisy images for models. These methods involve adding perturbed samples via a Gaussian blur during the training stage. The noisy test set consists of images perturbed by a Gaussian blur and is used to evaluate the robustness performance. A series of experiments were conducted on the CIFAR-10 dataset using the original training baseline and robust training methods. The results demonstrate that constant and incremental noise learning significantly improve the robustness of all tested NDT models to noisy images compared to their original training performance. While the ResNet18 baseline model demonstrates higher overall performance, the NDT models show comparable robustness improvements using the proposed robust training strategies. Constant noise learning offered an adjustable trade-off between performance on clean and noisy images, while incremental noise learning provided a more stable training process. The first method is considered preferable due to the simplicity of implementation. This study empirically confirms that NDT models can effectively use methods adapted from CNNs to improve their robustness against perturbations in input data. An NDT framework was developed to conduct training and validation using a standardized shared pipeline. It is available via the link: github.com/ MikhailoMokryy/NDTFramework.
Energy Conservation for Autonomous Agents Using Reinforcement Learning
(2025) Beimuk, Volodymyr; Kuzmenko, Dmytro
Reinforcement learning (RL) has shown strong potential in autonomous racing for its adaptability to complex and dynamic driving environments. However, most research prioritizes performance metrics such as speed and lap time. Limited consideration is given to improving energy efficiency, despite its increasing importance in sustainable autonomous systems. This work investigates the capacity of RL agents to develop multi-objective driving strategies that balance lap time and fuel consumption by incorporating a fuel usage penalty into the reward function. To simulate realistic uncertainty, fuel usage is excluded from the observation space, forcing the agent to infer fuel consumption indirectly. Experiments are conducted using the Soft Actor-Critic algorithm in a high-fidelity racing simulator, Assetto Corsa, across multiple configurations of vehicles and tracks. We compare various penalty strengths against the non-penalized agent and evaluate fuel consumption, lap time, acceleration and braking profiles, gear usage, engine RPM, and steering behavior. Results show that mild to moderate penalties lead to significant fuel savings with minimal or no loss in lap time. Our findings highlight the viability of reward shaping for multi-objective optimization in autonomous racing and contribute to broader efforts in energy-aware RL for control tasks. Results and supplementary material are available on our project website.
Використання одно- та багатомовних моделей на базі BERT для вирішення задач автоматичного оброблення текстів
(2025) Ванін, Данило
Обʼєктом дослідження цієї статті є одно- та багатомовні моделі на основі BERT. Предметом дослідження було порівняння продуктивності таких моделей на завданнях ОПМ із наголосом на їх застосуванні для української мови. Методологічну основу порівняльного аналізу становило використання стандартних підходів до навчання та оцінки моделей. У дослідженні використовувались доступні джерела інформації. Загалом результати дослідження свідчать про те, що як одномовні, так і багатомовні моделі на основі BERT можуть бути ефективними для вирішення завдань ОПМ залежно від конкретної мови, завдання та доступних ресурсів. Хоча одномовні моделі часто перевершують багатомовні у завданнях своєї конкретної мови, багатомовні моделі можуть мати перевагу, коли ресурси для навчання одномовних моделей обмежені. Проведене порівняння роботи одно- та багатомовних моделей для різних мов додатково підкреслило важливість проведення окремого порівняння їх застосування для української мови. Проведений аналіз сприятиме створенню комплексного україномовного бенчмарку, що покращить якість моделей і стимулюватиме нові дослідження у галузі ОПМ для української мови, розроблення нових, більш ефективних моделей.
Вплив методів добування знань на ефективність RAG-систем на основі графів
(2025) Андрощук, Максим
Стаття досліджує, як методи добування знань впливають на ефективність RAG-систем, що використовують графи знань. Вона показує, що якість графа знань, сформованого різними методами добування знань, є ключовою для подолання обмежень великих мовних моделей (LLM), таких як "галюцинації". Робота аналізує архітектури LightRAG і GraphRAG та підкреслює, що вибір оптимальної KE-стратегії залежить від конкретних завдань і предметної області.
Аугментація даних у комп’ютерному зорі із використанням генеративних моделей
(2025) Чоловський, Сергій; Бучко, Олена
У статті представлено огляд сучасних підходів до використання генеративних моделей для аугментації даних у задачах комп’ютерного зору. Показано, що ці моделі здатні генерувати високоякісні зображення та різні типи розмітки, що забезпечує їхню ефективність у широкому спектрі прикладних задач. Важливою умовою є недопущення витоку даних під час застосування переднавчених моделей. Проаналізовано методи оцінювання якості синтетичних даних, зокрема використання метрик візуальної якості та відповідності обумовлення, часто із залученням допоміжних моделей. Окреслено перспективні напрями подальших досліджень, зокрема забезпечення якості генерації без використання допоміжних моделей та розроблення методів вибору зразків для аугментації для найбільш ефективного навчання.
Оцінка трансформерних моделей mT5 для українсько-англійського перекладу
(2025) Махаммедов, Жан; Кирієнко, Оксана; Ткаченко, Владислав
Цю статтю присвячено кількісному вивченню впливу розміру архітектури Transformer на точність українсько-англійського машинного перекладу з використанням моделі mT5. Досліджено ефективність роботи моделей mT5 різних розмірів (small, base, large) щодо часу навчання, часу генерації перекладів і якості перекладу, оціненої метриками BLEU та chrF++. Результати показують, що більші моделі mT5 демонструють вищу якість перекладу, але потребують значно більше обчислювальних ресурсів. Результати дослідження підтверджують доцільність застосування моделей mT5 для українсько-англійського перекладу, навіть на типових обчислювальних системах.
Автоматична класифікація текстів
(2025) Дубовик, Андрій; Волинець, Євгеній
У цьому дослідженні здійснено аналіз сучасних підходів до класифікації текстової інформації. Особливу увагу приділено автоматичній класифікації текстів, що передбачає їхній розподіл за визначеними категоріями без використання ручного аналізу. Розглянуто й порівняно ефективність різних методів класифікації з акцентом на гібридні системи, які здатні поєднувати переваги окремих підходів і забезпечувати підвищену точність та продуктивність моделей. Також обґрунтовано вибір інструментальних засобів для подальшої програмної реалізації системи автоматизованої класифікації текстів за категоріями. Для навчання моделей запропоновано використовувати збірку AG News Classification Dataset з платформи kaggle.com. Доцільним вважається обмеження класифікаційного процесу комбінацією трьох моделей — Naive Bayes, Support Vector Machine (SVM) та Recurrent Neural Networks (RNN), які вирізняються невисокими вимогами до обчислювальних ресурсів і часу на тренування.
Порівняння архітектур нейронних мереж для сегментації пухлин мозку
(2025) Бучко, Олена; Плахотна, Дар’я
У роботі досліджено ефективність сучасних архітектур глибокого навчання для сегментації медичних зображень у задачі виявлення пухлин мозку. Проведено порівняльний аналіз моделей FCN, DeepLabv3+, PSPNet та Attention U-Net. Окрему увагу приділено впливу попереднього самоконтрольованого навчання на якість сегментації в умовах обмеженої кількості розмічених даних. Для оцінювання результатів використано метрику подібності.
Особливості індексації у PostgreSQL
(2025) Зважій, Дмитро
У статті наведено перелік основних типових індексів, реалізованих у PostgreSQL. Розглянуто можливості їх розширення та вдосконалення з урахуванням бізнес-завдань. Проаналізовано підхід Access Methods API. Описано методи життєвого циклу індексу в PostgreSQL. Також запропоновано інтерфейс для реалізації нового індексу в PostgreSQL на основі суфіксного дерева.
Метод шифрованої комунікації у стратегічних взаємодіях
(2025) Михайленко, Олександр; Гороховський, Кирило; Гороховський, Семен
У роботі досліджено можливості застосування наскрізного шифрування в середовищах з обмеженою довірою, зокрема в контексті стратегічних ігор та симуляцій. Незважаючи на широке впровадження таких технологій у сфері цифрової комунікації, їхній потенціал у специфічних сценаріях залишався недостатньо вивченим. Запропоновано новий підхід до захищеної взаємодії між учасниками шляхом адаптації криптографічного протоколу Double Ratchet. Розроблено application-level протокол, оптимізований для ігрових сценаріїв, і вперше реалізовано його компіляцію у WebAssembly, досліджено можливості використання протоколів наскрізного шифрування у браузерному середовищі, а також надання безпеки при зберіганні пар криптографічних ключів поза безпечними середовищами апаратного забезпечення, наведено приклад використання розробленого протоколу для забезпечення приватності у стратегічній комунікації. Проведено оцінку ефективності та безпеки рішення в умовах симульованого середовища з недовірою до сервера. Актуальність дослідження зумовлено зростанням потреби у захищеному зв’язку в умовах кібератак, зокрема в період воєнних дій.
Оцінювання управлінських рішень на основі методу аналізу ієрархій та моделі "стан — імовірність дії"
(2025) Тригуб, Олександр; Олецький, Олексій; Франчук, Олег
Пропонується підхід до оцінювання і моніторингу управлінських рішень на основі аналізу невідповідностей між рішеннями, які були фактично прийняті уповноваженими органами, і тими, які могли б бути прийняті при загальному голосуванні колективом агентів, якби таке голосування відбулося. В основі підходу лежить поєднання методу аналізу ієрархій і моделі "стан — імовірність дії" з урахуванням того, що на рішення впливає низка факторів із різним ступенем важливості, а також того, що при оцінці слід враховувати не тільки негайний виграш або програш, а й виграш або програш у перспективі. Наведено ілюстративний приклад.
Оптимізація вибору та розміщення датчиків цифрового двійника лабораторії 3D-друку на основі генетичних алгоритмів
(2025) Моголівський, Віталій
Розглянуто підходи до створення цифрових двійників в університетському середовищі. Досліджено рекомендований набір датчиків, необхідний для створення цілісного цифрового двійника університетської лабораторії. Розглянуто підхід до вибору та розміщення датчиків для цифрового двійника лабораторії 3D-друку на основі генетичного алгоритму. Сформульовано математичну постановку задачі. Запропоновано формат хромосоми, зважену фітнес-функцію та представлення тривимірного простору лабораторії.
Об’єктно-орієнтована парадигма: pro і contra
(2025) Бублик, Володимир; Фітель, Данило
У статті наведено критику парадигми об’єктно-орієнтованого програмування (ООП) та її найбільш поширених реалізацій. Досліджено історію виникнення та подальшої еволюції ООП, її сильні й слабкі сторони, а також спільні й відмінні риси між ООП та іншими парадигмами. Проаналізовано приклади вдалого співіснування парадигм ООП і узагальненого програмування на прикладі шаблонів у мові C++.

Browse

Recent Submissions