Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій

Чоловський, Сергій; Здирко, Владислав

Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій

dc.contributor.author	Чоловський, Сергій	uk_UA
dc.contributor.author	Здирко, Владислав	uk_UA
dc.date.accessioned	2026-02-06T11:05:26Z
dc.date.available	2026-02-06T11:05:26Z
dc.date.issued	2025
dc.description	This work presents a general framework for generating VQA (Visual Question Answering) datasets across arbitrary knowledge domains. Logically complex questions are derived from OWL-ready formatted ontologies, and correct answers are obtained using SPARQL queries. The diversity of generated questions is enhanced through paraphrasing with a large language model. Relevant scenes are generated using Stable Diffusion with CLIP-score–based post-filtering. We believe this hybrid approach enables efficient creation of high-quality, semantically rich datasets.
dc.description.abstract	Одним з напрямків комп’ютерного зору є візуально-лінгвістична обробка зображень, він включає в себе, зокрема, такі задачі як опис(captioning), відповіді на питання за зображенням(далі VQA - visual question answering), та загальне розуміння(visual common sense reasoning). Задача VQA полягає в тому, щоб на основі зображення надати коротку відповідь на розгорнуте питання (в common sense задачах відповідь може бути довільною).	uk_UA
dc.identifier.citation	Чоловський С. О. Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій / Чоловський С. О., Здирко В. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 80-81.	uk_UA
dc.identifier.uri	https://ekmair.ukma.edu.ua/handle/123456789/38281
dc.language.iso	uk	uk_UA
dc.publisher	Національний університет "Києво-Могилянська академія"	uk_UA
dc.relation.source	Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ	uk_UA
dc.status	first published	uk_UA
dc.subject	комп’ютерний зір	uk_UA
dc.subject	VQA-датасети	uk_UA
dc.subject	онтологічні моделі	uk_UA
dc.subject	генеративні нейронні мережі	uk_UA
dc.subject	матеріали конференції	uk_UA
dc.title	Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій	uk_UA
dc.type	Conference materials	uk_UA

Files

Original bundle

Now showing 1 - 1 of 1

Name:: Cholovskyi_Zdyrko_Materialy_konferentsii.pdf
Size:: 1.15 MB
Format:: Adobe Portable Document Format

Download

License bundle

Now showing 1 - 1 of 1

Name:: license.txt
Size:: 1.71 KB
Format:: Item-specific license agreed upon to submission
Description:

Download

Collections

16 міжнародна науково-практична конференція
Докторська школа імені родини Юхименків