Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій
| dc.contributor.author | Чоловський, Сергій | uk_UA |
| dc.contributor.author | Здирко, Владислав | uk_UA |
| dc.date.accessioned | 2026-02-06T11:05:26Z | |
| dc.date.available | 2026-02-06T11:05:26Z | |
| dc.date.issued | 2025 | |
| dc.description | This work presents a general framework for generating VQA (Visual Question Answering) datasets across arbitrary knowledge domains. Logically complex questions are derived from OWL-ready formatted ontologies, and correct answers are obtained using SPARQL queries. The diversity of generated questions is enhanced through paraphrasing with a large language model. Relevant scenes are generated using Stable Diffusion with CLIP-score–based post-filtering. We believe this hybrid approach enables efficient creation of high-quality, semantically rich datasets. | |
| dc.description.abstract | Одним з напрямків комп’ютерного зору є візуально-лінгвістична обробка зображень, він включає в себе, зокрема, такі задачі як опис(captioning), відповіді на питання за зображенням(далі VQA - visual question answering), та загальне розуміння(visual common sense reasoning). Задача VQA полягає в тому, щоб на основі зображення надати коротку відповідь на розгорнуте питання (в common sense задачах відповідь може бути довільною). | uk_UA |
| dc.identifier.citation | Чоловський С. О. Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій / Чоловський С. О., Здирко В. В. // Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ / [за заг. ред. М. М. Глибовця, Т. В. Панченка та ін. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2025. - С. 80-81. | uk_UA |
| dc.identifier.uri | https://ekmair.ukma.edu.ua/handle/123456789/38281 | |
| dc.language.iso | uk | uk_UA |
| dc.publisher | Національний університет "Києво-Могилянська академія" | uk_UA |
| dc.relation.source | Теоретичні та прикладні аспекти побудови програмних систем : праці 16 Міжнародної науково-практичної конференції, 23-24 листопада 2025 року, Київ | uk_UA |
| dc.status | first published | uk_UA |
| dc.subject | комп’ютерний зір | uk_UA |
| dc.subject | VQA-датасети | uk_UA |
| dc.subject | онтологічні моделі | uk_UA |
| dc.subject | генеративні нейронні мережі | uk_UA |
| dc.subject | матеріали конференції | uk_UA |
| dc.title | Генеративний фреймворк для побудови візуально-текстових датасетів на основі онтологій | uk_UA |
| dc.type | Conference materials | uk_UA |