Обробка природної мови за допомогою великих мовних моделей
Loading...
Date
2024
Authors
Задохін, Дмитро
Глибовець, Микола
Journal Title
Journal ISSN
Volume Title
Publisher
Національний університет "Києво-Могилянська академія"
Abstract
Матеріали доповiді учасника 15 міжнародної науково-практичної конференції "Теоретичні та прикладні аспекти побудови програмних систем", Київ, 23-24 грудня 2024 р.
Description
This report was created to overview the usage of large language models for resolving natural language processing tasks. In the course of this paper, we will review mechanisms which allow models with Transformer architecture to be effective for NLP task. We will highlight how Transformer structure made possible of Large Language Models and look at the examples of such models. At the end of the paper, we will review the structure of opensource model Meta Llama and its usage for text generation with limited computational resources.
Keywords
обробка природньої мови (NLP), штучний інтелект, генерації людської мови, матеріали конференції
Citation
Задохін Д. В. Обробка природної мови за допомогою великих мовних моделей / Задохін Д. В., Глибовець М. М. // Теоретичні та прикладні аспекти побудови програмних систем : працi 15 міжнародної науково-практичної конференції, Київ, 23-24 грудня 2024 р. / [за заг. ред.: М. М. Глибовця, Т. В. Панченка та iн. ; Факультет інформатики Національного університету "Києво-Могилянська академія" та ін.]. - Київ : НаУКМА, 2024. - C. 40-41.