Дарчук, Наталія ПетрівнаНаталія ПетрівнаДарчук2025-08-262025-08-262019Darchuk N. Compiling of the Electronic Dictionary of Models of the Ukrainian Language Multicomponent Complex Sentences. Українське мовознавство. 2019. Вип. 1 (49). С. 117-129.УДК 811.161.2’42:004https://doi.org/10.17721/um/49(2019).117-129https://ir.library.knu.ua/handle/15071834/7271The purpose of this study is to construct an automatic syntactic analysis (ASA) and, as a result, to compile a dictionary of models of multicomponent complex sentences for studying the fectures of the linear structure of Ukrainian text. The process includes two-stages: the first stage is an automatic syntactic analysis of the hierarchical type which results in building of a dependency tree (DT), in the second stage, the sentence structure information is automatically extracted from the obtained graph. ASA is a package of operations performed with a string of morphological information (the result of AMA work) representing the incoming text for determination of syntactic relations between text units. The outgoing text for the ACA is a string of information reduced after the AMA to wordforms. We have studied features of the linear structure of 2000 Ukrainian language sentences in journalistic genre (selection of 52000 words use). Based on the obtained results, we have constructed the real models of the syntactic structure of sentences, in which the relations between simple clauses were presented. All grammatical situations of the linear context were possible manifestations of models in the text. Based on that data, the algorithm for the automatic generation of a complex sentence model was created. These models are linear syntax grammar. All types of syntactic connection between the main and subordinate clauses are recorded algorithmically. Thus, it is possible to build the interpretations of the linear structure of the Ukrainian language sentence almost not using lexical-semantic information. The theoretical value of the paper is in extension of our knowledge about the structure of the syntactic level of the language and the variety of mechanisms functioning at that level. The applied value, is first of all, in creation of the dictionary of compatibility of compound (coordinated) and complex (subordinated) sentences, and in the possibility of constructing requests to the Ukrainian language Corpus in order to mine from the text definite models sentences, creating own dictionaries of authors and styles.Метою дослідження є побудова автоматичного синтаксичного аналізу (АСА) і як наслідок – укладання словника моделей багатокомпонентних складних речень для вивчення властивостей лінійної структури українськомовного тексту. Процес укладання двоетапний: на першому етапі працює автоматичний синтаксичний аналіз ієрархічного типу, який завершується побудовою дерева залежностей (ДЗ), а на другому – з одержаного графа автоматичного здобувається інформація про модель речення. АСА – це сукупність операцій, які виконуються над послідовностями інформації морфологічного характеру (результатом роботи АМА), що представляють вхідний текст, для встановлення синтаксичних зв’язків між текстовими одиницями. Вихідним текстом для АСА є редукована після АМА послідовність інформації до словоформ. Досліджувалися властивості лінійної структури 2000 українськомовних речень публіцистичного стилю (вибірка у 52000 слововживань). На підставі цих результатів будувалися реальні моделі синтаксичної структури речень, у яких відображені відношення між простими реченнями. Усі граматичні ситуації лінійного контексту були можливими маніфестаціями моделей у тексті. На підставі цих даних будувався алгоритм автоматичного творення моделі складного речення. Отримані моделі є граматикою лінійного синтаксису. Усі види синтаксичного зв’язку між головним і підрядними реченнями фіксуються алгоритмічно. Таким чином можна будувати інтерпретації лінійної структури українського речення, майже не використовуючи лексико- семантичну інформацію. Теоретичне значення роботи полягає в поглибленні наших уявлень про будову синтаксичного рівня мови і різноманітності механізмів, які діють на синтаксичному рівні. Прикладне значення вбачаємо у створенні словника сполучуваності складносурядних і складнопідрядних речень, у можливості побудови запитів до Корпусу української мови з метою здобувати з тексту речення певних моделей, створюючи свої власні словники авторів, стилів.enдерево залежностейавтоматичний синтаксичний аналізмодель багатокомпонентного складного реченнясловосполученнячастотний словникdependency treeautomatic syntactic analysismodels of multicomponent complex sentencesphrasefrequency dictionaryCompiling of the Electronic Dictionary of Models of the Ukrainian Language Multicomponent Complex SentencesЩодо укладання електронного словника моделей багатокомпонентних складних речень української мовиСтаття