Методи автоматизованого семантичного аналізу природномовної інформації
Анотація
У статті розглянуто особливості автоматизованого семантичного аналізу тексту, досліджено проблеми створення автоматизованих лінгвістично-програмних засобів, придатних для застосування в системах екстракції семантики з тексту. Автором систематизовано та здійснено порівняльний аналіз результатів наукових досліджень у галузі розробки моделей і методів семантичного аналізу природномовної інформації. Визначено два основні підходи в напрямку комп’ютерної обробки природномовних текстів: лінгвоаналітичний і статистичний. Автором аргументовано, що найбільш перспективними та ефективними з них є, відповідно, експліцитні методи семантичного аналізу текстової інформації (алгоритми онтологічного семантичного аналізу) та методи латентно-семантичного аналізу. Окреслено можливі шляхи удосконалення існуючих комп’ютерних засобів діагностування релевантності природномовної інформації; обгрунтовано, що найпопулярнішими методами обробки природномовної інформації з метою екстракції та репрезентації семантики мають бути системи, що ґрунтуються на ефективному поєднанні лінгвістичних технологій аналізу (графематичного, морфологічного, синтаксичного, семантичного), зокрема із застосуванням онтологій, та методу латентно-семантичного аналізу. Доведено, що інтеграція технологій експліцитного семантичного аналізу, латентно-семантичного аналізу, методів теорії нечіткої логіки, штучного інтелекту та ін. є перспективним шляхом розв’язання проблеми автоматизованого семантичного аналізу природномовної інформації.
Завантаження
Посилання
Jones K., Bright W. (ed.) Natural language processing: a historical review. International encyclopedia of linguistics. New York: Oxford University Press, 1992. Vol. 3. P. 53–59.
Комарницька О. І. Моделі та методи лінгвістичного аналізу тексту інтелектуальної системи оцінювання знань: дис. … канд. філол. наук: 10.02.21 / Комарницька Оксана Іванівна. Хмельницький, 2015. 209 с.
Марченко О. О. Порівняння методів онтологічного семантичного аналізу та алгоритмів латентного семантичного аналізу. Вісник Київського національного університету імені Тараса Шевченка. Сер. : фізико-математичні науки. Київ, 2012. № 2. С. 169−174.
Леонтьева Н. Н. Автоматическое понимание текста: системы, модели, ресурсы: учеб. пособ. Москва: Академия, 2006. 304 с.
Мельчук И. А. Опыт теории лингвистических моделей «Смысл↔Текст». Москва: Издательство: Школа «Языки русской культуры», 1999. 346 с.
Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособ / Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ и др. Москва: МИЭМ, 2011. 272 с.
Даревич Р. Р. Підвищення ефективності інтелектуального аналізу тексту шляхом зважування понять у моделі онтології. Искусственный интеллект. 2005. № 3. С. 571−577.
Комп’ютерні онтології та їх використання у навчальному процесі. Теорія і практика: [моногр.] / С. О. Довгий, В. Ю. Велічко, Л. С. Глоба та ін. Київ: Інститут обдарованої дитини, 2013. 310 с.
Знання-орієнтований підхід до автоматизації інформаційно-аналітичної діяльності / І. В. Замаруєва, А. О. Рось, О. Ю. Губайдулін та ін. Проблемы программирования. Киев: ИПС НАНУ, 2000. № 1–2. С. 601−614.
Ландэ Д. В. Поиск знаний в Internet. Профессиональная работа. Москва: Издательский дом «Вильямс», 2005. 272 с.
Landauer T., Foltz P., Laham D. An introduction to latent semantic analysis. Discourse Processes. 1998. №25. P. 259–284.
Авторське право (c) 2018 Філологічний дискурс
Ця робота ліцензується відповідно до Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.