Please use this identifier to cite or link to this item:
http://elar.khnu.km.ua/jspui/handle/123456789/9159

Можете відсканувати цей QR-код телефоном( програмою "Сканер QR-кодів" ) для збереження.

Title: Інформаційна технологія автоматизованого визначення ключових слів у повідомленнях для соціальних мереж
Other Titles: Information technology for automated determination of keywords in messages for social networks
Authors: Мазурець, О.В.
Скрипник, Т.К.
Житняківський, В.А.
Mazurets, O.
Skrypnyk, T.
Zhytniakivskyi, V.
Keywords: текстові повідомлення;оцінка TFIDF з використанням NLP;ключові слова;text messages;TFIDF estimates using NLP;keywords
Issue Date: 2020
Publisher: Хмельницький національний університет
Citation: Мазурець О.В. Інформаційна технологія автоматизованого визначення ключових слів у повідомленнях для соціальних мереж / О. В. Мазурець, Т. К. Скрипник, В. А. Житняківський // Вісник Хмельницького національного університету. Технічні науки. – 2020. – № 2. – С. 112-116.
Abstract: У статті розглянуто інформаційну технологію автоматизованого визначення ключових слів у текстових повідомленнях для соціальних мереж, яка проводить аналіз текстового повідомлення із використанням методів оцінки TFIDF, дисперсійної оцінки та оцінки TFIDF з використанням NLP. Розроблена інформаційна технологія автоматизованого визначення ключових слів була реалізована в тестовому програмному продукті, який відтворює роботу соціальної мережі. Вхідними даними для системи є текстове повідомлення із цифровим текстом, а вихідними даними є текстове повідомлення з множиною ключових термінів. Під час розробки соціально орієнтованого сервісу для спілкування за інтересами на платформі IOS, відповідно до визначених функцій, виділено наступні групи користувачів: зареєстрований користувач, адміністратор соціальної мережі, незареєстрований користувач. За допомогою розробленого тестового програмного забезпечення були проведені дослідження, що підтвердили можливість ефективно автоматизовано визначення множини ключових слів у текстових повідомленнях з показниками точності для методу оцінки TFIDF – 27,1% та методу дисперсної оцінки – 45,5%, методу оцінки TFIDF з NLP 88,3%. Перевагами розробленої інформаційної технології автоматизованого визначення ключових слів у текстових повідомленнях для соціальних мереж, яка проводить аналіз текстового повідомлення із використанням методів оцінки TFIDF, дисперсійної оцінки та оцінки TFIDF з використанням NLP, є відсутність необхідності використання лексичних баз даних корпусів слів, суттєве прискорення швидкодії, можливість використання для текстів на різних мовах, можливість використання для текстів з кількома мовами. Дана інформаційна технологія може бути ефективно використана для аналізу текстових повідомлень із невідомими властивостями тематики та мови.
The article discusses automated keyword definition in text messaging for social networks that analyzes text message using the methods of TFIDF estimation, variance estimation, and TFIDF estimation using NLP. The developed automated keyword definition information technology was implemented in the test software. The input data of the system is a text message with digital text, and the output data is a text message with a set of key terms. In developing a socially-oriented interest-based communication service on the iOS platform, according to the defined functions, the following groups of users are identified: registered user, social network administrator, unregistered user. A registered user works with the system via the IOS Mobile App - this group includes users who are logged in and have access to photo and video messaging, location sharing, search for other users, viewing other users' news feeds, commenting on news from others users, create their own news feed, view their own news feed, and track other users' news. The social network administrator works with the system through a browser interface on an arbitrary platform - this group includes users whose function is to backup the database, view the news feed of any user, edit all spreadsheets, exchange messages, lock the user and password reset. The unregistered user only has the option to register. With the help of the developed test software, studies were carried out, which confirmed the possibility of effectively automated determination of a set of keywords in text messages with accuracy indicators for the TFIDF estimation method – 27,1% and the dispersive estimation method – 45,5%, the TFIDF estimation method with NLP 88,3%. Advantages of the developed information technology of automated definition of keywords in text messages for social networks, which conducts the analysis of text message using the methods: TFIDF estimation, variance estimation and TFIDF estimation using NLP, there is no need to use lexical databases of corpora of words, significant acceleration possibility to use for texts in different languages, possibility to use for texts with several languages. This information technology can be effectively used to analyze text messages with unknown subject and language properties.
URI: http://elar.khnu.km.ua/jspui/handle/123456789/9159
UDC: 004.91
metadata.dc.type: Стаття
Appears in Collections:Вісник ХНУ. Технічні науки - 2020 рік

Files in This Item:
File Description SizeFormat 
МАЗУРЕЦЬ.pdf2,78 MBAdobe PDFThumbnail
View/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.