Всеукраїнська науково-практична конференціяСторінка31/60
Дата конвертації11.05.2018
Розмір3.74 Mb.
1   ...   27   28   29   30   31   32   33   34   ...   60

ЛЯШКЕВИЧ В.Я., ОЛАР О.Я., ЛЯШКЕВИЧ М.Ю.


ЧЕРНІВЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ІМЕНІ ЮРІЯ ФЕДЬКОВИЧА (УКРАЇНА)

ВИКОРИСТАННЯ ТЕЗАУРУСА ДЛЯ ВЗАЄМОЗВ’ЯЗКУ ПОНЯТЬ

РІЗНИХ ПРЕДМЕТНИХ ГАЛУЗЕЙВ роботі досліджено особливості текстологічних методів пошуку інформації, коли ключові слова автора і читача, що є опорними точками змісту документу, можуть описувати терміни (поняття) різних тематичних областей та запропоновано шляхи удосконалення роботи текстологічних методів пошуку інформації.
Коли в людини, в процесі її діяльності виникає інформаційна потреба, вона звертається до літературних джерел, поданих як у друкованому так і в електронному вигляді. На сьогодні, більш доступними є саме електронні джерела інформації. Мережа Інтернет містить як текстове так і мультимедійне представлення інформації, тому, надалі є зміст вести мову про інформаційні ресурси (ІР) [1]. Розглянемо узагальнену схему, за якою потенційний читач (Ч) знайде необхідний йому ІР, поданий автором (А) у вигляді документу.

Автор, володіючи певними знаннями у тематичній області, використовуючи своє мовне середовище, у своєму розумінні подає інформацію у вигляді документу. Далі документ нотується і класифікується інформаційно-пошуковою системою (ІПС) [2]. Читач, у той же час, також володіючи деякою термінологією, використовуючи своє мовне середовище, формує запит для ІПС[3].

В процесі опрацювання запиту ІПС припускаємо, що можуть виникнути різні ситуації. Розглянемо умови, що можуть привести до цих ситуацій. Для представлення результатів розвитку подій при пошуку ІР подано (див. рис. 1):

– автора і читача;

суміжні тематичні області;

– терміни (поняття) А, які визначають зміст ІР;

– ключові слова (мовне середовище), що є опорними точками тексту, за допомогою яких А передає зміст ІР;

– штрих-пунктирною лінією відображено частини тематичних областей, які можна описати ключовими словами;

– запит, сформований на основі мовного середовища та поняття змісту, що бажає відшукати Ч.

Рис. 1. Результати пошуку інформаційного ресурсу


Ситуація 1 (рис. 1, а). Інформаційний ресурс А буде в першій частині переліку посилань. Очевидно, що А і Ч володіють в однаковій мірі термінами та поняттями тематичної області, використовують схоже мовне середовище. В такому випадку ІПС з легкістю ідентифікує шуканий ресурс у відповідь на запит Ч.

Ситуація 2 (рис. 1, б). Інформаційний ресурс А буде у другій частині переліку посилань. Знаходження необхідного ресурсу можна пояснити наступним чином. Розуміння термінів і понять тематичної області А та Ч не співпадає, але співпадає мовне середовище, тобто ключові слова чи словополучення, що описують поняття навколо яких розкривається зміст інформаційного ресурсу.

Ситуація 3 (рис. 1, в). Інформаційний ресурс А не буде в переліку посилань. Можна зауважити, що А і Ч «не порозумілися», маючи на увазі одне і теж. В цьому випадку А і Ч не володіють термінологією один одного, і в той же час використовують різне мовне середовище.

Ситуація 4 (рис. 1, г) – інший варіант розвитку ситуації 3 – інформаційний ресурс А не буде в переліку посилань. Можна припустити, що інформаційний ресурс буде знаходитися в іншій тематичній області. Таку подію можна пояснити тим, що Ч при формуванні запиту використав ключові слова, за допомогою яких можна описати деяку частину тематичної області, яка не містить бажаного інформаційного ресурсу.

Для вирішення ситуацій 2-4, очевидно, необхідно використати знання тематичної області, щоб допомогти Ч відшукати ІР необхідного змісту, тому що Ч не завжди зможе підібрати ключові слова, якими А нотує свій електронний ресурс для ІПС. Всі ці процеси протікають в деякому обмеженні представлення ІР та знаннях Ч, якими він володіє в даній тематичній області шуканого ресурсу.

Значного успіху в цьому напрямку можна досягти використовуючи SemanticWeb та побудову онтології предметної галузі, у нашому випадку тематичної області «Інтелектуальне діагностування комп’ютерних систем» [4].

У [5, 6] проведено дослідження такого рішення й також виявлено деякі обмеження, спосіб усунення якого і є головною задачею нашої роботи. Для цієї задачі у [4] наведено онтологію предметної галузі «Інтелектуальне діагностування комп’ютерних систем», яка містить словники із 7-ми тисяч термінів. Базовим компонентом онтології є таксономія понять, яка передбачає класифікацію понять (термінів) предметної галузі та побудову ієрархічної структури класів на основі експертних представлень, словесних описів та оцінок. Інформацію з даних тематичних областей представимо в таблицях виду "об’єкт - властивість": , , де – множина об'єктів, – множина властивостей цих об'єктів. Результатом побудови таблиці є встановлення бінарних відношень між об’єктами та властивостями. Стовпці таблиці відповідають об’єктам предметної галузі, а рядки відображають множину властивостей цих об’єктів, що і являтиме собою структурою простої ядерної конструкції мови ситуаційного моделювання [7].

Провівши дослідження ІР, що присвячені циклу «Інтелектуальне діагностування комп’ютерних систем» сформовано тезаурус із 18 тисяч ключових слів та словосполучень. Словник тезаурусу використовується для опису термінів (понять) даної предметної галузі, але в той же час його частина понять може являтися описом і інших тематичних областей, які слід дослідити. Над отриманими онтологіями слід сформувати метаонтологію, що встановить відношення між поняттями різних предметних галузей, а також і ключових слів та словосполучень, які формують зміст ІР.


ПЕРЕЛІК ЛІТЕРАТУРИ

1. Представление об информационномресурсе – [Електронный ресурс]. – Режим доступа:http://inf1.info/informationresource.

2. Ляшкевич В.Я., Мірош О.П. Оцінка ефективності роботи методів класифікації текстів // Науково-технічний журнал “Радіоелектронні і комп’ютерні системи”. – Харків: НАУ ім. М.Є. Жуковського “ХАІ”. – 2008. – № 5 (32). – С.9-17.

3. LyashkevychV., Oksana O., Mirosh O. Logic-Textual and Neuronet Approach to Search Information // Proceedins of the 5thIEEE International Workshop on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications 21-23 September 2009, Rende (Cosenza), Italy. – Pp.539-543.

4. Поморова О. В. Побудова онтології предметної області «інтелектуальне діагностування комп’ютерних систем» на основі аналізу формальних понять / О. В. Поморова, О. Я. Олар // Вісник Хмельницького національного університету. – 2008. – № 6 (123). – С. 98 – 101.

5.PabloCastells, MiriamFernández, DavidVallet.AnAdaptationofthe Vector-Space Modelfor Ontology-Based InformationRetrieval // IEEE TransactionsonKnowledgeandDataEngineering, Feb. 2007. – Vol. 19. – No. 2. – Pp. 261-272.

6. Ляшкевич В.Я., Мельничук С.В., Ратуш Є.В. Застосування семантичних мереж для дослідження шляхів удосконалення текстологічних методів пошуку інформації // Вісник Хмельницького національного університету. – 2008. – № 4. - С.129-132.

7. Найханова Л.В. Технология создания методов автоматического построения онтоологий с применением генетического и автоматного программирования: Монография. – Улан-Удэ: БНЦ СО РАН, 2008. – 244 с.


УДК 004.2


Поділіться з Вашими друзьями:
1   ...   27   28   29   30   31   32   33   34   ...   60


База даних захищена авторським правом ©wishenko.org 2017
звернутися до адміністрації

    Головна сторінка