Всеукраїнська науково-практична конференція



Сторінка31/60
Дата конвертації11.05.2018
Розмір3.74 Mb.
1   ...   27   28   29   30   31   32   33   34   ...   60

ЛЯШКЕВИЧ В.Я., ОЛАР О.Я., ЛЯШКЕВИЧ М.Ю.


ЧЕРНІВЕЦЬКИЙ НАЦІОНАЛЬНИЙ УНІВЕРСИТЕТ ІМЕНІ ЮРІЯ ФЕДЬКОВИЧА (УКРАЇНА)

ВИКОРИСТАННЯ ТЕЗАУРУСА ДЛЯ ВЗАЄМОЗВ’ЯЗКУ ПОНЯТЬ

РІЗНИХ ПРЕДМЕТНИХ ГАЛУЗЕЙ



В роботі досліджено особливості текстологічних методів пошуку інформації, коли ключові слова автора і читача, що є опорними точками змісту документу, можуть описувати терміни (поняття) різних тематичних областей та запропоновано шляхи удосконалення роботи текстологічних методів пошуку інформації.
Коли в людини, в процесі її діяльності виникає інформаційна потреба, вона звертається до літературних джерел, поданих як у друкованому так і в електронному вигляді. На сьогодні, більш доступними є саме електронні джерела інформації. Мережа Інтернет містить як текстове так і мультимедійне представлення інформації, тому, надалі є зміст вести мову про інформаційні ресурси (ІР) [1]. Розглянемо узагальнену схему, за якою потенційний читач (Ч) знайде необхідний йому ІР, поданий автором (А) у вигляді документу.

Автор, володіючи певними знаннями у тематичній області, використовуючи своє мовне середовище, у своєму розумінні подає інформацію у вигляді документу. Далі документ нотується і класифікується інформаційно-пошуковою системою (ІПС) [2]. Читач, у той же час, також володіючи деякою термінологією, використовуючи своє мовне середовище, формує запит для ІПС[3].

В процесі опрацювання запиту ІПС припускаємо, що можуть виникнути різні ситуації. Розглянемо умови, що можуть привести до цих ситуацій. Для представлення результатів розвитку подій при пошуку ІР подано (див. рис. 1):

– автора і читача;

суміжні тематичні області;

– терміни (поняття) А, які визначають зміст ІР;

– ключові слова (мовне середовище), що є опорними точками тексту, за допомогою яких А передає зміст ІР;

– штрих-пунктирною лінією відображено частини тематичних областей, які можна описати ключовими словами;

– запит, сформований на основі мовного середовища та поняття змісту, що бажає відшукати Ч.

Рис. 1. Результати пошуку інформаційного ресурсу


Ситуація 1 (рис. 1, а). Інформаційний ресурс А буде в першій частині переліку посилань. Очевидно, що А і Ч володіють в однаковій мірі термінами та поняттями тематичної області, використовують схоже мовне середовище. В такому випадку ІПС з легкістю ідентифікує шуканий ресурс у відповідь на запит Ч.

Ситуація 2 (рис. 1, б). Інформаційний ресурс А буде у другій частині переліку посилань. Знаходження необхідного ресурсу можна пояснити наступним чином. Розуміння термінів і понять тематичної області А та Ч не співпадає, але співпадає мовне середовище, тобто ключові слова чи словополучення, що описують поняття навколо яких розкривається зміст інформаційного ресурсу.

Ситуація 3 (рис. 1, в). Інформаційний ресурс А не буде в переліку посилань. Можна зауважити, що А і Ч «не порозумілися», маючи на увазі одне і теж. В цьому випадку А і Ч не володіють термінологією один одного, і в той же час використовують різне мовне середовище.

Ситуація 4 (рис. 1, г) – інший варіант розвитку ситуації 3 – інформаційний ресурс А не буде в переліку посилань. Можна припустити, що інформаційний ресурс буде знаходитися в іншій тематичній області. Таку подію можна пояснити тим, що Ч при формуванні запиту використав ключові слова, за допомогою яких можна описати деяку частину тематичної області, яка не містить бажаного інформаційного ресурсу.

Для вирішення ситуацій 2-4, очевидно, необхідно використати знання тематичної області, щоб допомогти Ч відшукати ІР необхідного змісту, тому що Ч не завжди зможе підібрати ключові слова, якими А нотує свій електронний ресурс для ІПС. Всі ці процеси протікають в деякому обмеженні представлення ІР та знаннях Ч, якими він володіє в даній тематичній області шуканого ресурсу.

Значного успіху в цьому напрямку можна досягти використовуючи SemanticWeb та побудову онтології предметної галузі, у нашому випадку тематичної області «Інтелектуальне діагностування комп’ютерних систем» [4].

У [5, 6] проведено дослідження такого рішення й також виявлено деякі обмеження, спосіб усунення якого і є головною задачею нашої роботи. Для цієї задачі у [4] наведено онтологію предметної галузі «Інтелектуальне діагностування комп’ютерних систем», яка містить словники із 7-ми тисяч термінів. Базовим компонентом онтології є таксономія понять, яка передбачає класифікацію понять (термінів) предметної галузі та побудову ієрархічної структури класів на основі експертних представлень, словесних описів та оцінок. Інформацію з даних тематичних областей представимо в таблицях виду "об’єкт - властивість": , , де – множина об'єктів, – множина властивостей цих об'єктів. Результатом побудови таблиці є встановлення бінарних відношень між об’єктами та властивостями. Стовпці таблиці відповідають об’єктам предметної галузі, а рядки відображають множину властивостей цих об’єктів, що і являтиме собою структурою простої ядерної конструкції мови ситуаційного моделювання [7].

Провівши дослідження ІР, що присвячені циклу «Інтелектуальне діагностування комп’ютерних систем» сформовано тезаурус із 18 тисяч ключових слів та словосполучень. Словник тезаурусу використовується для опису термінів (понять) даної предметної галузі, але в той же час його частина понять може являтися описом і інших тематичних областей, які слід дослідити. Над отриманими онтологіями слід сформувати метаонтологію, що встановить відношення між поняттями різних предметних галузей, а також і ключових слів та словосполучень, які формують зміст ІР.


ПЕРЕЛІК ЛІТЕРАТУРИ

1. Представление об информационномресурсе – [Електронный ресурс]. – Режим доступа:http://inf1.info/informationresource.

2. Ляшкевич В.Я., Мірош О.П. Оцінка ефективності роботи методів класифікації текстів // Науково-технічний журнал “Радіоелектронні і комп’ютерні системи”. – Харків: НАУ ім. М.Є. Жуковського “ХАІ”. – 2008. – № 5 (32). – С.9-17.

3. LyashkevychV., Oksana O., Mirosh O. Logic-Textual and Neuronet Approach to Search Information // Proceedins of the 5thIEEE International Workshop on Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications 21-23 September 2009, Rende (Cosenza), Italy. – Pp.539-543.

4. Поморова О. В. Побудова онтології предметної області «інтелектуальне діагностування комп’ютерних систем» на основі аналізу формальних понять / О. В. Поморова, О. Я. Олар // Вісник Хмельницького національного університету. – 2008. – № 6 (123). – С. 98 – 101.

5.PabloCastells, MiriamFernández, DavidVallet.AnAdaptationofthe Vector-Space Modelfor Ontology-Based InformationRetrieval // IEEE TransactionsonKnowledgeandDataEngineering, Feb. 2007. – Vol. 19. – No. 2. – Pp. 261-272.

6. Ляшкевич В.Я., Мельничук С.В., Ратуш Є.В. Застосування семантичних мереж для дослідження шляхів удосконалення текстологічних методів пошуку інформації // Вісник Хмельницького національного університету. – 2008. – № 4. - С.129-132.

7. Найханова Л.В. Технология создания методов автоматического построения онтоологий с применением генетического и автоматного программирования: Монография. – Улан-Удэ: БНЦ СО РАН, 2008. – 244 с.


УДК 004.2


Поділіться з Вашими друзьями:
1   ...   27   28   29   30   31   32   33   34   ...   60


База даних захищена авторським правом ©wishenko.org 2017
звернутися до адміністрації

    Головна сторінка