Всеукраїнська науково-практична конференція



Сторінка58/60
Дата конвертації11.05.2018
Розмір3.74 Mb.
1   ...   52   53   54   55   56   57   58   59   60

САВЧУК Т.О., МОЛОСТОВ Д.С.


ВНТУ (Україна)

ПІДХІД ДО ОБРОБКИ ВХІДНИХ ЗАЯВОК CALL-ЦЕНТРОМ



В роботі було проаналізовано існуючі алгоритми кластеризації, що використовуються при обробці вхідних заявок. Знайдено недоліки, які усунені за допомогою розробленого модифікованого алгоритму.
Call-mining - це сфера застосування Data Mining, в якій виконується обробка вхідних заявок клієнтів, яким надаються різні види послуг. При розв’язанні задач call-mining, постає завдання у розподілі вхідних заявок на відповідні групи. Для цього доцільно використовувати алгоритми кластеризації, оскільки вони мають можливість створювати нові групи вхідних заявок та зручні у застосуванні.

Проаналізувавши існуючі методи, за допомогою яких розв’язують задачі call-mining, були визначені такі недоліки:

1. В процесі роботи алгоритмів не враховуються попередні зміни заявок.

2. Алгоритми працюють лише з заданими вхідними заявками, без можливості обробити заявку, яка надійшла пізніше.

Для розв’язання задачі call-mining було розроблено модифікований алгоритм, який базується на алгоритмі кластеризації k-means, особливостями якого є таке:

1. Проводиться аналіз заданих вхідних заявок, що необхідно обробити за заданими ознаками.

2. Виконується перевірка на те, чи була використана поточна заявка раніше та пошук еквівалентної заявки.

3. Отримані заявки аналізуються з урахуванням попереднього використання.

4. Виконується перевірка на надходження нових вхідних заявок.

5. Робота алгоритму закінчується коли вхідні заявки перестали надходити.

Cхема означеного алгоритму представлена на рис.1:

безымянный

Рис.1. Cхема модифікованого алгоритму обробки вхідних заявок call-центром, що базується на алгоритмі кластеризації k-means


Розроблений алгоритм дозволяє проводити аналіз даних, що надходять у call-центр, швидше, що підвищує якість та ефективність при розв’язанні задачі call-mining.
ПЕРЕЛІК ЛІТЕРАТУРИ

1. Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Классификация и снижение размерности. — М.: Финансы и статистика, 1989. — 607 с.

2. Мандель И. Д. Кластерный анализ. — М.: Финансы и статистика, 1988. — 176 с.

3. Дж. Вэн Райзина. Классификация и кластер. — М.: Мир, 1980. 390 с


УДК 004.89

САВЧУК Т.О., САКАЛЮК А.В.


ВІННИЦЬКИЙ НАЦОНАЛЬНИЙ ТЕХНІЧНИЙ УНІВЕРСИТЕТ (УКРАЇНА)

ПЕРЕТВОРЕННЯ МАТРИЦІ «КОРИСТУВАЧ-ОБ'ЄКТ» ПРИ КОЛАБОРАТИВНІЙ

ФІЛЬТРАЦІЇ



В доповіді розглянуто основні проблеми, які виникають при розробці рекомендаційних систем на основі колаборативної фільтрації та запропоновано підходи до їх вирішення, а саме використання сингулярного розкладу вхідної матриці “Користувач-Об'єкт” для пониження її розмірності.
ВСТУП

Швидке зростання кількості інформації в сучасному Інтернеті підштовхує до появи нових засобів управління поданням інформації, її пошуку і систематизації. Застосування класичних засобів пошуку та взаємодії з інформацією вже не задовольняє зростаючих вимог її користувачів як по зручності, так і по достовірності.

Для вирішення проблеми зазвичай використовується метод фільтрації контенту на основі аналізу його вмісту. Але метод має недоліки [1]:


  1. Об'єкти повинні бути у формі доступній для машинної обробки.

  2. Технології з фільтрування контенту не мають вбудованого методу для генерації випадково зроблених виявлень.

Колаборативна фільтрація дозволяє встановити паритет між обізнаністю користувача і виробника про якість товару, блокуючи тенденцію погіршення відбору, яка розвивається в умовах інформаційної асиметрії.

Аналіз різних відомих засобів колаборативної фільтрації, дає підстави стверджувати про актуальність задачі розробки інформаційної системи з наступними вимогами [2]:



  • масштабованість;

  • розширюваність (можливість введення додаткових факторів з метою підвищення якості аналізу);

  • універсальність (здатність системи видавати точні рекомендації не залежно від типу об’єктів, що оцінюються).

ЗМЕНШЕННЯ РОЗМІРНОСТІ МАТРИЦІ «КОРИСТУВАЧ-ОБ’ЄКТ»

Основним недоліком алгоритмів колаборативної фільтрації є необхідність виконання великої кількості операцій для обчислення ступеня схожості товарів або транзакцій і для усереднення оцінок товарів при прогнозуванні невідомого рейтингу. Для зменшення трудомісткості операцій усереднення використаємо не усереднення даних про всі транзакції і не про всі товари, а лише про K найбільш схожих. Загальною тенденцією є збільшення точності при початковому збільшенні числа K, а потім, після досягнення максимуму, точність стабілізується або плавно погіршується. Тоді розгляд тільки K найближчих транзакцій або товарів замість усіх наявних в розпорядженні не тільки прискорює процес обчислення невідомого рейтингу, а й збільшує точність прогнозу [3].

Для зменшення складності обчислення ступеня схожості векторів товарів або транзакцій використовується підхід зменшення розмірності матриці транзакцій-товарів, заснований на розкладанні цієї матриці по сингулярним значенням. Розкладання по сингулярним значенням (Singular Value Decomposition, SVD) є подання матриці з рангом

у вигляді

,

де матриці і складаються з ортонормальних стовпців [3], які є власними векторами при ненульових власних значеннях матриць AAt і AtA відповідно, а

– діагональна матриця з додатними діагональними елементами , відсортованими в порядку спадання.

Діагональні елементи матриці S є власні значення, відповідні ненульовим власним векторам AAt і AtA (стовпцям U і V). Стовпці матриці U є, таким чином, ортонормальним базисом простору стовпців матриці A, а стовпці матриці V – ортонормальним базисом простору рядків матриці A. Важливою властивістю SVD-розкладання є той факт, що якщо для d < r перетворити матрицю S в матрицю, що складається тільки з d найбільших діагональних елементів, а також залишити в матриці U та V тільки d перших стовпців, тобто перетворити їх в



і ,

то матриця



буде кращою апроксимацією матриці A серед усіх матриць з рангом d [2].

У разі фільтрації по товарах кожен j-ий стовпчик Yj матриці A, що відповідає рейтингам j-ого товару, апроксимується j-им стовпцем матриці Ad, який являє собою проекцію вектора Yj на простір, утворений d ортонормальними стовпцями матриці Ud , що відповідають j -ому d-вимірному вектору-стовпцю матриці . Таким чином, замість n-вимірного вектора j-ого товару Yj розглядається d-вимірний вектор Cj, що представляє собою вектор коефіцієнтів розкладання проекції Yj по базису Ud. Використовуючи описаний підхід, для визначення ступеня схожості векторів товарів Yu і Yk обчислюється ступінь схожості їх d-вимірних апроксимацій.

На відміну від традиційного підходу обчислення схожості всіх товарів, при запропонованому підході кількість операцій для обчислення ступеня схожості між векторами товарів складає O(d) проти O(n), що значно прискорює обчислення при d <<n.

ВИСНОВКИ

Основними обмеженнями до використання відомих методів колаборативної фільтрації є проблеми масштабованості та розрідженості оцінок, що не дають можливості виконувати вироблення рекомендацій. Дані проблеми можуть бути вирішені за допомогою зменшення розмірності вхідної матриці.

Аналіз результатів проведених досліджень показав, що завдяки зменшенню розмірності вхідної матриці «Користувач-Об’єкт» підвищується швидкодія обробки даних про користувачів та їх вподобання, а також підвищується точність вироблення рекомендацій за рахунок відсіювання неважливої інформації.

Таким чином, колаборативна фільтрація з попереднім зменшенням розмірності вхідних даних забезпечує підвищення якості рекомендацій для користувачів.


ПЕРЕЛІК ЛІТЕРАТУРИ

1. Т.О. Савчук, А.В. Сакалюк. Застосування кластерного аналізу для вдосконалення алгоритму колаборативної фільтрації. // Стаття, Науково-технічний журнал «Вісник Хмельницького національного університету» - м. Хмельницький, 2011.-№1 – С.186-192.

2. Xiaoyuan Su. A Survey of Collaborative Filtering Techniques / Xiaoyuan Su, Taghi, M. Khoshgoftaar. – Hindawi Publishing Corporation USA, 2009. – 215 p. – ISBN:1- 85233-661-7.

3. Ning Ye, Shuo Zhang, Xia Huang, Jian Zhu. Collaborative Filtering Recommendation Algorithm Based on Item Clustering and Global Similarity // Business Intelligence and Financial Engineering (BIFE), 2012 Fifth International Conference, pp. 69-72.


УДК 519.8 + 004.052 + 004.78


Поділіться з Вашими друзьями:
1   ...   52   53   54   55   56   57   58   59   60


База даних захищена авторським правом ©wishenko.org 2017
звернутися до адміністрації

    Головна сторінка