Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Методы классификации. Алгоритмы классификации.Содержание книги
Поиск на нашем сайте Системы классификации, построенные с использованием методов обучения, реализуются с помощью различных алгоритмов, в большей или меньшей степени эвристических. Среди множества таких алгоритмов рассмотрим три: алгоритм максимина, алгоритм К-средних, алгоритм ИЗОДАТА. Алгоритм максимина Алгоритм Максимина используют для автоматического нахождения экземпляров классов на базе обучающей выборки объёмом
Рассмотрим словесное описание этого алгоритма. Шаг 1. Задать количество образов в выборке - Шаг 2. Из совокупности образов (обучающей выборки), произвольным образом выбрать один, в качестве экземпляра первого класса. Пусть это будет образ Шаг 3. Вычислить расстояния между экземпляром первого класса
При этом образ Шаг 4. Вычислить величину порогового расстояния, равную половине расстояния между экземплярами классов
Шаг 5. Увеличить число классов на единицу: Шаг 6. Выбрать образ Шаг 7. Вычислить расстояния между экземплярами классов Шаг 8. Найти наименьшие расстояния между образом и экземплярами классов Шаг 9. Если наибольшее из наименьших расстояний Шаг 10. Если Шаг 11. Из массива Задача классификации считается выполненной, если количество экземпляров классов не изменяется, а все образы распределены по классам. Рассмотрим реализацию данного алгоритма на примере. Пусть в обучающей выборке шесть объектов, а количество существенных признаков объектов равно двум. Для удобства описания вычислений, будем использовать четыре таблицы. Первая – это таблица значений существенных признаков объектов
Вторая таблица – таблица пометок объектов. Если объект – это экземпляр класса, то ему присваивают отрицательную пометку (номер экземпляра класса с отрицательным знаком) или положительную пометку равную номеру класса, к которому отнесён данный объект.
Третья таблица – это расстояния в выбранной метрике между экземплярами классов и непомеченными объектами.
Четвертая таблица – это таблица наименьших расстояний между объектом, который нужно классифицировать, и экземплярами классов. Она имеет следующую структуру:
Номер строки таблицы – это порядковый номер экземпляра класса; первый столбец – значение минимального расстояния; второй столбец – порядковый номер непомеченного объекта, который находится на минимальном расстоянии от данного экземпляра класса; третий столбец – номер этого класса. Выберем в качестве экземпляра первого класса первый объект:
Вычислим расстояния
Занесем полученные расстояния в таблицу
Находим наибольшее расстояние между экземпляром класса и непомеченными объектами
запоминаем номер этого объекта Выберем этот объект в качестве экземпляра следующего класса
Вычислим пороговое значение расстояния
Вычислим расстояния между экземпляром нового класса и всеми непомеченными объектами
Для всех объектов находим наименьшие расстояния между непомеченным объектом экземплярами классов:
Занесем эти расстояния, номера соответствующих объектов и классов в таблицу
Упорядочим данные в таблице в порядке убывания расстояний
Сравним
Таблица пометок будет иметь вид
Уточним значение порогового расстояния
Тогда
Вычисляем расстояния от экземпляра класса
Находим наименьшие расстояния между непомеченными объектами и экземплярами классов:
Все значения наименьших расстояний, как это следует из таблицы, меньше порога. Распределим объекты по классам: объект с номером
Поскольку в таблице пометок больше нет непомеченных объектов, то, следовательно, алгоритм закончен. Таблица пометок содержит информацию об экземплярах классов и распределении объектов между этими классами. Алгоритм К-средних Для систем автоматической классификации является характерным то, что предполагается заранее известным либо количество классов, либо объекты – представители классов. Для реализации систем автоматической классификации, при известном или заданном количестве классов, используется алгоритм К-средних. Алгоритм К-средних отличается от алгоритма Максимина, в первую очередь тем, что заранее известно или задано количество классов
здесь Отсюда следует что положение центра
Тогда получим, что
здесь Определив новые положения центров всех классов, повторяют процедуру распределения объектов по классам. Определение новых положений центров классов и распределение объектов по классам с новыми центрами продолжают до тех пор, пока положения центров классов не перестанут изменяться. Рассмотрим словесное описание алгоритма К–средних. Он состоит из следующих шагов. Шаг 1. Задать количество классов Шаг 2. На первой итерации (
Шаг 3. Распределить объекты обучающей выборки по классам. Классы формируют следующим образом. Пусть необходимо установить к какому из классов принадлежит объект
Здесь
запомним соответствующий номер класса - Шаг 4. Положить
то есть для определения новых центров классов необходимо вычислить Шаг 5. На этом шаге используется процедура, которая позволяет установить окончание алгоритма (окончание процесса обучения системы классификации). Для этого необходимо вычислить расстояния в выбранной метрике между центрами одноименных классов на
Если при этом выполняется условие
то есть отклонение новых положений центров классов лежит в пределах заданной точности вычислений, то алгоритм закончен. В противном случае, когда
нужно вернуться к шагу 3. Рассмотрим реализацию этого алгоритма на примере, когда количество объектов равно Для удобства вычислений будем использовать четыре таблицы. Первая – это таблица значений существенных признаков объектов
Вторая таблица – таблица пометок объектов. Если объект – это центр класса, то ему присваивают отрицательную пометку (номер класса с отрицательным знаком) или положительную пометку равную номеру класса, к которому отнесён данный объект.
Третья таблица - это расстояния в выбранной метрике между координатами центров классов и непомеченными объектами.
Четвертая таблица – координаты центров классов.
Зададим желаемое число классов
и присвоим им отрицательные пометки в таблице пометок
Вычислим расстояние между центрами классов и всеми непомеченными объектами (в метрике Манхэттена).
Найдем минимальные расстояния между центрами классов и всеми непомеченными объектами, т.е. минимальные значения в каждом столбце таблицы
Здесь объекту с номером Вычислим новые значения координат центров. С этой целью поставим в соответствие всем объектам каждого класса, включая центры, векторы в пространстве существенных признаков. Например, для первого класса это будут векторы
В координатном представлении:
Поступая аналогичным образом, найдем центры оставшихся классов: Найдем расстояния между новыми и предыдущими центрами одноименных классов:
Найдем наибольшее из них Для второго центра координаты не изменились, поэтому его пометку не изменяем.
Занесем новые координаты центров в соответствующую таблицу.
Обнуляем все положительные пометки. В данном случае таблица пометок примет вид:
Вычисляем расстояния между центрами классов и непомеченными объектами
Находим наименьшие расстояния в столбцах этой таблицы. Классифицируем объекты и заполняем таблицу пометок
Вычисляем новые координаты центров
Заносим координаты новых центров в таблицу, если они изменились
Координаты центров поменялись, выполняем следующую итерацию. Обнуляем все положительные пометки.
Вычисляем расстояния от новых центров классов до всех объектов
Классифицируем объекты:
Вычисляем координаты новых центров и сравниваем их с предыдущими значениями.
Поскольку координаты центров не изменились, то алгоритм закончен. Таблица пометок содержит всю информацию о распределении объектов между классами.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
Последнее изменение этой страницы: 2017-02-10; просмотров: 1002; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.196 (0.008 с.) |