Углубленный анализ данных - Data Mining. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Углубленный анализ данных - Data Mining.

 

Лекция 1

Создание первых ЭВМ. Поколения ЭВМ

Над созданием первой ЭВМ трудились ученые и инженеры передовых стран в сороковых годах прошлого столетия. Формально первой ЭВМ считается созданная в 1945 -1946 годах электронная вычислительная машина ЭВМ – ENIAC, создание связывают с фигурой Джона фон Неймана. К Особенностью архитектуры фон Неймана стали отделение процессорной части от накопителя данных и принципиально одинаковый подход к хранению программ и данных. Такая архитектура с однородным хранением называется Принстонской, в отличие от   Гарвардской архитектуре, в которой используется раздельное используется хранение команд и данных. Следует отметить основные особенности первых ЭВМ (включая машину фон-Неймана)

Использование двоичной системы счисления в вычислительных машинах. Преимущество перед десятичной системой счисления заключается в том, что устройства можно делать достаточно простыми, арифметические и логические операции в двоичной системе счисления также выполняются достаточно просто.

Программное управление ЭВМ. Работа ЭВМ контролируется программой, состоящей из набора команд. Команды выполняются последовательно друг за другом. Созданием машины с хранимой в памяти программой было положено начало тому, что мы сегодня называем программированием.

Память компьютера используется не только для хранения данных, но и программ. При этом и команды программы и данные кодируются в двоичной системе счисления, т.е. их способ записи одинаков. Поэтому в определенных ситуациях над командами можно выполнять те же действия, что и над данными.

Ячейки памяти ЭВМ имеют адреса, которые последовательно пронумерованы. В любой момент можно обратиться к любой ячейке памяти по ее адресу. Этот принцип открыл возможность использовать переменные в программировании.

Возможность условного перехода в процессе выполнения программы. Не смотря на то, что команды выполняются последовательно, в программах можно реализовать возможность перехода к любому участку кода.

Поколения ЭВМ

Принято выделять 5 поколений ЭВМ, первые 4 поколения четко связаны с элементной базой. Чтобы в дальнейшем не повторятся, сразу отметим, что переход к каждому следующему поколению сопровождается кардинальным улучшением всех характеристик – рост производительности и объема памяти, повышение надежности, снижение размеров и потребляемой мощности.

1 поколение - элементная база – вакуумные лампы, начинается от середины 40 -х годов до середины 50-х годов

2 поколение – элементная база – транзисторы, – с 50-х годов до начала 60-х годов.

3 поколение – элементная база – интегральные схемы – начало 60-х до 70-х годов

4 поколение – элементная база – большие интегральные схемы БИС и микропроцессоры – начало 70-х - начало 80-х годов

Что касается 5 поколения – с начала 80-х годов по настоящее время, то здесь четкой привязки к элементной базе, при этом говорят об основных трендах, свойственных этому направлению. Различные исследователи выделяют разные тренды и тенденции. Характерные тренды и тенденции мы будем выделять в процессе обучения при рассмотрении конкретных. решений в области современных ЭВМ - так будет наглядней и понятней.

Здесь целесообразно привести новейшие IT технологии в которых ключевое место занимает ЭВМ.

Хранилище данных

Хранилище данных Datawarehouse DW является дальнейшим развитием направления «Базы данных». Является основой во многих современных систем обработки информации.

Существует ряд принципов хранения информации в DW:

Проблемно-предметная ориентация, интегрированность. Некорректируемость, зависимость от времени - данные привязаны к некоторому промежутку или моменту времени.

На базе хранилища данных существуют два направления обработки данных: Оперативный анализ данных OLAP и Углубленный анализ Data  mining.

OLAP -анализ

В основе OLAP – анализа лежит оперативная обработка данных, представленных в виде многомерного куба. Проводя сечение по разным плоскостям, можно проводить быстрый анализ ситуации и готовить отчеты (имеется соответствующий компьютерный инструментарий).

Назначение Data Mining – путем интеллектуального анализа раскрыть скрытые закономерности в данных , полезные для практики.

Математический аппарат основан на применении деревьев решений, искусственных нейронных сетей, нечёткой логики и др. Подчеркнем, что информация, найденная в процессе применения методов Data Mining, должна быть нетривиальной и ранее неизвестной, например, средний расход на стройке таковым не является таковыми.

Одно из важнейших условий успешного использования data mining состоит в наглядном представлении результатов вычислений (визуализация), что позволяет использовать data mining людьми, не имеющими специальной математической подготовки.

Развитием Data Mining является технология Большие данные Big Data.



Поделиться:


Последнее изменение этой страницы: 2024-07-06; просмотров: 38; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.217.21 (0.006 с.)