Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Временная шкала (timeline). Показывает значения из набора данных на горизонтальной оси, которая соответствует времени. Отрезки между значениями могут быть любой величины



Диаграмма Гантта (Gantt diagram) - показывает последовательность, длительность, а также время начала и окончания этапов и конкретных задач, необходимых для выполнения проекта. Отображается в виде «водопада» из одного или нескольких каскадов — соединенных стрелками блоков, выстроенных по диагонали сверху вниз, слева направо (т.е. «лестницей»). Причем длина блока зависит от необходимого для выполнения времени.

8. Диаграммы связей - достаточно обширный класс паттернов, который используется для визуализации данных, имеющих много переменных. Показывают связи внутри набора данных — как правило, достаточно большого.

Круговая диаграмма связей - показывает связи внутри набора данных в виде кольца, на котором расставлены значения. Значения связаны дугами или линиями, находящимися во внутренней области круга. При большом количестве значений они могут заполнять пространство внутри кольца, хотя это менее наглядно. Связи также могут иметь направление. Например, являются ли взаимными друзьями участники группы в социальной сети.

Линейная диаграмма связей - показывает связи внутри набора данных в виде линии, на которой расставлены значения. Значения связаны дугами, находящимися сверху и снизу линии. Связи также могут иметь направление. Это альтернативный вариант отрисовки круговой диаграммы связей — смысл и задачи у них одинаковые.

Связи на карте - показывает связи внутри набора данных в виде земного шара или географической карты, на которой расставлены значения. Значения связаны дугами, если изображение трехмерное, или линиями, если карта плоская. Связи также могут иметь направление. Например, маршруты всех находящиеся сейчас в воздухе самолетов.

Дендрограмма - показывает близость значений набора данных по одному из параметров, используя ось Y для расстановки самих значений, а ось X — для величины параметра. Отображается в виде набора соединяющихся друг с другом горизонтальных линий, которые соединяются, если значения совпадают по параметру. Причем чем раньше совпадение значений находится по оси X, тем ближе они друг к другу. Например, сравнение годовой выручки 30 предприятий.

9. Иллюстрации - показывают процесс или явление в неформализованном виде.

Рисунок - показывает ключевые шаги, которые проходит процесс, в виде изображенного на картинке сюжета. По сути является аналогом неформальной блок-схемы. Например, изображение круговорота воды в природе в книге по природоведению.

Комикс - показывает ключевые шаги последовательного процесса или явления в виде набора картинок, каждая из которых показывает один из его этапов в виде небольшого сюжета. Например, три этапа процесса параллельной парковки в инструкции для водителей.


3. Практическое применение методов визуализации при исследовании больших массивов данных.

Проведем анализ данных о продажах с помощью Steam - сервиса цифрового распространения компьютерных игр и программ, принадлежащий компании Valve, полученных с помощью сервиса Steam Spy.
Для достижения наших целей воспользуемся методологией CRISP-DM (CRoss Industry Standard Process for Data Mining).

Рис. 1 Схема методологии CRoss Industry Standard Process for Data Mining

1. Постановка бизнес-задачи.
Определить признаки программных продуктов, позволяющие этим продуктам повысить доход от их реализации путем построения графиков, сравнивающих популярность этих продуктов у пользователей по признакам.

2. Определение признаков.
В сервисе можно выбрать множество признаков, из которых нас интересуют только три из них.
3. Изменение данных.

- Рейтинг программного продукта по мнению покупателей.
- Цена программного продукта.
- Количество покупателей продукта.
4. Моделирование.

Построим графики зависимости признаков с помощью программы STATISTICA (программные продукты жанра Action – 60 продуктов с высшим рейтингом):

Рис. 2 Зависимость признаков на 3D Scatterplot диаграмме (Action)

Исследуя визуально графики мы видим, что количество покупателей программного продукта (ось Owners) четко кластеризуется, за несколькими отклонениями, а вот цена продукта (ось Price) растянута и резко прерывается на отметке около 40$ - можно сделать вывод, что покупатели не готовы платить за программный продукт более 40$, но и низкую цену ставить смысла особого не имеет (не наблюдается линейной зависимости количества приобретателей от цены). Причем чем ниже рейтинг (самый низкий – 96% в данной выборке) – тем четче наблюдаются указанные тенденции.
5. Проверка модели.
Проверим модель на группе программных продуктов другого жанра (жанр Strategy).

Рис. 3 Зависимость признаков на 3D Scatterplot диаграмме (Strategy)

Как мы видим визуально – наша модель зависимости признаков не изменилась.
6. Отчет.
На основе исследования данных продаж программных продуктов в системе Steam, мы можем сделать выводы, что параметр Цена (Price) не кореллирует с другими признаками, такими, как количество покупателей (Owners) и рейтингом (Rating), но ограничена сверху значением в 40$. Следовательно не имеет смысла ставить низкую цену на программный продукт, но так же нет смысла ставить цену выше предела в 40$.

Заключение

Целью данного исследования было донести до аудитории важность визуализации информации и показать на реальных примерах, как она может помогать людям принимать решения и работать с данными.

Примеров, типов и подходов к самой типизации существует гораздо больше, но в данной работе была предпринята попытка показать наиболее часто используемые и востребованные инструменты и их практическое применение.


Список литературы

1. Edward R. Tufte. Visual Explanations: Images and Quantities, Evidence and Narrative Hardcover – 1997





Дата публикования: 2015-07-22; Прочитано: 833 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.016 с)...