Графическое представление статистического распределения. Гистограмма. Виды диаграмм и их особенности Для чего предназначены формы

Графическое представление статистического распределения. Гистограмма.

1. Постановка проблемы . Гистограмма - один из инструментов интерпретации результатов медицинских исследований, контроля состояния здоровья пациентов. Благодаря графическому представлению имеющейся количественной информации, можно увидеть закономерности, трудно различимые в простой таблице с набором цифр, оценить проблемы и найти пути их решения. То есть для осмысления качественных характеристик признаков, процессов, и наглядного представления тенденции изменения наблюдаемых значений применяют графическое изображение статистического материала, т. е. строят гистограмму распределения.

Именно по виду гистограммы, по тому, на какой вид распределения плотности вероятности похожа гистограмма, подбирается теоретический закон распределения.

Наиболее часто встречающиеся виды распределений:

1) нормальное;

2) показательное (экспоненциальное);

3) равномерное;

4) Рэлеевское.

По нормальному закону распределены рост, масса человека, систолическое давления, содержание холестерина в крови пациента и д. р.

По показательному закону распределён интервал между однотипными случайными событиями: вызовами медсестры пациентами, число заказов лекарственных средств аптеками , страховые случаи.

По равномерному закона распределены ошибка округления и фаза случайных колебаний.


Плотность Рэлеевского распределения отлична от нуля только для неотрицательных значений x . Это распределение однопараметрическое: оно зависит от одного параметра σ. По Рэлеевскому закону распределено расстояние от точки попадания в мишень до её центра.

Таким образом, необходимо внимательно посмотреть на построенную гистограмму и выбрать подходящее распределение значений случайной величины.

2. Предыстория и суть метода. Гистогра́мма (от др.-греч. ἱστός - столб + γράμμα - черта, буква, написание) - способ графического представления табличных данных. Следовательно, термин следует интерпретировать, как некую форму записи, состоящую из "столбиков", т. е. продолговатых, вертикально расположенных фигур. Термин "гистограмма" был введен знаменитым статистиком Карлом Пирсоном (Karl Pearson) для обозначения "общей формы графического представления".

Пирсон (Pearson ) Карл (27.3.1857, Лондон,- 27.4.1936, там же), английский математик, биолог, философ-позитивист. Профессор прикладной математики и механики (с 1884), а затем евгеники (с 1911) Лондонского университета.

Гистограмма - один из вариантов столбиковой диаграммы, позволяющий зрительно оценить распределение статистических данных, группированных по частоте попадания в определенный (заранее заданный) интервал. Таким образом, гистограмма представляет собой графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала значений случайной величины.

3. План построения гистограммы:

1) Пусть необходимо изучить распределение признака Х у объектов генеральной совокупности. Для этой цели делают репрезентативную выборку и производят n измерений значений исследуемого признака: x 1 , x 2 , ... ,. xn .

2) Надо найти минимальное значение xmin и максимальное значение xmax измеренного параметра. Полученный диапазон разделить на конечное число интервалов, предварительно определив их число (обычно 5-20 в зависимости от числа показателей) и определить ширину интервала Δ x . Часто разность x max – x min не делится нацело. В таком случае интервал несколько расширяется, как в сторону меньших, так и в сторону больших значений.

3) Все данные распределить по интервалам в порядке возрастания: левая граница первого интервала должна быть меньше наименьшего из имеющихся значений. Данные обработки результатов представить в виде таблицы (таблица1).

5) Вычислить плотность частот mi / Δx попадания данных в каждый из интервалов.

6) Вычислить плотности относительных частот mi / Δx · n.

Интервалы

значений

(хо, x1)

(x1,x2)

(x2,x3)

(x3,x4)

(xk-1,xk)

Частоты

Плотности частот, mi / Δx

Плотности относительных частот,

m i / Δx · n

7) . По полученным данным построить гистограмму - столбчатую диаграмму, высота столбиков которой соответствует частоте или плотности частот, или плотности относительных частот попадания данных в каждый из интервалов, основаниями столбиков служат отрезки оси абсцисс, длины которых равны длинам интервалов. В результате получают ступенчатую фигуру в виде сдвинутых друг к другу прямоугольников, площади которых пропорциональны частотам (или плотностям относительных частот).


Гистограмма частот (нормальное распределение)


Гистограмма плотности относительных частот (нормальное распределение)

8). Проанализировать гистограмму:

a) определить тип распределения данных (нормальное и т. д.);

b) нарисовать линию по верхушкам полосок гистограммы и получить сглаживающую кривую, наилучшим образом представляющую данное статистическое распределение;

c) осуществить анализ нормального распределения с использованием математического аппарата: найти значение генеральной средней, генеральное среднее квадратическое отклонение, выражение для нормального закона. Но не следует делать выводы, основанные на малых выборках. Чем больше объем выборки, тем больше уверенность в том, что три важных параметра гистограммы - ее центр, ширина и форма - представительны для всего исследуемого процесса или группы данных.

d) Ответить на вопрос: "Почему распределение именно такое, и о чем это говорит?"

Примеры анализа гистограмм:

    Симметричная (пример А). Большинство значений находятся по обе стороны от центра распределения (центральной тенденции) с отклонением, сбалансированным по обе стороны от центра. С наклоном (пример Б). Большинство значений находятся слева от центральной тенденции. Такой тип распределения данных может произойти, если есть естественное препятствие в случаях сортировки данных (результаты, которые не соответствуют определенному стандарту, удаляются из набора данных). Асимметричная (пример В). На таком графике имеется длинный "хвост" по одну сторону от центральной тенденции. По одну сторону имеется больше отклонений, чем по другую, указывая на то, что в течение процесса произошел сдвиг некоторых переменных значений. Двухмодальная (пример Г). В двух модальном типе имеется две вершины. Это обычно происходит, когда смешиваются две различные группы данных (категория невысоких людей смешивается с категорией очень высоких людей). В действительности, мы имеем две гистограммы, объединенные вместе.

Достоинства метода:

· Наглядность, простота освоения и применения.

· Анализ на основании фактов, а не мнений.

· Позволяет лучше понять вариабельность, присущую процессу, глубже взглянуть на проблему и облегчить нахождение путей ее решения.

Недостатки метода:

Интерпретация гистограммы, построенная по малым выборкам, не позволяет сделать правильные выводы.

Применение метода гистограмм в информатике:

В последние два десятилетия гистограммы использовались в нескольких областях информатики, и, прежде всего, в областях обработки изображений. Анализ гистограммы яркости стал уже привычным делом во время редактирования фотографий в графическом редакторе. Гистограмма яркости, которую для краткости обычно называют просто "гистограмма", помогает оценить общее качество фотографии на основе математической интерпретации тонального диапазона изображения в виде специальной диаграммы. Гистограмма яркости изображения - это и есть такая столбчатая диаграмма, отображающая количество пикселов изображения (по вертикали), имеющих заданный уровень яркости (по горизонтали). Т. е. гистограмма яркости представляет собой график, который показывает, какие оттенки присутствуют в изображении. Диапазон оттенков изображения представлен в виде последовательности вертикальных линий, расположенных слева направо от самого темного до самого светлого. Высота каждой линии показывает, сколько в изображении пикселов

соответствующего оттенка. Гистограмму можно получить для каждого цветового канала в отдельности. В этом случае она показывает количество пикселов, имеющих определенное значение величины яркости для каждого цвета. Величина яркости изменяется в диапазоне от 0 до 255 с точностью до единицы, что соответствует цветовой глубине в 8 бит на каждый цветовой канал (в двоичном представлении от – черный до - белый). В растровом изображении каждый пиксел содержит информацию о своем цвете. Цвет представляется числами в соответствии с той или иной цветовой моделью, например, RGB (Красный, зелёный, синий –цвета, с помощью сложения которых формируется изображение на экране) и др. Так, в модели RGB каждый пиксел описывается тремя числами, соответствующими яркостям базовых цветовых составляющих, которым в свою очередь, ставится в соответствие номер цвета. Числа, которыми описывается цвет пикселов, еще называют цветовыми каналами.

Как известно, числа можно представлять в различных системах счисления. В обычной практике мы используем десятичную систему, в которой для записи чисел применяются 10 цифр (0, 1, 2, …, 9). В программировании часто используется шестнадцатеричная система счисления, в которой применяются 16 цифр (0, 1, 2,…, 9, A , B , C , D , E , F ). Работа компьютеров основана на двоичной системе с двумя цифрами - 0 и 1. Двоичную цифру называют битом . Бит может принимать только одно из двух возможных значений.

Количество информации, которое используется для кодирования точки изображения (пиксела), называется глубиной цвета (color depth), или битовой глубиной цвета (bit depth).

Цветовая глубина определяет, как много цветов может быть представлено пикселом (какова палитра цветов). Например, если цветовая глубина равна 1 бит, то пиксел может представлять только один из двух возможных цветов, например, белый или черный. Если цветовая глубина равна 8 бит, то количество возможных цветов равно 28 = 256. При глубине цвета 24 бит на кодирование каждого цвета выделяется по 8 бит, а полное количество цветов количество цветов превышает 16 млн. Связь между битовой глубиной цвета и количеством цветов проста:

Количество цветов = 2 битовая глубина цвета

Глубина цвета и количество цветов в палитре

Глубина цвета, I(бит )

Количество цветов в палитре

(число номеров цвета), N

28=256

216=65536

224=

Иногда под цветовой глубиной понимают максимальное количество цветов, которые можно представить. Очевидно: чем больше цветовая глубина, тем больше объем файла, содержащего описание всего изображения.

Изображения в системах RGB и оттенках серого (gray scale ) обычно содержат 8 бит на один цветовой канал. Поскольку в RGB три цветовых канала, глубина цвета в этих режимах равна 8 3 = 24 бит.

Гистограмма является вспомогательной функцией для оценки качества фотографии, поэтому получаемую с ее помощью информацию нужно соотносить с изображением на дисплее цифровой камеры. Фотограф должен понимать, какие участки изображения вызывают возникновение полос на гистограмме. Слева на графике отображаются темные участки снимка, то есть тени. Справа - светлые участки. Если подъемы расположены примерно симметрично, ближе к центру гистограммы, то изображение хорошо сбалансировано. Если подъемы смещены влево или вправо относительно центра , то это является показателем того, что изображение, соответственно, слишком темное или светлое. В таком случае нужно в меню Levels редактора Photoshop переустановить конечную точку для черного или белого цвета (фото 1 и 2).

Фото 1. Подъем на гистограмме смещен влево, то есть фотография затемнена. Возможно, это связано с недодержкой при съемке.

Фото 2.

После смещения конечной точки гистограмма "отцентрировалась", и изображение стало реалистичнее.

Конечно, "слишком темное" или "слишком светлое" изображение не обязательно является свидетельством брака, а может быть вызвано объективными условиями композиции, объектом съемки. Например, гистограмма зимнего пейзажа объективно не может иметь подъемы, сгруппированные в центральной части (фото 3).

Фото 3.

Гистограмма зимнего пейзажа по понятным причинам смещена вправо.

В некоторых случаях гистограмма может иметь всплески как в правой, так и в левой своей части, что говорит о наличии в кадре максимально темных и максимально светлых областей. Это бывает, когда фотография очень контрастна или имеет ярко выраженную игру света и тени, как видно из примера на фото 4, и ничего плохого тут, естественно, нет.

Фото 4.

Фотография имеет ярко выраженную игру света и тени, что отражается в виде двух пиков на гистограмме.

Так как для возможности сравнения различных гистограмм необходимо исключить зависимость от объёма выборки и ширины интервала Δx .

Пи́ксел (англ. pixel , сокр. от англ. PICture " S ELement , элемент изображения), пи́ксель - минимальный участок изображения, для которого независимым способом можно задать цвет. Он представляет собой неделимый объект прямоугольной (обычно квадратной) формы, обладающий определенным цветом. Любое растровое компьютерное изображение состоит из пикселов, расположенных по строкам и столбцам. Если изображение увеличить, вы увидите ряды пикселов.

Линейчатая диаграмма - это:

а) диаграмма, в которой отдельные значения представлены полосами различной длины, расположенными горизонтально вдоль оси Х;

б) диаграмма, отдельные значения которой представлены точками в декартовой системе координат;

в) диаграмма, в которой отдельные значения представлены вертикальными столбиками различной высоты;

г) диаграмма, представленная в виде круга разбитого на секторы, и в которой допускается только один ряд данных.

    Гистограмма - это:

а) диаграмма, в которой отдельные значения представлены вертикальными столбцами различной высоты;

б) диаграмма, для представления отдельных значений которой используются параллелепипеды, размещенные вдоль оси Х;

в) диаграмма, в которой используется система координат с тремя координатными осями, что позволяет получить эффект пространственного представления рядов данных.;

г) диаграмма, в которой отдельные значения представлены полосами различной длины, расположенными горизонтально вдоль оси Х.

    Круговая диаграмма - это:

а) диаграмма, представленная в виде круга разбитого на секторы, и в которой допускается только один ряд данных;

б) диаграмма, отдельные значения которой представлены точками в декартовой системе координат;

в) диаграмма, в которой отдельные ряды данных представлены в виде закрашенных разными цветами областей;

г) диаграмма, в которой используется система координат с тремя координатными осями, что позволяет получить эффект пространственного представления рядов данных.

    Диаграмма, отдельные значения которой представлены точками в декартовой системе координат, называется:

а) линейчатой;

б) точечной;

в) круговой;

г) гистограммой.

    Гистограмма наиболее пригодна для:

а) для отображения распределений;

б) сравнения различных членов группы;

в) для отображения динамики изменения данных;

г) для отображения удельных соотношений различных признаков.

    Освоение системы управления базами данных Access

Тест по теме «Базы данных»

1. База данных - это:

    совокупность данных, организованных по определенным правилам;

    совокупность программ для хранения и обработки больших массивов информации;

    интерфейс, поддерживающий наполнение и манипулирование данными;

    определенная совокупность информации.

2. Наиболее распространенными в практике являются:

    распределенные базы данных;

    иерархические базы данных;

    сетевые базы данных;

    реляционные базы данных.

3. Наиболее точным аналогом реляционной базы данных может служить:

    неупорядоченное множество данных;

  1. генеалогическое дерево;

    двумерная таблица.

4. Таблицы в базах данных предназначены:

    для хранения данных базы;

    для выполнения сложных программных действий.

5. Что из перечисленного не является объектом Access:

  1. ключи;

6. Для чего предназначены запросы:

    для хранения данных базы;

    для отбора и обработки данных базы;

    для ввода данных базы и их просмотра;

    для автоматического выполнения группы команд;

    для выполнения сложных программных действий;

    для вывода обработанных данных базы на принтер?

7. Для чего предназначены формы:

    для хранения данных базы;

    для отбора и обработки данных базы;

    для ввода данных базы и их просмотра;

    для автоматического выполнения группы команд;

8. Для чего предназначены модули:

    для хранения данных базы;

    для отбора и обработки данных базы;

    для ввода данных базы и их просмотра;

    для автоматического выполнения группы команд;

    для выполнения сложных программных действий?

9. Для чего предназначены макросы:

    для хранения данных базы;

    для отбора и обработки данных базы;

    для ввода данных базы и их просмотра;

    для автоматического выполнения группы команд;

    для выполнения сложных программных действий?

10. В каком режиме работает с базой данных пользователь:

    в проектировочном;

    в любительском;

    в заданном;

    в эксплутационном?

11. В каком диалоговом окне создают связи между полями таблиц базы данных:

    таблица связей;

    схема связей;

    схема данных;

    таблица данных?

12. Почему при закрытии таблицы программа Access не предлагает выполнить сохранение внесенных данных:

    недоработка программы;

    потому что данные сохраняются сразу после ввода в таблицу;

    потому что данные сохраняются только после закрытия всей базы данных?

13. Без каких объектов не может существовать база данных:

    без модулей;

    без отчетов;

    без таблиц;

    без форм;

    без макросов;

    без запросов?

14. В каких элементах таблицы хранятся данные базы:

    в строках;

    в столбцах;

    в записях;

    в ячейках?

15. Содержит ли какую-либо информацию таблица, в которой нет ни одной записи?

    пустая таблица не содержит ни какой информации;

    пустая таблица содержит информацию о структуре базы данных;

    пустая таблица содержит информацию о будущих записях;

    таблица без записей существовать не может.

16. Содержит ли какую-либо информацию таблица, в которой нет полей?

    содержит информацию о структуре базы данных;

    не содержит ни какой информации;

    таблица без полей существовать не может;

    содержит информацию о будущих записях.

17. В чем состоит особенность поля «счетчик»?

    данные хранятся не в поле, а в другом месте, а в поле хранится только указатель на то, где расположен текст;

    имеет ограниченный размер;

    имеет свойство автоматического наращивания.

18. В чем состоит особенность поля МЕМО?

    служит для ввода числовых данных;

    служит для ввода действительных чисел;

    данные хранятся не в поле, а в другом месте, а в поле хранится только указатель на то, где расположен текст;

    имеет ограниченный размер;

    имеет свойство автоматического наращивания.

    поле, значения в котором не могут повторятся;

    поле, которое носит уникальное имя;

    поле, значение которого имеют свойство наращивания.

20. Ключами поиска в системах управления базами данных (СУБД) называются:

    диапазон записей файла БД, в котором осуществляется поиск;

    логические выражения, определяющие условия поиска;

    поля, по значению которых осуществляется поиск;

    номера записей, удовлетворяющих условиям поиска;

    номер первой по порядку записи, удовлетворяющей условиям поиска?

Тест по теме СУБД

1. Из приведенных определений выберите определение:

1. Что такое база данных?

2. Что такое СУБД?

1. Программа, с помощью которой вводятся данные и производятся какие-либо действия над этими данными: просмотр, сортировка, поиск и т.д.

2. Файл, в котором хранятся в специальном формате данные.

2. Из предложенных определений моделей данных СУБД выберите определения, соответствующие:

1. Иерархической.

2. Сетевой.

3. Реляционной.

1. Модель данных строится по принципу взаимосвязанных таблиц.

2. Один тип объекта является главным, все нижележащие – подчиненными.

3. Любой тип данных одновременно может быть главным и подчиненным.

3. Какая из перечисленных СУБД входит в состав популярного пакета Microsoft Office ?

1. Lotus Approach.

2. Microsoft Access.

3. Visual FoxPro.

4. Borland Paradox.

5. Borland dBase.

4. БД содержит информацию об учениках школы: фамилия, класс, балл за тест, балл за практическое задание, общее количество баллов. Какого типа должно быть поле ОБЩЕЕ КОЛИЧЕСТВО БАЛЛОВ?

1. текстовое 2. логическое 3. числовое 4. любого типа 5. дата

5 6 Реляционная БД задана таблицей:

Ф.И.О.

возраст

клуб

спорт

Панько Л.П.

Арбузов А.А.

Жиганова П.Н.

Иванов О.Г.

Седова О.Л.

Багаева С.И.

5. Какие записи будут выбраны по условию:

(клуб = «Спарта» ИЛИ клуб = «Ротор») и НЕ (пол = «жен»)?

1. 3,5 2. 1,3,5 3. 2,3,4,5 4. 2,4 5. таких записей нет

6. Какие записи будут выбраны по условию:

спорт = «лыжи» ИЛИ пол = «жен» И возраст

1. 2,3,4,5,6 2. 3,5,6 3. 1,3,5,6

4. таких записей нет 5. 2,3,5,6

7. БД содержит информацию о собаках из клуба собаководства: кличка, порода, дата рождения, пол, количество медалей. какого типа должны быть поля?

1. текстовое, текстовое, числовое, текстовое, числовое

2. текстовое, текстовое, дата, текстовое, числовое

3. текстовое, текстовое, дата, логическое, числовое

4. текстовое, текстовое, числовое, логическое, числовое

5. текстовое, текстовое, дата, логическое, текстовое

  1. по информатике ... крупные содержательные линии : Основы информатики ... тесты ); исполнителей алгоритмов, модели, тренажеры и пр. СОДЕРЖАНИЕ ТЕМ УЧЕБНОГО КУРСА ...
  2. Программа курса «Русский язык»

    Программа курса

    ... школьного курса . Поэтому определённое место в курсе ... содержательные линии . В курсе иностранного языка можно выделить следующие содержательные линии ... рисуночных тестов . Так... Информатика ИНФОРМАТИКА Пояснительная записка Программа по информатике разработана...

  3. Методические рекомендации по организации внеурочной деятельности в образовательных учреждениях Томской области Дозморова Е. В., к п. н., проректор по нр тоипкро

    Методические рекомендации

    За погодой», тест -система «Нитрат-тест », теллурий, ... лабораторных экспериментов по стандартным разделам школьного курса физики – ... информатика . Поэтому авторский курс информатики основного общего образования включает в себя следующие содержательные линии ...

Директор по визуальным концепциям компании McKinsey Джин Желязны знает о своей работе все. Это неудивительно: за 55 лет жизни, которые он посвятил изучению диаграмм и других способов визуализации, он накопил достаточный опыт, которым поделился в книге «Говори на языке диаграмм».

Нашим читателям - месяц на Bookmate бесплатно: введите промокод RUSBASE по ссылке http://bookmate.com/code .


Шаг 3. От сравнения к диаграмме – выберете тип диаграммы

Каждому типу сравнения соответствует определенный вид диаграмм. Подбирайте тип визуализации, исходя из типа сравнения.

Формулируем идею

Построение диаграмм начинается с формулирования основной мысли, которую вы хотите донести до аудитории с ее помощью. Основная идея - ответ на вопрос, что именно показывают нам данные и как они связаны между собой.

Самый простой способ сформулировать главную мысль - вынести ее в заголовок диаграммы.

Заголовок должен быть конкретным и нести в себе ответ на вопрос, который вы ставите перед аудиторией. При подборе слов используйте количественные и качественные характеристики и старайтесь избегать общих фраз и выражений.

Примеры конкретных и общих заголовков

Не забывайте главное правило: одна диаграмма - одна идея. Не старайтесь на одном графике показать все найденные вами связи и мысли. Такие диаграммы будут перегруженными и сложными для восприятия.

Определяем тип сравнения

Любую мысль и идею можно выразить при помощи одного из пяти типов сравнения. Ваша задача - правильно выбрать тип сравнения и подобрать к нему соответствующую диаграмму.

Небольшая подсказка:

  1. Покомпонентное сравнение – ваши данные показывают определенную долю по отношению к целому.
  2. Позиционное сравнение – вы хотите показать, как данные соотносятся друг с другом.
  3. Временное сравнение – вы показываете, как данные изменяются во времени.
  4. Частотное сравнение – вы хотите показать, какое количество объектов попадает в определенные диапазон.
  5. Корреляционное сравнение – вы показываете, как данные зависят друг от друга.

Выбираем идеальную диаграмму

Каждому из типов сравнения соответствует свой вид диаграмм. Именно от его правильного выбора зависит понятность восприятия визуализированных данных.

Всего существует пять типов диаграмм и некоторые их вариации и комбинации:

1. Круговая диаграмма

Знакомый всем «пирог» – самый используемый тип диаграмм. По мнению Джина, это неоправданно, поскольку этот тип наименее практичен и должен составлять немногим более 5% всех диаграмм в презентациях.

2. Линейчатая диаграмма

Отдельные значения в этой диаграмме представлены полосами различной длины, расположенными горизонтально вдоль оси Х. По мнению автора, это самая недооцененная диаграмма, наиболее гибкий и универсальный тип, который должен был бы составлять 25% всех используемых диаграмм.

3. Гистограмма

Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра.

4. График

Знакомые всем со школы линейные графики состоят из точек на координатной сетке, соединенных линиями. Используются для характеристики вариации, динамики и взаимосвязи. Вместе с гистограммой должны составлять половину используемых диаграмм.

5. Точечная диаграмма

Она же диаграмма рассеивания, служит для размещения точек данных на горизонтальной и вертикальной оси с целью показать степень влияния одной переменной на другую. По мнению Желязны, ее должны использоваться в 10% случаев.

Не забывайте! Главная цель любой диаграммы - четко показать связи или зависимости между данными. Если иллюстрация не способна отразить взаимосвязи, лучше использовать таблицы.

Двойное сравнение

В некоторых случаях возникает необходимость показать на одном графике несколько типов сравниваемых данных и зависимость между ними.

В таких случаях необходимо определить основной тип сравнения и подбирать диаграмму на основании него. Например, если вы хотите показать вклад отдельных подразделений в общий доход компании в зависимости от месяцев, лучше использовать типы диаграмм для временного сравнения: график или гистограмму. А если вас больше интересует не изменение во времени, а конкретные достижения, используйте линейчатые диаграммы.

Помните: если на одной диаграмме не получается просто и понятно донести основную мысль, комбинируя данные, лучше использовать два отдельных виджета.

Шкалы, легенды и другие надписи


Идеальная диаграмма понятна для восприятия без дополнительной информации на ней. Однако это не означает, что вы не можете использовать шкалу или легенду, чтобы лучше донести основную мысль.

Главные правила при добавлении дополнительной информации:

  1. Они не перегружают диаграмму.
  2. Они не отвлекают от основной картинки.
  3. Они дополняют диаграмму.

Конкретные примеры для каждого из типов сравнения и диаграмм вы можете найти в книге или использовать их электронную версию на сайте издательства.

В предыдущей статье мы рассмотрели общие положения, а также обратили внимание на некоторые особенности построения гистограмм, определяющие корректность представляемой информации. В этой – рассмотрим какую информацию можно "прочесть” с гистограмм и как это сделать.

Представление данных в виде диаграмм и графиков преследует цель подать информацию в наглядном и понятном виде. Таким образом, важнейшими характеристиками любых диаграмм являются информативность и доступность тех данных, которые представлены с их помощью.

Несмотря на то, что гистограмма является достаточно простым и легким для восприятия графиком, представление данных с ее помощью требуют от исследователя определенного опыта, а от постороннего человека – понимания принципов построения и анализа гистограмм. Само собой разумеется, что гистограмма, построенная "своими руками”, будет понятна Вам, но для человека, не знакомого с результатами наблюдений (или процессом, который описывают результаты наблюдений), Ваш график может показаться не столь очевидным. Насколько построенная Вами гистограмма буде информативна и понятна стороннему наблюдателю, определяет в конечном итоге то, как будет воспринята информация, которую Вы показываете с ее помощью.

На что же следует обратить внимание, рассматривая прямоугольники, составляющие гистограмму? И как построить гистограмму, чтобы информация, преподносимая с ее помощью, была понятна всем?

Во-первых, не следует пренебрегать атрибутами стандартного графика: название гистограммы, величины и размерности осей X и Y – это первое, на что обращает внимание опытный исследователь. Во-вторых, представляя данные в виде гистограммы, Вы должны быть уверенны, что этот тип диаграмм наилучшим образом отражает ту информацию, которую Вы пытаетесь показать. К примеру, разница между столбчатой диаграммой (Bar Chart) и гистограммой базируется в основном на различии количественных и качественных данных. Качественные данные отличаются типом, но не степенью – они не могут быть измерены. Количество членов каждой партии в совете не может быть представлено гистограммой, так как не представляет одну популяцию.

Наиболее пригодны гистограммы для графического представления частотных распределений числовых рядов и данных, разбитых на интервалы (наблюдения группированы для наилучшего представления распределения).

Визуальная оценка гистограмм позволяет воспринять ряд статистических показателей:

  • распределение наблюдений;
  • наибольшую концентрацию данных – моду;
  • минимальное и максимальное значения;
  • разброс;
  • степень асимметрии (скос);
  • эксцесс;
  • наличие явных выбросов;
  • возможное присутствие нескольких распределений (популяций);
  • ширину интервалов – дистанция между правым и левым краями частотной ячейки по оси X;
  • количество интервалов – общее (в том числе и нулевые значения) количество частотных ячеек гистограммы

Кроме того, с помощью гистограмм можно удобно представить:

  • среднее арифметическое значение;
  • среднее медиану
  • стандартное отклонение и дисперсию.

Большинство пакетов статистической обработки данных содержит встроенную функцию расчета описательных статистик и вывода графического отчета:

Рассмотрим на этом примере некоторые особенности интерпретации данных с помощью гистограмм:

  1. Форма гистограммы с некоторым приближением напоминает "перевернутый колокол” и довольно точно описывается аппроксимирующей кривой (идеализированной функцией нормального распределения).
  2. Вероятность того, что наблюдения подчиняются нормальному закону распределения (p-value) составляет 0, 362, что значимо выше 0,05.
  3. Эксцесс (Kurtosis), числовая характеристика степени остроты пика, близок к 0 (-0,008).

Исходя из пунктов 1-3, можем считать рассмотренный набор значений удовлетворяющим нормальному закону распределения.

  1. Доля всех значений в определенном интервале гистограммы равна его площади (вся площадь гистограммы принимается равной единице, или 100%). Площадь интервала, соответственно, определяет вероятность того, что следующее наблюдение попадет в заданный диапазон результатов. Таким образом, самый высокий столбик гистограммы отвечает интервалу наиболее вероятных результатов.
  2. В рассмотренном примере среднее арифметическое значение (Mean) и медиана (Median) попадают за пределы этого интервала – находятся справа от него.
  3. Показатель асимметрии – скос (Skewness) равен 0,173 – выше 0.

Исходя из пунктов 4-6, можно сделать вывод о наличии незначительной положительной асимметрии, вызванной, скорее всего, влиянием выбросов – двух наблюдений, объединенных отдельным столбиком справа.

  1. Гистограмма содержит всего один четко выраженный пик, следовательно, доказательств присутствия данных из разных популяций не обнаружено.

Гистограммы являются одним из наиболее важных статистических инструментов анализа данных. Представление результатов наблюдений с их помощью позволяет исследователю оценить ряд статистических показателей, сделать выводы о функции распределения и определить возможные отклонения, а также сравнить два набора данных (в частности, результаты до и после произведенных действий или внедрения проектов). Гистограммы также являются незаменимым инструментом при работе с большими массивами данных, так как позволяют в простой и доступной форме визуализировать весь набор результатов.

Контрольная работа «Электронные таблицы».

    В электронной таблице основной элемент рабочего листа – это:

    1. ячейка;

      строка;

      столбец;

      формула.

    Выберите верное обозначение строки в электронной таблице:

    1. 18D;

      K13;

      34;

      AB.

    Выберите верный адрес ячейки в электронной таблице:

    1. 11 D;

      F12;

      A Б3 ;

      B1A.

    Диапазон - это:

    совокупность клеток, образующих в таблице область прямоугольной формы;

    все ячейки одной строки;

    все ячейки одного столбца;

    множество допустимых значений.

    Чему будет равно значение ячейки С1, если в нее ввести формулу =СУММ(A1:A7)/2:

    280;

    140;

    40;

    35?

    Результатом вычислений в ячейке С1 будет:

А1*2

А1+В1

А) 5

Б) 10

В) 15

Г) 20

  1. Электронную таблицу нельзя применить для:

    1. сортировки табличных данных;

      выполнения математических и экономических расчетов;

      построения графиков и диаграмм;

      обработки графических изображений.

8. В электронной таблице ячейкой называют:

    1. горизонтальную строку;

      вертикальный столбец;

      пересечение строки и столбца;

      курсор – рамку на экране.

9.Выберите верное обозначение столбца в электронной таблице:

    1. F12;

      A Б ;

      113.

10.В ячейке электронной таблицы не может находиться:

    число;

    текст;

    лист;

    формула.

11. Выберите верную запись формулы для электронной таблицы:

    C3+4*D4

    C3=C1+2*C2

    A5B5+23

    A2*A3-A4

12 . Чему будет равно значение ячейки С1, если в нее ввести формулу =А1+B1:

    20;

    15;

    10;

    30?

    1. График функции можно создать в Excel при помощи:

1. Строки формул;

2. Мастера Функций;

3. Мастера Шаблонов;

4. Мастера Диаграмм.

    1. Гистограмма наиболее пригодна для:

1. отображения распределений;

2. отображения динамики изменения данных;

3. сравнения различных членов группы;

4. отображения удельных соотношений различных признаков

    1. Диаграмма это:

1. карта местности;

2. форма графического представления числовых значений, которая позволяет облегчить интерпретацию числовых данных;

3. красиво оформленная таблица;

4. обычный график.

    1. Диаграмма в электронных таблицах – это:

1. качественно оформленная числовая таблица;

2. график, отображающий зависимость между всеми числами таблицы;

3. средство наглядного графического изображения информации, предназначенное для сравнения нескольких величин или нескольких значений одной величины, слежения за изменением их значений и т. п.

4. зависимость между числовыми значениями

    1. Круговая диаграмма – это диаграмма:

    представленная в виде круга, разбитого на секторы, в которой допускается только один ряд данных;

    в которой отдельные ряды данных представлены в виде закрашенных разными цветами областей;

    в которой используется система координат с тремя координатными осями, что позволяет получить эффект пространственного представления рядов данных;

    в которой отдельные значения представлены точками в декартовой состеме координат.

    1. В каком разделе меню табличного процессора Excel находится Мастер Диаграмм:

1. Правка;

2. Вставка;

3. Сервис;

4. Данные.

19. Диаграмма, в которой отдельные значения представлены точками в декартовой системе координат, называется:

1. линейчатой;

2. точечной;

3. круговой;

4. гистограммой.

20 . На основе чего строится любая диаграмма?

а. книги Excel

б. графического файла

в. текстового файла

г. данных таблицы

21. Дана электронная таблица:

А

В

С

D

1

1

3

4

2

4

2

5

3

3

1

2

В ячейку D1 введена формула, вычисляющая выражение по формуле =(A2+B1-C1).

В результате в ячейке D1 появится значение…

1) 1 2) 2 3) 3 4) 4

22. Значение в ячейке С3 электронной таблицы

А

В

С

1

3

9

=В2+$A$1

2

7

15

3

3

45

4

=C1-C2

равно

1) 27 2) 15 3) 34 4) 27

23. Значение С6 электронной таблицы

А

В

С

1

3

3

=СУММ(В2:С3)

2

0

2

6

3

=СТЕПЕНЬ(А5;2)

5

3

4

6

=МАКС(В1:В3)

7

5

5

4

35

6

=А3/В4+С1

равно

1) 22 2) 39 3) 26 4) 21

24. Дана электронная таблица:

А

В

С

D

1

1

3

4

8

2

3

2

5

3

7

1

2

Значение в ячейке С1 заменили на 7. В результате этого значение в ячейке D1 автоматически изменилось на 11. Можно предположить что в ячейке D1 ……

1) записана формула В1+С1

2) при любом изменении таблицы значение увеличивается на 3

3) записана формула СУММ(А1:С1)

4) записана формула СУММА(А1:А3)

25. Дан фрагмент электронной таблицы:

А

В

С

1

3

2

5

2

7

1

3

4

4

Значение ячейки С1 вычисляется по формуле =В1+$A$1

После копирования формулы значение в ячейке С3 будет равно

1) 10 2) 6 3) 7 4) 8

    Электронная таблица предназначена для:

1.обработки преимущественно числовых данных, структурированных с помощью таблиц;

    упорядоченного хранения и обработки значительных массивов данных;

    визуализации структурных связей между данными, представленными в таблицах;

    редактирования графических представлений больших объемов информации.

    Документом (объектом обработки) MS Excel является файл с произвольным именем и
    1) расширением. 1) ячейка 3) книга 2) формула 4) нет верного ответа

    Ниже в табличной форме представлен фрагмент базы данных:

Наименование товара

Цена

Количество

Стоимость

1

Монитор

7654

153080

2

Клавиатура

1340

34840

3

Мышь

235

7990

4

Принтер

3770

22620

5

Колонки

480

7680

6

Сканер

2880

28800

На какой позиции окажется товар « Сканер » после сортировки данной таблицы по возрастанию столбца

«Количество» ?

1) 1 2) 2 3) 6 4) 5



Просмотров