Статистическое наблюдение является первой стадией статистического исследования, представляющий собой научно организованный сбор данных об изучаемых явлениях и процессах общественной жизни. Основные этапы статистического исследования

Статистическая методология – система приемов, способов и методов, направленных на изучение количественных закономерностей, которые проявляются в структуре, динамике и взаимосвязях социально-экономических явлений. Методология является основой статистического исследования .

Этапы статистического исследования :

1. статистическое наблюдение, или сбор информации;

2. сводка и группировка результатов статистического наблюдения, или обработка информации;

3. анализ полученной информации.

Статистическое наблюдение – это массовое, планомерное, научно-организованное наблюдение за явлениями социальной и экономической жизни, которое заключается в регистрации отобранных признаков у каждой единицы совокупности.

Процесс проведения статистического наблюдения включает следующие этапы:

1) подготовка наблюдения;

2) проведение массового сбора данных;

3) подготовка данных к автоматизированной обработке;

4) разработка предложений по совершенствованию статистического наблюдения.

Сводка – комплекс последовательных операций по обобщению данных статистического наблюдения для характеристики статистической совокупности в целом и отдельных ее частей (подсчет промежуточных и общих итогов). Группировка – разграничение общей статистической совокупности на группы качественно однородных единиц. Результаты статистической сводки и группировки излагаются в виде статистических таблиц.

Анализ или исследование сущности изучаемых явлений, исследует структуру, динамику и взаимосвязи общественных явлений и процессов.

Имеет следующие этапы:

1) констатация фактов и их оценка;

2) установление характерных черт и причин каждого явления;

3) сопоставление одного явления с другими (в том числе с эталоном);

4) формулирование гипотез, выводов и предложений.

5) Статистическая проверка выдвинутых гипотез с помощью специальных статистических показателей

38.Статистические методы прогнозирования на основе показателей ряда динамики. Процесс прогнозирования, опирающийся на статистические методы, распадается на два этапа. Первый, индуктивный , заключается в обобщении данных, наблюдаемых за более или менее продолжительный период времени, и в представлении соответствующих статистических закономерностей в виде модели. Статистическую модель получают или в виде аналитически выраженной тенденции развития, или же в виде уравнения зависимости от одного или нескольких факторов-аргументов. В ряде случаев – при изучении сложных комплексов экономических показателей – прибегают к разработке так называемых взаимозависимых систем уравнений, состоящих в основном опять-таки из уравнений, характеризующих статистические зависимости. Процесс построения и применения статистической модели для прогнозирования, какой бы вид последняя не имела, обязательно включает выбор формы уравнения, описывающего динамику или взаимосвязь явлений, и оценивание его параметров с помощью того или иного метода. Второй этап, собственно прогноз, является дедуктивным . На этом этапе на основе найденных статистических закономерностей определяют ожидаемое значение прогнозируемого признака.

Следует подчеркнуть, что полученные результаты не могут рассматриваться как нечто окончательное. При их оценке и использовании должны приниматься во внимание факторы, условия или ограничения, которые не были учтены при разработке статистической модели, должна осуществляться корректировка обнаруженных статистических характеристик в соответствии с ожидаемым изменением обстоятельств их формирования. Короче говоря, найденные с помощью статистических методов прогностические оценки являются важным материалом, который, однако, должен быть критически осмыслен. При этом главным является учет возможных изменений в самих тенденциях развития экономических явлений и объектов

39.Статистические таблицы, их виды, составные элементы и правила построения таблиц. Статистическая таблица - форма наиболее рационального изложения полученных в результате статистической сводки и группировки числовых (цифровых) данных. По внешнему виду она представляет собой комбинацию вертикальных и горизонтальных строк, содержащую боковые и верхние заголовки. Статистическая таблица содержит подлежащее и сказуемое.

Подлежащее таблицы представляет ту статистическую совокупность, о которой идет речь в таблице, т. е. перечень отдельных или всех единиц совокупности либо их групп. Чаще всего подлежащее помещается в левой части таблицы и содержит перечень строк.

41.СТРУКТУРНАЯ СРЕДНЯЯ МОДА И ЕЕ ОПРЕДЕЛЕНИЕ. Величина средней определяется всеми значениями признака, встречающимися в данном ряду распределения. Различают такие структурные средние, как: (1) мода (2) медиана (3) квартиль (4) дециль (5) перцентиль Мода - это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей. Модой для дискретного ряда является варианта, обладающая наибольшей частотой. При вычислении моды для интервального вариационного ряда необходимо сначала определить модальный интервал (по максимальной частоте), а затем - значение модальной величины признака по формуле: где:

Сказуемое таблицы - показатели, с помощью которых дается характеристика явления, отображаемого в таблице.

Если в подлежащем таблицы содержится простой перечень каких-либо объектов, таблица называется простой. В подлежащем простой таблицы нет каких-либо группировок статистических данных. Если подлежащее простой таблицы содержит перечень территорий, то такая таблица называется территориальной.

Простая таблица содержит только описательные сведения, ее аналитические возможности ограничены. Глубокий анализ исследуемой совокупности, взаимосвязей признаков предполагает построение более сложных таблиц - групповых и комбинационных.

Групповые таблицы содержат в подлежащем группировку единиц объекта наблюдения по одному существенному признаку. Простейшим видом групповой таблицы являются таблицы, в которых представлены ряды распределения. Групповая таблица может быть более сложной, если в сказуемом приводится не только число единиц в каждой группе, но и ряд других важных показателей, количественно и качественно характеризующих группы подлежащего. Такие таблицы часто используются в целях сопоставления обобщающих показателей по группам, что позволяет сделать определенные практические выводы.

Комбинационными называются статистические таблицы, е подлежащей которых группы единиц, образованные по одному признаку, подразделяются на подгруппы по одному или нескольким признакам. В отличие от простых и групповых таблиц, комбинационные позволяют проследить зависимость показателей сказуемого от нескольких признаков, которые легли в основу комбинационной группировки в подлежащем.

Основные правила построения статистических таблиц:

1) в заголовке должны быть отражены объект, признак, время и место совершения события;

2) графы и строки следует нумеровать;

3) графы и строки должны содержать единицы измерения;

4) сопоставляемую в ходе анализа информацию располагают в соседних графах (либо одну под другой);

5) числа в таблице проставляют в середине граф, строго одно под другим; числа целесообразно округлять с одинаковой степенью точности;

6) отсутствие данных обозначается знаком умножения ( ), если данная позиция не подлежит заполнению, отсутствие сведений обозначается многоточием (...), либо н.д., либо н. св., при отсутствии явления ставится знак тире (-);

7) для отображения очень малых чисел используют обозначение 0.0 или 0.00; если число получено на основании условных расчетов, то его берут в скобки, сомнительные числа сопровождают вопросительным знаком, а предварительные - знаком (*).

40.Структурная средняя медиана и ее определение. Медиана - это численное значение признака у той единицы совокупности, которая находится в середине ранжированного ряда (построенного в порядке возрастания, либо убывания значений изучаемого признака). Медиану иногда называют серединной вариантой , т.к. она делит совокупность на две равные части таким образом, чтобы по обе ее стороны находилось одинаковое число единиц совокупности. Если всем единицам ряда присвоить порядковые номера, то порядковый номер медианы будет определяться по формуле (n+1):2 для рядов, где n – нечетное . Если же ряд с четным числом единиц, то медианой будет являться среднее значение между двумя соседними вариантами, определенными по формуле: n:2, (n+1):2, (n:2)+1.

В дискретных вариационных рядах с нечетным числом единиц совокупности – это конкретное численное значение в середине ряда.

Нахождение медианы в интервальных вариационных рядах требует предварительного определения интервала, в котором находится медиана, т.е. медианногоинтервала – этот интервал характеризуется тем, что его кумулятивная (накопленная) частота равна полусумме или превышает полусумму всех частот ряда.

X Me -нижняя граница медианного интервала

h Me -величина медианного интервала;

S Me-1 -сумма накопленных частот интервала, предшествующего медианному интервалу;

  • f Me -локальная частота медианного интервала.

Частота интервала, следующего за модальным

42.Сущность и значение графиков, их основные элементы. В статистике графиком называют наглядное изобр ажение статистических величин и их соотношений при помощи геометрических точек, линий, фигур или географических картосхем.

Графики придают изложению статистических данных большую наглядность , чем таблицы, выразительность, облегчают их восприятие и анализ . Позволяет зрительно оценить характер изучаемого явления, присущие ему закономерности, тенденции развития, взаимосвязи с другими показателями, географическое разрешение изучаемых явлений. Еще в древности китайцы говорили, что одно изображение заменяет тысячу слов.При любой возможности анализ статистических данных рекомендуется всегда начинать с их графического изображения. График позволяет сразу получить общее представление обо всей совокупности статистических показателей. Графический метод анализа выступает как логическое продолжение табличного метода и служит целям получения обобщающих статистических характеристик процессов, свойственных массовым явлениям.
При помощи графического изображения стат.данных решаютсязадачи стат.исследования:

1) наглядное представление величины показателей (явлений) в сравнении друг с другом;

2) характеристика структуры какого-либо явления;

3) изменение явления во времени;

4) ход выполнения плана;

5) зависимость изменения одного явления от изменения другого;

6) распространенность или размещение каких-либо величин по территории

В каждом графике выделяют (различают) следующие основные элементы :

  • 1) пространственные ориентиры (систему координат);
  • 2) графический образ;
  • 3) поле графика;
  • 4) масштабные ориентиры;
  • 5) экспликация графика;
  • 6) наименование графика

43.Сущность и значение средних величин. Средняя величина – обобщенная характеристика уровня значений признака, полученная в расчете на единицу совокупности. Средняя величина вычисляется для признаков качественно однородных и различных только количественно, которые присущи всем явлениям в данной совокупности.

Средние величины бывают общими (отражают совокупность в целом) и групповыми (отражают особенность по группам). Делятся на 2 категории – степенные и структурные .

К степенным относятся – средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая. Самая распространенная – ср.арифметическая . Ср.гармоническую используют как обратную ср.арифметической. Ср.квадратическая используется при расчете показателей вариации, ср.геометрическая – при анализе динамики.

К структурным относятся – мода и медиана. Мода – значение изучаемого признака с наибольшей частотой. Медиана – значение признака, приходящее на середину ранжированного ряда. Мода применяется в коммерческой практике для изучения покупательского спроса и регистрации цен. В дискретном ряду мода - это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант интервала, который имеет наибольшую частоту. Применение медианы позволяет получить более точные результаты, чем при использовании других форм средних. Свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.Порядок нахождения медианы в интервальном вариационном ряду следующий: располагаем индивидуальные значения признака по ранжиру; определяем для данного ранжированного ряда накопленные частоты; по данным о накопленных частотах находим медианный интервал.

Основные этапы статистического исследования

Рассмотрим самый важный метод статистики – статистическое наблюдение.

Использование различных способов и приемов статистической методологии

предполагает наличие исчерпывающей и достоверной информации об изучаемом

объекте. Исследование массовых общественных явлений включает этапы сбора

статистической информации и ее первичной обработки, сведения и группировки

результатов наблюдения в определенные совокупности, обобщения и анализа

полученных материалов.

На первом этапе статистического исследования формируются первичные

статистические данные, или исходная статистическая информация, которая

является фундаментом будущего статистического здания. Чтобы здание было

прочным, добротной и качественной должна быть его основа. Если при сборе

первичных статистических данных допущена ошибка или материал оказался

недоброкачественным, это повлияет на правильность и достоверность как

теоретических, так и практических выводов. Поэтому, статистическое

наблюдение от начальной до завершающей стадии - получения итоговых

материалов - должно быть тщательно продуманным и четко ооганизованным.

Статистическое наблюдение дает исходный материал для обобщения, началом

которого служит сводка. Если при статистическом наблюдении о каждой его

единице получают сведения, характеризующие ее с многих сторон, то данные

сводки характеризуют всю статистическую совокупность и отдельные ее части.

На этой стадии совокупность делится по признакам различия и объединяется по

признакам сходства, подсчитываются суммарные показатели по группам и в

целом. С помощью метода группировок изучаемые явления делятся на важнейшие

типы, характерные группы и подгруппы по существенным признакам. С помощью

группировок ограничивают качественно однородные в существенном отношении

совокупности, что является предпосылкой для определения и применения

обобщающих показателей.

На заключительном этапе анализа с помощью обобщающих показателей

рассчитываются относительные и средние величины, дается сводная оценка

вариации признаков, характеризуется динамика явлений, применяются индексы,

балансовые построения, рассчитываются показатели, характеризующие тесноту

связей в изменении признаков. С целью наиболее рационального и наглядного

изложения цифрового материала он представляется в виде таблиц и графиков.

3.Статистическое наблюдение: понятие, основные формы.

Это научно-организ.работа по сбору данных. Формы:стат. 1) отчетность, кот. базируется на докум.учете. с 98 г введены 4 унифицир.формы федер.гос.набл-ния: ФП-1 (выпуск пр-ции), ФП-2 (инвестизм), ФП-3 (фин.состояние орг-ций), ФП-4 (числ-ть раб-ков, труд), 2) специально организ.набл-ние (перепись), 3) регистр – это с-ма пок-лей, кот.хар-т кажд.ед-цу набл-ния: регистры нас-ния, пр-тий, строек и подряд.орг-ций, розн.и оптов.торговли. Виды набл-ния: 1) сплошное, несплошное (выборочн., цензовые основанные на методе осн. массива, монограф.). Набл-ние бывает текущее, период., единовремен. Способы набл-ния: непосредств., документал., опрос (экспедиц., анкетный, явочный, корреспонд.). Стат.набл-ния проводятся по плану, кот.вкл-т в себя: программно-методолог.вопросы (цели, задачи), организ.вопросы (время, место). В рез-те, проведенных набл-ний возникают погрешности, кот снижают точность набл-ний, поэтому проводится контроль данных (логический и счетный). В рез-те проверки достовер.данных выявл-тся след.ошибки набл-ний: случ. ошибки (ошибки регистрации), преднамер.ошибки, непреднамер. (систем.и несистем.), ошибки репрезентативности (представительности).

Програмно-методологические вопросы статистического наблюдения.

Программно-методологические вопросы статистического наблюдения

Каждое наблюдение проводится с конкретной целью. При его проведении необходимо установить, что подлежит обследованию. Надо решить следующие вопросы:

Объект наблюдения – совокупность предметов, явлений, у которых должны быть собраны сведения. При определении объекта указываются его основные отличительные черты (признаки). Всякий объект массовых наблюдений состоит их отдельных единиц, поэтому надо решить вопрос о том, каков тот элемент совокупности, который послужит единицей наблюдения.

Единица наблюдения – это составной элемент объекта, который является носителем признаков, подлежащих регистрации и основой счета.

Ценз – это определенные количественные ограничения для объекта наблюдения.

Признак – это свойство, которое характеризует определенные черты и особенности, присущие единицам изучаемой совокупности.

Организационные вопросы статистического наблюдения.

Программа наблюдения оформляется в виде бланков (анкет, формуляров), в которые заносятся первичные данные. Необходимым дополнением бланков является инструкция, которая разъясняет смысл вопросов.

К организационным вопросам программы относятся:

сроки наблюдения;

критический момент наблюдения;

подготовительные работы;

Срок наблюдения, к которому относят регистрируемые сведения. Называется объективным временем наблюдения. Это м.б. определенный период времени (сутки, декада, месяц) или определенный момент. Момент, к которому относятся регистрируемые сведения, называется критическим моментом наблюдения.

Например, критическим моментом микропереписи 94г. был 0.00 ч. в ночь с 13-14 февраля. Устанавливая критический момент наблюдения, м. с фотографической точностью определить истинное положение дел.

Подготовительные работы предусматривают обеспечение наблюдения документами, а также составление списка отчетных единиц, бланков, инструкций.

Документы м. заполнятся в ходе наблюдения или по его результатам.

Важное место в системе подготовительных работ имеет подбор и подготовка кадров, а также проведение инструктажа с теми, кто будет участвовать в проведении наблюдения.

Понятие об исследовании количественных сторон объектов и явлений сформировалось давно, с момента развития у человека элементарных навыков работы с информацией. Однако, термин «статистика», дошедший до нашего времени заимствован гораздо позднее из латинского языка и происходит от слова «status», что означает «определенное состояние вещей». «Status» употреблялось также в значении «политическое состояние» и закрепилось почти во всех европейских языках именно в этом смысловом значении: английское «state», немецкое «Staat», итальянское «stato» и производное от него «statistа» - знаток государства.

Широкое применение слово «статистика» получило в XVIII веке и применялось в значение «государствоведение». Статистикой называют отрасль практической деятельности, направленной на собирание, обработку, анализ и предоставление в публичное пользование данных о явлениях и процессах общественной жизни.

Анализ - это метод научного исследования объекта путем рассмотрения его отдельных сторон и составных частей.

Экономико-статистический анализ - это разработка методики, основанной на широком применении традиционных статистических и математико-статистических методов, с целью контроля адекватного отражения исследуемых явлений и процессов.

Этапы статистического исследования. Статистическое исследование проходит в три этапа:

  • 1) статистическое наблюдение;
  • 2) сводка полученных данных;
  • 3) статистический анализ.

На первом этапе с помощью метода массовых наблюдений собирают первичные статистические данные.

На втором этапе статистического исследования собранные данные подвергаются первичной обработки, сводке и группировке. Метод группировок позволяет выделить однородные совокупности, разделить их на группы и подгруппы. Сводка - это получение итогов по совокупности в целом и отдельным ее группам и подгруппам.

Результаты группировки и сводки излагаются в виде статистических таблиц. Основное содержание этого этапа заключается в переходе от характеристик каждой единицы наблюдения к сводным характеристикам совокупности в целом или ее групп.

На третьем этапе полученные сводные данные анализируются методом обобщающих показателей (абсолютные, относительные и средние величины, показатели вариации, индексные системы, методы математической статистики, табличный метод, графический метод и др.).

Основы статистического анализа:

  • 1) утверждение фактов и установление их оценки;
  • 2) выявление характерных особенностей и причин явления;
  • 3) сравнение явления с нормативными, плановыми и другими явлениями, которые приняты за базу сравнения;
  • 4) формулирование выводов, прогнозов, предположений и гипотез;
  • 5) статистическая проверка выдвинутых предположений (гипотез).

Анализ и обобщение статистических данных - заключительный этап статистического исследования, конечной целью которого является получение теоретических выводов и практических заключений о тенденциях и закономерностях изучаемых социально-экономических явлений и процессов. Задачами статистического анализа являются: определение и оценка специфики и особенностей изучаемых явлений и процессов, изучение их структуры, взаимосвязей и закономерностей их развития.

Статистический анализ данных проводится в неразрывной связи теоретического, качественного анализа сущности исследуемых явлений и соответствующего количественного инструментария, изучения их структуры, связей и динамики.

Статистический анализ - исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

В статистическом анализе признаки подразделяются по характеру влияния друг на друга:

  • 1. Признак-результат - признак, анализируемый в данном исследовании. Индивидуальные размеры такого признака у отдельных элементов совокупности подвержены влиянию одного или нескольких других признаков. Другим словами, признак-результат рассматривается как следствие взаимодействия других факторов;
  • 2. Признак-фактор - признак, оказывающий влияние на исследуемый признак (признак-результат). Причем зависимость между признаком-фактором и признаком-результатом может быть количественно определенна. Синонимами данного термина в статистике являются, «факторный признак», «фактор». Следует различать понятия признака-фактора и признака-веса. Признаком-весом называют такой признак, который необходимо учесть при расчетах. Но, признак-вес не оказывает влияния на исследуемый признак. Признак-фактор может рассматриваться как признак-вес, т. е., учитываться при расчетах, но не всякий признак-вес является признаком-фактором. Например, при исследовании в группе студентов зависимости между временем подготовки к экзамену и количеством баллов, полученных на экзамене должен учитываться и третий признак: «Количество человек, аттестованных на определенный балл». Последний признак не является влияющим на результат, однако, будет включен в аналитические расчеты. Именно такой признак и называется признаком-весом, а не признаком-фактором.

Прежде чем приступить к анализу, необходимо проверить, соблюдены ли условия, обеспечивающие его достоверность и правильность:

  • - Достоверность первичных цифровых данных;
  • - Полнота охвата изучаемой совокупности;
  • - Сопоставимость показателей (по единицам учета, территории, методике подсчета).

Основными понятиями статистического анализа являются:

  • 1. Гипотеза;
  • 2. Решающая функция и решающее правило;
  • 3. Выборка из генеральной совокупности;
  • 4. Оценка характеристик генеральной совокупности;
  • 5. Доверительный интервал;
  • 6. Тренд;
  • 7. Статистическая взаимосвязь.

Анализ является завершающей стадией статистического исследования, сутью которой является выявление взаимосвязей и закономерностей изучаемого явления, формулировка выводов и предложений.

Интенсификация труда медицинских работников в условиях бюджетно-страхового здравоохранения предъявляет повышенные требования к научно-организационным факторам. В данных условиях возрастает роль медицинской статистики в научной и практической деятельности медицинского учреждения.

В практической и научно-исследовательской деятельности врач, как правило, анализирует результаты своей деятельности не только на индивидуальном, но и на групповом и популяционном уровнях. Это необходимо врачу для подтверждения уровня квалификации, а также в целях дальнейшего усовершенствования и профессиональной специализации. Поэтому умение правильно организовать и провести статистическое исследование необходимо всем врачам различного профиля, руководителям учреждений и органов здравоохранения. Такие знания и умения способствуют повышению качества и эффективности медицинской помощи населению через непрерывную подготовку кадров (важнейший элемент ресурсного обеспечения) и, таким образом, конкурентоспособности лечебно-профилактических учреждений различных форм собственности в условиях рыночной экономики.

Руководители здравоохранения в оперативной и прогностической работе постоянно используют статистические данные. Только квалифицированный анализ статистических данных, оценка событий и соответствующие выводы позволяют принять правильное управленческое решение, способствуют лучшей организации работы, более точному планированию и прогнозированию. Статистика помогает контролировать деятельность учреждения, оперативно управлять им, судить о качестве и эффективности лечебно-профилактической работы. Руководитель при составлении текущих и перспективных планов работы должен основываться на изучении и анализе тенденций и закономерностей развития как здравоохранения, так и состояния здоровья населения своего района, города, области и т. д.

Традиционная статистическая система в здравоохранении основана на получении данных в виде отчетов, которые составляются в низовых учреждениях и затем суммируются на промежуточных и высших уровнях. Система отчетов имеет не только преимущества (единая программа, обеспечение сравнимости, показатели объема работы и использования ресурсов, простота и малая стоимость сбора материалов), но и определенные недостатки (малая оперативность, жесткость, негибкая программа, ограниченный набор сведений, неконтролируемые ошибки учета и др.).

Анализ проделанной работы должен осуществляться врачами не только на основании существующей отчетной документации, но и путем специально проводимых выборочных статистических исследований.

План статистического исследования составляется в соответствии с намеченной программой. Основными вопросами плана являются:

  1. определение цели исследования;
  2. определение объекта наблюдения;
  3. определение срока проведения работы на всех этапах;
  4. указание вида статистического наблюдения и метода;
  5. определение места, где будут проводиться наблюдения;
  6. выяснение, какими силами и под чьим методическим и организационным руководством будут проводиться исследования.

Организация статистического исследования делится на несколько стадий:

  • стадию знакомства с литературными данными, что позволяет получить представление об изучаемой проблеме, выбрать адекватную методлику исследования и сформулировать рабочую гипотезу
  • стадию наблюдения;
  • статистическую группировку и сводку;
  • счетную обработку;
  • научный анализ;
  • литературное и графическое оформление данных исследования.

Программа статистического исследования предусматривает решение следующих вопросов:

  1. определение единицы наблюдения и составление программы сбора материала ;

    Единица наблюдения - каждый первичный элемент статистической совокупности.
    Единица наблюдения наделена признаками сходства и различия, которые подлежат учету и дальнейшему наблюдению, поэтому эти признаки называются учитываемыми (учетными).

    Учитываемые признаки - признаки, по которым различаются элементы единицы наблюдения в статистической совокупности. Признаки классифицируются:

    • по характеру на:
      а) атрибутивные (описательные) признаки - выражены словесно;
      б) количественные признаки - выражены числом;
    • по роли в совокупности на:
      а) факторные признаки, влияющие на изучаемое явление;
      б) результативные признаки, изменяющиеся под влиянием факторных признаков.

    Пример: в нашем исследовании единицей наблюдения является студент, обучающийся в данном медицинском вузе на протяжении всех лет. Учитываемые признаки по характеру делятся на:
    а) атрибутивные - пол, наличие вредных привычек, состояние здоровья и т.п.;
    б) количественные - возраст, число выкуриваемых сигарет, длительность заболевания, стаж курения и т.п.;
    в) по совокупности факторных признаков - наличие вредных привычек и стаж курения;
    г) результативные признаки - состояние здоровья, наличие заболевания и т.п.

    Программа сбора материала представляет собой последовательное изложение учитываемых признаков - вопросов, на которые необходимо получить ответы при проведении данного исследования. Это может быть специально составленный исследователем опросный лист, анкета, карта. Документ должен иметь четкое название. Вопросы (учитываемые признаки) должны быть четкими, краткими, соответствовать цели и задачам исследования; на каждый вопрос следует предусмотреть варианты ответов. Эти варианты готовых ответов носят название "группировка".

    Группировка признаков осуществляется с целью выделения однородных групп для изучения тех или иных закономерностей изучаемого явления. Группировка ответов по атрибутивным признакам называется типологической, по количественным признакам - вариационной.

    Пример типологической группировки:

    • группировка студентов по полу:
      • мужчина,
      • женщина;
    • группировка студентов по наличию иди отсутствию вредных привычек:
      • курящие студенты,
      • некурящие студенты.

    Пример вариационной группировки:

    • группировка студентов по количеству выкуриваемых сигарет в день:
      • 10 и менее;
      • более 20

    Пример карты, заполняемой студентом-медиком при изучении распространенности курения, представлен ниже. Все вопросы карты имеют группировки и рекомендации по ее заполнению.

    Карта* по изучению распространенности курения среди студентов медицинских вузов

    1. Ф.И.О студента ____________________________(вписать полностью)
    2. Курс: I, II, III, IV, V, VI
    3. Факультет: лечебный, медико-профилактический, фармацевтический, факультет военного обучения
    4. Возраст: до 20 лет, 20, 21, 22, 23, 24, 25 и более
    5. Пол: муж/жен
    6. Признаете ли Вы, что курение вредит здоровью? Да, нет, не знаю
    7. Кто курит из живущих с Вами людей: отец, мать, брат, сестра, муж, жена, товарищ, никто не курит
    8. Курите ли Вы? Да, нет
    9. Возраст, в котором выкурили первую сигарету: до 15 лет, 16-18 лет, старше 18 лет
    10. Какое количество сигарет (папирос) выкуриваете в день? 5-10, 11-20, более 20
    11. Что побудило Вас впервые закурить: пример родителей, пример преподавателей, влияние товарищей, желание казаться взрослым, желание похудеть, любопытство, желание не отстать от моды?

    И другие вопросы в соответствии с целью и задачей исследования.

  2. составление программы разработки материала ; Программа разработки полученных данных предусматривает составление макетов статистических таблиц с учетом группировок.

    Требования, предъявляемые к таблицам . Макеты статистических таблиц должны иметь четкое и краткое название, соответствующее их содержанию. В таблице различают подлежащее и сказуемое.

    Статистическое подлежащее - это то, о чем говорится в таблице. Табличное подлежащее содержит основные признаки, являющиеся предметом исследования, и размещается обычно в левой части таблицы по вертикали.

    Статистическое сказуемое - это то, что характеризует подлежащее и размещается по горизонтали.

    В таблицах необходимо предусмотреть итоговые данные, по которым будут проводиться расчеты показателей на третьем этапе статистического исследования при обработке полученных данных.

    Виды таблиц. Статистические таблицы разделяются на простые, групповые, комбинационные.

    Простой (табл. 1) называется таблица, позволяющая анализировать полученные данные, сгруппированные лишь по одному признаку (подлежащее).

    Таблица 1. Распределение курящих студентов по факультетам (в абс. числах и в % к итогу)

    Групповой (табл. 2) называется таблица, в которой устанавливается связь между отдельными признаками, т.е. помимо подлежащего, имеется сказуемое, представленное одной или более группировками, которые связаны (попарно) с группировками подлежащего, но не связаны между собой.

    Таблица 2. Распределение студентов различных факультетов по полу и возрасту, в котором они выкурили первую сигарету

    Комбинационной (табл. 3) называется таблица, в которой есть два или несколько сказуемых, которые связаны не только с подлежащим, но и между собой.

    Таблица 3. Распределение курящих студентов различных факультетов по полу и среднему количеству сигарет (папирос), выкуриваемых в день

    Наименование факультетов Среднее количество сигарет (папирос), выкуриваемых студентами в день Всего
    10 и менее 11 - 20 более 20
    м ж оба пола м ж оба пола м ж оба пола м ж оба пола
    1. Лечебный
    2. Медико-профилактический
    3. Фармацевтический и т.д.
    Итого:
  3. составление программы анализа собранного материала .

    Программа анализа предусматривает перечень статистических методик, необходимых для выявления закономерностей изучаемого явления.
    План исследования предусматривает решение следующих организационных вопросов:

    1. Выбор объекта исследования
    2. Определение объема статистической совокупности
    3. Сроки и место (территория) проведения исследования, виды и способы наблюдения и сбора материала
    4. Характеристика исполнителей (кадры)
    5. Характеристика технического оснащения и требуемых материальных средств
    6. Объект статистического исследования - это совокупность, с которой будут собираться необходимые сведения. Это может быть население, студенты, больные, госпитализированные в больницы и т.п.

    Статистическая совокупность - это группа, состоящая из относительно однородных элементов, взятых вместе в известных границах времени и пространства в соответствии с поставленной целью. Структура статистической совокупности: статистическая совокупность состоит из единиц наблюдения (см. схему).

    На примере нашего исследования - статистическая совокупность - это студенты, обучающиеся в данном вузе на протяжении всего периода обучения.

    Различают два вида совокупности - генеральная и выборочная.

    Генеральная совокупность - это группа, состоящая из всех относительно однородных элементов в соответствии с поставленной целью.

    Выборочная совокупность - отобранная для исследования часть генеральной совокупности и предназначенная для характеристики всей генеральной совокупности. Она должна быть репрезентативна (представительна) по количеству и качеству по отношению к генеральной совокупности.

    Репрезентативность количественная основана на законе больших чисел и означает достаточную численность элементов выборочной совокупности, рассчитываемую по специальным формулам и таблицам.

    Репрезентативность качественная основана на законе вероятности и означает соответствие (однотипность) признаков, характеризующих элементы выборочной совокупности по отношению к генеральной.

    В нашем примере генеральной совокупностью являются все студенты медицинского вуза; выборочной совокупностью - часть студентов каждого курса и факультета данного вуза.

    Объем статистической совокупности - это численность элементов совокупности, взятых для исследования.

    Сроки и место (территория) проведения исследования - это составление календарного плана выполнения данного исследования по данному этапу на конкретной территории. Пример: с 1 апреля по 1 июня текущего года в ММА им. И.М. Сеченова.

    Виды наблюдения :

    1. текущее (или постоянное) наблюдение - когда регистрация проводится постоянно по мере возникновения единиц наблюдения. Пример: каждый случай рождения, смерти, обращения в лечебные учреждения.
    2. и единовременное (или одномоментное) наблюдение - когда изучаемые явления фиксируются на какой-либо определенный момент (час, день недели, дату). Пример: перепись населения, состав коечного фонда стационара.

    Способы проведения исследования. Для исследователя важно определить способ проведения исследования: сплошное наблюдение или несплошное (выборочное).

    1. Сплошное наблюдение - это регистрация всех единиц наблюдения, составляющих генеральную совокупность.
    2. Несплошное (выборочное) наблюдение - изучение лишь части совокупности для характеристики целого.

    Методы проведения исследования на выборочной совокупности (монографический, основного массива, анкетный и др.).

    1. Монографический метод применяется при изучении какого-либо одного объекта, когда из множества объектов избирается один и исследуется с максимальной полнотой с целью показа передового опыта, выявления тенденций развития явления. Пример: описание новой хирургической технологии.
    2. Метод основного массива применяется при изучении тех объектов, в которых сосредоточено большинство изучаемых явлений. Суть его состоит в том, что из всех единиц наблюдения, входящих в состав данного объекта, избирается их основная часть, характеризующая всю статистическую совокупность. Пример: на заводе имеется 7 основных цехов, в которых занято 1300 рабочих и два небольших вспомогательных цеха со 100 рабочими. Для наблюдения можно взять только основные цеха и по ним сделать выводы, касающиеся всего завода.
    3. Анкетный метод применяется для сбора статистических сведений с помощью специально разработанных анкет. Пример: при изучении распространенности желудочно-кишечных заболеваний среди учащихся профессионально-технических училищ города Н. была разработана анкета с перечнем вопросов, интересующих исследователя.

Методы отбора изучаемых явлений и формирования выборочной совокупности

Существуют следующие методы отбора изучаемых явлений: случайный, механический, гнездовой, направленный, типологический.

  1. Случайный отбор - это отбор, проводимый по жребию (по начальной букве фамилии или по дню рождения и т.п.).
  2. Механический отбор - это отбор, когда у всей совокупности берется для изучения механически отобранная каждая пятая (20 %) или десятая (10 %) единица наблюдения.
  3. Гнездовой (серийный) отбор - когда из генеральной совокупности выбираются не отдельные единицы, а гнезда (серии), которые отбираются путем случайной или механической выборки. Пример: для изучения заболеваемости сельского населения М-ской области изучается заболеваемость сельского населения одного, наиболее типичного пункта. Результаты распространяются на все сельское население области.
  4. Направленный отбор - это отбор, когда из генеральной совокупности с целью выявления определенных закономерностей отбираются только те единицы наблюдения, которые позволят выявить влияние неизвестных факторов при устранении влияния известных. Пример: при изучении влияния стажа рабочих на травматизм отбираются рабочие одной профессии, одного возраста, одного цеха, одного образовательного уровня.
  5. Типологический отбор - это отбор единиц из заранее сгруппированных однотипных качественных групп. Пример: при изучении закономерности смертности среди городского населения следует сгруппировать изучаемые города по численности населения в них.

Характеристика исполнителей (кадры) . Сколько человек и какой квалификации проводят исследование. Пример: исследование по изучению санитарно-гигиенического режима учащихся старших классов средних общеобразовательных школ района проводят два врача и два помощника санитарного врача центра гигиены и эпидемиологии данного административного округа.

Характеристика технического оснащения и требуемых материальных средств :

  • лабораторное оборудование и приборы, соответствующие цели исследования;
  • канцелярские товары (бумага, бланки);
  • без дополнительных ассигнований.
Сбор материала - это процесс регистрации, заполнения официально существующие или специально разработанных учетных документов (талоны, карт и т.п.). Сбор материала проводят согласно составленным ранее программе и плану исследования. 3-й этап статистического исследования включает следующие последовательно выполняемые исследователем действия:
  1. контроль собранного материала - это проверка собранного материала с целью отбора учетных документов, имеющих дефекты для их последующего исправления, дополнения или исключения из исследования. Например, в анкете не указан пол, возраст или нет ответов на другие поставленные вопросы. В этом случае необходимы дополнительные учетные документы (амбулаторные карты, истории болезни и т.п.). Если эти данные не могут быть получены из дополнительных учетных документов, привлеченных исследователем, то некачественные карты (анкеты) должны быть исключены из исследования.
  2. шифровка - это применение условных обозначений выделяемых признаков. При ручной обработке материала шифры могут быть цифровые, буквенные; при машинной - только цифровые.

    Пример: буквенная шифровка:
    Пол:
    муж. М
    жен. Ж

    цифровая шифровка:

  3. группировка материала - это распределение собранного материала по атрибутивному или количественному признаку (типологическая или вариационная). Пример: группировка студентов по курсам обучения: I курс, II курс, III курс, IV курс, V курс, VI курс.
  4. сводка данных в статистические таблицы - занесение полученных после подсчета цифровых данных в таблицы
  5. вычисление статистических показателей и статистическая обработка материала .

Цель исследования: разработать мероприятия по снижению болезней органов пищеварения (БОП) у студентов медицинского вуза.

Задачи исследования:

  1. Изучить распространенность различных болезней органов пищеварения (БОП) у студентов медицинского вуза.
  2. Определить факторы риска возникновения БОП.
  3. Разработать предложения для администрации вуза

Программа исследования:

Единица наблюдения - студент с диагнозом БОП, обучающийся в медицинском вузе на данном факультете.
Атрибутивные признаки: пол, диагноз, характер питания.
Количественные признаки: возраст, длительность заболевания, интевал между приемами пищи, число приемов пищи в день.
Результативные признаки: наличие заболевания системы органоЙ пищеварения.
Факторные признаки: пол, возраст, характер питания и др.

Программа сбора материала (анкета, заполненная студентом)

а) ФИО
б) Курс: 1,2,3,4,5,6
в) Факультет: лечебный (1), медико-профилактический (2), фармацевтический (3)
г) Возраст: до 20 лет включительно - (1), 21-22 - (2), 23-24 -(3), 25 и более (4)
д) Пол: муж (1), жен (2)
е) Сколько раз в течение дня Вы принимаете пищу? Один - (1), два - (2), три и более (3)
ж) Прием пищи состоит из бутербродов без чая (1), бутербродов с чаем (2), полного обеда (3), другого (4) (укажите)
__________________________
з) Каков интервал между приемами пищи: до 1 ч (1), 1-2 ч (2), 3-4ч (3), 5 ч и более (4)
и) Предусмотрено ли в расписании занятий время на обед: (да - (1), нет - (2)
к) Имеете ли Вы заболевание системы органов пищеварения: да - (1), нет - (2)
л) Если Вы ответили "да", то укажите диагноз:___________________
м) Длительность заболевания: до 1 года - (1), 2-3 года - (2), 4-5 лет - (3), 6 лет и более - (4)

И другие вопросы в соответствии с целью и задачами исследования.

Программа разработки материала
Типологическая группировка: группировка студентов по факультетам, полу, по диагнозу заболевания.
Вариационная группировка: группировка по длительности заболевания (до 1 года, 2-3 года, 4-5 лет, 6 лет и более), интервал между приемами пищи (до 1 ч, 1-2 ч, 3-4 ч, 5 ч и более).

Макеты статистических таблиц

Простая таблица
Таблица 4. Распределение студентов, имеющих заболевания системы органов пищеварения по нозологическим формам (в % к итогу)

Групповая таблица
Таблица 5. Распределение студентов, имеющих заболевания системы органов пищеварения по полу и возрасту (в % к итогу)

Заболевание Пол Возраст Всего
муж жен до 15 лет 15 - 18 лет старше 18 лет
1. Гастрит
2. Язвенная болезнь желудка
3. Язвенная болезнь 12-перстной кишки
4. Прочие
Итого:

Комбинационная таблица
Таблица 6. Распределение студентов, имеющих заболевания системы органов пищеварения, по факультетам и полу (в % к итогу)

Заболевание Лечебный Медико-профилактический Фармацевтический Всего
м ж оба пола м ж оба пола м ж оба пола м ж оба пола
1. Гастрит
2. Язвенная болезнь желудка
3. Язвенная болезнь 12-ти перстной кишки
4. Прочие
Итого:

План исследования

Объект исследования - студент медицинского вуза, обучающиеся в данном медицинском вузе на данном факультете.
Объем статистической совокупности: достаточное число наблюдений. Совокупность: выборочная, репрезентативная по качеству и количеству.
Сроки проведения исследования: 6 февраля - 6 июня текущего года.
Методы сбора материала: анкетирование, выкопировка из медицинских документов студенческой поликлиники.

  1. Власов В.В. Эпидемиология. - М.: ГЭОТАР-МЕД, 2004. - 464 с.
  2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. - М.: ГЭОТАР-МЕД, 2007. - 512 с.
  3. Медик В.А., Юрьев В.К. Курс лекций по общественному здоровью и здравоохранению: Часть 1. Общественное здоровье. - М.: Медицина, 2003. - 368 с.
  4. Миняев В.А., Вишняков Н.И. и др. Социальная медицина и организация здравоохранения (Руководство в 2 томах). - СПб, 1998. -528 с.
  5. Кучеренко В.З., Агарков Н.М. и др.Социальная гигиена и организация здравоохранения (Учебное пособие) - Москва, 2000. - 432 с.
  6. С. Гланц. Медико-биологическая статистика. Пер с англ. - М., Практика, 1998. - 459 с.

2.1 Схема проведения статистического исследования

Системы статистического анализа данных – это современный эффективный инструмент статистического исследования. Широкие возможности для обработки статистических данных имеют специальные системы статистического анализа, а также универсальные средства – Excel, Matlab, Mathcad и др..

Но даже самый совершенный инструмент не может заменить исследователя, который должен сформулировать цель исследования, провести сбор данных, выбрать методы, подходы, модели и средства проведения обработки и анализа данных, а также интерпретировать полученные результаты.

На рисунке 2.1 представлена схема проведения статистического исследования.

Рис.2.1 - Принципиальная схема статистического исследования

Исходным пунктом статистического исследования является формулировка проблемы. При ее определении учитывается цель исследования, определяется, какая информация необходима и как она будет использоваться при принятии решения.

Само статистическое исследование начинается с подготовительного этапа. В ходе подготовительного этапа аналитики изучают техническое задание – документ, составляемый заказчиком исследования. В техническом задании должны быть четко сформулированы цели исследования:

    определен объект исследования;

    перечислены предположения и гипотезы, которые в ходе исследования должны быть подтверждены или опровергнуты;

    описано то, как будут использоваться результаты исследования;

    сроки, в которые исследование должно быть проведено и бюджет исследования.

На основе технического задания разрабатывается структура аналитического отчета - то, в каком виде должны быть представлены результаты исследования, а также программа статистического наблюдения . Программа представляет собой перечень признаков, подлежащих регистрации в процессе наблюдения (или вопросов на которые должны быть получены достоверные ответы по каждой обследуемой единице наблюдения). Содержание программы определяется как особенностями наблюдаемого объекта и целями исследования, так и методами, выбранными аналитиками для дальнейшей обработки собранной информации.

Основной этап статистического исследования включает сбор необходимых данных и их анализ.

Финальным этапом исследования является составление аналитического отчета и предоставление его заказчику.

На рис. 2.2 представлена схема статистического анализа данных.

Рис.2.2 – Основные этапы статистического анализа

2.2 Сбор статистической информации

Сбор материалов подразумевает анализ технического задания исследования, определение источников необходимой информации и (при необходимости) разработку анкет. При исследовании источников информации все требуемые данные разделяют на первичные (данные, которых нет в наличии и которые должны быть собраны непосредственно для данного исследования), и вторичные (собранные ранее для иных целей).

Сбор вторичных данных часто называют "кабинетным" или "библиотечным" исследованием.

Примеры сбора первичных данных: наблюдения за посетителями магазина, анкетирование пациентов больницы, обсуждение проблемы на совещании.

Вторичные данные делят на внутренние и внешние.

Примеры источников внутренних вторичных данных:

    информационная система организации (включающая в себя бухгалтерскую подсистему, подсистему управления продажами, CRM (CRM-система, сокращение от англ. Customer Relationship Management) - прикладное программное обеспечение для организаций, предназначенное для автоматизации стратегий взаимодействия с заказчиками) и другие);

    ранее проведенные исследования;

    письменные отчеты сотрудников.

Примеры источников внешних вторичных данных:

    отчеты органов статистики и других государственных учреждений;

    отчеты маркетинговых агентств, профессиональных ассоциаций и т.п.;

    электронные базы данных (адресные справочники, ГИС и т.п.);

    библиотеки;

    средства массовой информации.

Основными выходными данными на этапе сбора данных являются:

    планируемый объем выборки;

    структура выборки (наличие и размер квот);

    вид статистического наблюдения (сбор данных опрос, анкетирование, измерение, эксперимент, экспертиза, др.);

    информация о параметрах опроса (например, возможность факта фальсификации анкет);

    схема кодировки переменных в базе данных программы, выбранной для обработки;

    план-схема преобразования данных;

    план-схема используемых статистических процедур.

Этот же этап включает непосредственно процедуру анкетирования. Разумеется, анкеты разрабатываются только для получения первичной информации.

Полученные данные должны быть соответствующим образом отредактированы и подготовлены. Каждая анкета или форма наблюдения проверяется и, если нужно, корректируется. Каждому ответу присваиваются числовые или буквенные коды – производится кодировка информации. Подготовка данных включает в себя редактирование, расшифровку и проверку данных, их кодирование и необходимые преобразования.

2.3 Определение характеристик выборки

Как правило, данные, собранные в результате статистического наблюдения для проведения статистического анализа являются выборочной совокупностью. Последовательность преобразования данных в процесс статистического исследования можно схематично представить следующим образом (рис. 2.3)

Рис 2.3 Схема преобразования статистических данных

Анализируя выборку, можно делать выводы о генеральной совокупности, представленной выборкой.

Окончательное определение общих параметров выборки производят, когда все анкеты собраны. Оно включает:

    определение реального количества респондентов,

    определение структуры выборки,

    распределение по месту опроса,

    установление доверительного уровня статистической надежности выборки,

    расчет статистической ошибки и определение репрезентативности выборки.

Реальное количество респондентов может оказаться большим либо меньшим запланированного. Первый вариант лучше для анализа, но невыгоден заказчику исследования. Второй может отрицательно сказаться на качестве исследования, а, следовательно, невыгоден ни аналитикам, ни заказчикам.

Структура выборки может быть случайной или неслучайной (респонденты отбирались на основе заранее известного критерия, например методом квотирования). Случайные выборки априори являются репрезентативными. Неслучайные выборки могут быть намерено нерепрезентативными относительно генеральной совокупности, но давать важную информацию для исследований. В этом случае также следует внимательно отнестись к фильтрационным вопросам анкеты, которые предназначены специально для отсеивания неподходящих под требования респондентов.

Для определения точности оценивания , прежде всего, необходимо установить уровень доверительной вероятности (95% или 99%). Тогда максимальная статистическая ошибка выборки рассчитывается как

или
,

где - объем выборки,- вероятность наступления исследуемого события (попадание респондента в выборку),- вероятность обратного события (непопадания респондента в выборку),- коэффициент доверительной вероятности,
- дисперсия признака.

В таблице 2.4 приведены наиболее употребляемые значения доверительной вероятности и коэффициентов доверительной вероятности.

Таблица 2.4

2.5 Обработка данных на компьютере

Анализ данных с применением компьютера включает выполнение ряда необходимых шагов.

1. Определение структуры исходных данных.

2. Ввод данных в компьютер в соответствии с их структурой и требованиями программы. Редактирование и преобразование данных.

3. Задание метода обработки данных в соответствии с задачами исследования.

4. Получение результата обработки данных. Его редактирование и сохранение в нужном формате.

5. Интерпретация результата обработки.

Шаги 1 (подготовительный) и 5 (заключительный) не способна выполнить ни одна компьютерная программа - их исследователь делает сам. Шаги 2-4 выполняются исследователем с использованием программы, но именно исследователь определяет необходимые процедуры редактирования и преобразования данных, методы обработки данных, а также формат представления результатов обработки. Помощь компьютера (шаги 2–4) заключается, в конечном итоге, в переходе от длинной последовательности чисел к более компактной. На «вход» компьютера исследователь подает массив исходных данных, который недоступен осмыслению, но пригоден для компьютерной обработки (шаг 2). Затем исследователь дает программе команду на обработку данных в соответствии с поставленной задачей и структурой данных (шаг 3). На «выходе» он получает результат обработки (шаг 4) - тоже массив данных, только уже меньший, доступный осмыслению и содержательной интерпретации. При этом исчерпывающий анализ данных обычно требует многократной их обработки с применением разных методов.

2.6 Выбор стратегии анализа данных

Выбор стратегии анализа собранных данных основывается на знании теоретических и практических аспектов исследуемой предметной области, специфики и известных характеристик информации, свойств конкретных статистических методов, а также на опыте и взглядах исследователя.

Необходимо помнить, что анализ данных - это вовсе не конечная цель исследования. Его цель - получить информацию, которая поможет решить определенную проблему и принять адекватные управленческие решения. Выбор стратегии анализа должен начинаться с исследования итогов предыдущих этапов процесса: определение проблемы и разработка плана исследования. В качестве "черновика" используется предварительный план анализа данных, разработанный как один из элементов плана исследования. Затем, в ходе поступления на последующих стадиях процесса исследования дополнительной информации, может понадобиться внесение определенных изменений.

Статистические методы делятся на одно- и многомерные. Одномерные методы(univariatetechniques) используются тогда, когда все элементы выборки оцениваются одним показателем, либо если этих показателей несколько для каждого элемента, но каждая переменная анализируется при этом отдельно ото всех остальных.

Многомерные методы (multivariate techniques) прекрасно подходят для анализа данных, если для оценки каждого элемента выборки используется два или больше показателей и эти переменные анализируются одновременно. Такие методы применяются для определения зависимостей между явлениями.

Многомерные методы отличаются от одномерных прежде всего тем, что при их использовании центр внимания смещается с уровней (средних показателей) и распределений (дисперсий) явлений и сосредотачивается на степени взаимосвязи (корреляции или ковариации) между этими явлениями.

Одномерные методы можно классифицировать на основе того, какие данные анализируются: метрические или неметрические (рис. 3). Метрические данные (metric data) измеряются по интервальной шкале или относительной шкале. Неметрические данные (nonmetric data) оцениваются по номинальной или порядковой шкале

Кроме того, эти методы делят на классы на основе того, сколько выборок - одна, две или более - анализируется в ходе исследований.

Классификация одномерных статистических методов представлена на рис.2.4.

Рис. 2.4 Классификация одномерных статистических методов в зависимости от анализируемых данных

Число выборок определяется тем, как ведется работа с данными для конкретного анализа, а не тем, каким способом собирались данные. Например, данные по лицам мужского и женского пола можно получить в пределах одной выборки, но если их анализ нацелен на выявление разницы в восприятии, основанной на разнице полов, исследователю придется оперировать двумя разными выборками. Выборки считаются независимыми, если они экспериментально не связаны между собой. Измерения, проведенные в одной выборке, не оказывают влияния на значения переменных в другой. Для анализа данные, относящиеся к разным группам респондентов, например собранные от лиц женского и мужского пола, обычно обрабатываются как независимые выборки.

С другой стороны, если данные по двум выборкам относятся к одной и той же группе респондентов, выборки считаются объединенными в пары - зависимыми.

Если существует только одна выборка метрических данных, может использоваться z- и t-критерий. Если же независимых выборок две или больше, в первом случае можно воспользоваться z- и t-критерием для двух выборок, в во втором - методом однофакторного дисперсионного анализа. Для двух связанных выборок используется парный t-критерий. Если речь идет о неметрических данных по одной выборке, исследователь может воспользоваться критериями частотного распределения, хи-квадратом, критерием Колмогорова-Смирнова (K~S), критерием серий и биномиальным критерием. Для двух независимых выборок с неметрическими данными можно прибегнуть к следующим методам анализа: хи-квадрат, Манна-Уитни, медианы, К-С, однофакторным дисперсионным анализом Крускала-Уоллиса (ДА К-У). В отличие от этого, если существует две или больше взаимосвязанных выборок, следует воспользоваться критериями знаков, Мак-Немара и Уилкоксона.

Многомерные статистические методы нацелены на выявление существующих закономерностей: взаимозависимости переменных, взаимосвязи или последовательности событий, межобъектного сходства.

Достаточно условно можно выделить пять стандартных типов закономерностей, исследование которых представляет существенный интерес: ассоциация, последовательность, классификация, кластеризация и прогнозирование

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в супермаркете, может показать, что 65% купивших кукурузные чипсы берут также и "кока-колу", а при наличии скидки за такой комплект "колу" приобретают в 85% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации выделяют различные однородные группы данных.

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в виде временных рядов. Если удается построить найти закономерности, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем.

Многомерные статистические методы можно разделить на методы анализа взаимосвязи и классификационный анализ (рис. 2.5).

Рис.2.5 – Классификация многомерных статистических методов