Меню
Бесплатно
Главная  /  Термины   /  Многофакторный анализ. Факторный анализ выручки в Excel — это просто! Факторный анализ: общая характеристика и способы проведения

Многофакторный анализ. Факторный анализ выручки в Excel — это просто! Факторный анализ: общая характеристика и способы проведения

Одним из основных инструментов экономических исследований является факторный анализ, представляющий собой раздел многомерного статистического анализа, объединяющего методы оценки размерности множества наблюдаемых переменных посредством исследования структуры ковариационных или корреляционных матриц. В отличие от других методов анализа, он позволяет аналитикам решить две основные задачи: компактно и всесторонне описать предмет измерения и выявить отвечающие за наличие линейных статистических корреляционных связей между наблюдаемыми переменными факторы.

Оправданно применяя метод главных компонентов, предназначенных для замены коррелированных факторов некоррелированными, а также ограничиваясь исследованием наиболее существенных информативных факторов и исключая остальные из анализа, упростив тем самым интерпретацию результатов, факторный анализ предстает как методика комплексного и системного исследования зависимости остальных факторов от величины критериального результативного показателя.

Основными типами факторного анализа являются: детерминированный, функциональный (результативный критериальный показатель, представляющий собой произведение частных или алгебраическую сумму факторов); стохастический, корреляционный (при наличии между результативным и факторными показателями неполной или вероятностной связи); прямой, дедуктивный (от общего к частному); обратный, индуктивный (от частного к общему); статический и динамический; ретроспективный и перспективный; одноступенчатый и многоступенчатый.

Факторный анализ начинают с проверки его обязательных условий, согласно которым: все признаки являются количественными; число признаков в два раза превышает число переменных; выборка однородна; распределение исходных переменных носит симметричный характер; изучение факторов осуществляется по коррелирующим переменным. Факторный анализ проводится в несколько этапов: отбор факторов; классификация и систематизация факторов; моделирование взаимосвязей между результативными и факторными показателями; расчет влияния факторов и оценка роли каждого из них в изменении величины результативного показателя; практическое использование факторной модели (подсчет резервов прироста результативного показателя). По характеру взаимосвязи между показателями различают методы детерминированного и стохастического факторного анализа (табл. 1.5).

Методы факторного анализа

Таблица 1.5

Методы

Краткая характеристика

Детерминированный факторный анализ

Детерминированный факторный анализ - это методика влияния факторов, функционально связанных с критериальным результативным показателем, позволяющим представить критериальный показатель факторной модели как частное, произведение или алгебраическую сумму переменных. Детерминированному факторному анализу свойственны следующие методы: цепных подстановок; абсолютных разниц; относительных разниц; интегральный; логарифмирования

Стохастический

Стохастический анализ - методика исследования факторов, связь с критериальным результативным показателем которых носит, в отличие от функциональной связи, неполный, вероятностный (корреляционный) характер. При корреляционной связи путем изменения аргумента в зависимости от сочетания других переменных, влияющих на величину показателя результативного показателя, можно получить ряд значений прироста функции, в то время как при функциональной (полной) зависимости изменение аргумента всегда приводит к соответствующим изменениям функции. Стохастический анализ проводится с помощью применения следующих методов факторного анализа: парной корреляции; множественного корреляционного анализа; матричной модели; математического программирования; теории игр

Статический и динамический

Статический факторный анализ практикуется в целях оценки влияния факторов на критериальные результативные показатели на конкретную дату, а динамический - для выявления динамики причинно-следственных связей

Ретроспективный и перспективный

Факторный анализ может носить как ретроспективный характер (выявлять причины изменения величины результативного показателя за прошедший период), так и перспективный (исследовать влияние факторов на значение критериального показателя в перспективе)

Для проведения экономического анализа важное значение имеет применение детерминированного моделирования и разных типов факторных детерминированных моделей, предназначенных для моделирования корреляций между критериальным результативным фактором и остальными переменными факторными показателями. Суть данного моделирования заключается в представлении взаимосвязи исследуемого показателя с факторами как конкретное математическое уравнение, выражающее функциональную или корреляционную связь.

Детерминированные факторные модели позволяют исследовать функциональную зависимость между исследуемыми показателями в случае соблюдения при построении факторной модели следующих требований: факторы, включенные в модель, должны быть реальными, а не абстрактными; факторы должны быть в причинно-следственной взаимосвязи с исследуемым результативным показателем; показатели факторной модели должны быть количественно измеримы; должна быть возможность измерения влияния отдельных факторов; вначале в факторную модель записываются количественные факторы, затем качественные; если в факторной модели присутствует несколько количественных или качественных факторов, то вначале записываются факторы более высокого порядка, а затем - более низкого.

Наибольшее распространение в факторном анализе получили следующие типы детерминированных факторных моделей (табл. 1.6).

Типы детерминированных факторных моделей

Таблица 1.6

Факторные

модели

Краткая характеристика

Аддитивные

Используются, если критериальный результативный показатель представлен в виде алгебраической суммы ряда факторных параметров показателей:

Разработанная факторная модель может быть подвергнута дополнительным преобразованиям при возникновении углубления проводимого исследования, с использованием в этих целях ряда способов и приемов. Оттого, насколько реально и точно разработанные модели отражают взаимосвязь между исследуемыми показателями, зависят конечные результаты экономического анализа бизнеса организации. Моделирование аддитивных факторных систем предполагает осуществление последовательного разложения факторов исходной факторной системы на составные переменные:

у = a + b.

Так, факторы первого уровня а и b зависят, в свою очередь, от ряда других факторов:

a = с + d, b = е + m,

y = c + d + e + m.

Факторные

модели

Краткая характеристика

Мультипликативные модели

Применяются в тех случаях, когда критериальный результативный показатель выражается в виде произведения ряда факторных показателей:

Суть моделирования мультипликативных факторных систем кроется в детальном последовательном разложении комплексных факторов исходной факторной системы на факторы-сомножители:

у = Я X Ь.

Величина факторов первого уровня а и Ь, в свою очередь, зависят от ряда других факторов:

a = с х, b = е х т,

y=cxd*exm

Кратные модели

Если критериальный результативный показатель можно определить как отношение одного факторного показателя к другому, то

Различают следующие способы преобразования факторных кратных моделей:

1) удлинение (преобразовывает числитель, заменяя один фактор или ряд факторов на сумму однородных показателей):

2) формальное разложение (удлиняет знаменатель, заменяя один или ряд факторов на сумму или произведение однородных показателей):

3) расширение (преобразовывает исходную факторную модель, умножая числитель и знаменатель соотношения на один показатель или несколько новых показателей):

Критериальные результативные показатели можно разложить на факторы различными способами и представить как различные типы детерминированных моделей факторов. Способ моделирования выбирают в зависимости от объекта исследования и поставленных целей, а также от профессиональных знаний и навыков аналитика.

Большинство способов оценки факторов в моделях детерминации основаны на элиминировании, наиболее универсальным методом в котором являются цепные подстановки, используемые для того, чтобы измерить влияние факторов во всех типах моделей факторной детерминации: мультипликативных, аддитивных, кратных и смешанных (комбинированных). Благодаря данному способу можно оценить как отдельные факторы оказывают влияние на величину критериального результативного показателя, постепенно заменяя базисную величину каждого фактора показателя в составе критериального показателя на фактическую величину в отчетном периоде. Для этого исчисляют ряд условных значений критериального результативного показателя, учитывающих последовательное изменение одного, двух и более факторов, при неизменном значении остальных. Сравнительная оценка изменения величины критериального параметра до и после изменения уровня того или иного фактора позволяет исключать (элиминировать) влияние всех факторов, за исключением того, воздействие которого на прирост результативного показателя определяется.

Влияние того или иного показателя оценивается благодаря последовательному вычитанию: из второго расчета первого, из третьего - второго и т.д. В первом расчете все величины являются плановыми, в последнем - фактическими. Например, алгоритм расчета при трехфакторной мультипликативной модели выглядит следующим образом:

В алгебраическом виде сумма влияния факторов равноценна общему приросту критериального результативного показателя:

При несоблюдении указанного равенства аналитику следует искать ошибки в произведенных им расчетах. Исходя из этого, разработано правило, согласно которому следует, что число расчетов на единицу больше числа показателей приведенного уравнения.

При использовании метода цепных подстановок предполагается обеспечение соблюдения строгой последовательности подстановки, ибо ее произвольное изменение чревато искажением результатов анализа. В процессе аналитических процедур целесообразно выявить влияние в первую очередь количественных показателей, затем - качественных. Например, требуется оценить влияние численности работников и производительности труда на объем производства промышленной продукции. Для этого сначала оценивается влияние количественного показателя (численности работников), а затем - качественного показателя (производительности труда).

Метод цепной подстановки обладает существенным недостатком, так как при его использовании следует считать, что величины факторов меняются независимо друг от друга. Хотя в действительности они изменяются одновременно и во взаимосвязи, что влечет за собой дополнительный прирост результативного показателя, как правило, присоединяемый к последнему из исследуемых факторов. Таким образом, величина влияния факторов на изменение результативного показателя зависит от месторасположения того или иного фактора в схеме аналитической модели. Этим объясняется разница в расчетах при изменении последовательности подстановки. Таким образом, степень влияния факторов на изменение критериального показателя колеблется в зависимости от места фактора в модели детерминации. Этот недостаток детерминированного факторного анализа устраняется благодаря использованию более сложного интегрального метода, позволяющего оценить влияние факторов в мультипликативных, кратных и смешанных моделях кратно-аддитивного вида.

Способ абсолютных разниц - это модификация способа цепной подстановки, в котором изменение критериального показателя за счет каждого фактора способом абсолютных разниц определяется как произведение отклонения изучаемого фактора на базисное или отчетное значение другого фактора в зависимости от выбранной последовательности подстановки:

Способ относительных разниц предназначен для оценки влияния факторов на прирост критериального показателя в мультипликативных и смешанных моделях вида:

Он предполагает нахождение относительного отклонения каждого факторного показателя и определение направления и размера влияния факторов в процентах путем последовательного вычитания (из первого - всегда 100%).

При применении способа сокращенных подстановок показатели для расчета представляют собой промежуточные произведения с последовательным накоплением влияющих факторов. Производятся подстановки, а затем путем последовательного вычитания находятся размеры влияния факторов.

Интегральный метод позволяет достигнуть полного разложения результативного показателя по факторам и носит универсальный характер, т.е. применим к мультипликативным, кратным и смешанным моделям. Изменение критериального показателя измеряется на бесконечно малых отрезках времени, путем суммирования приращения результата, определяемого как частные произведения, умноженные на приращения факторов на бесконечно малых промежутках.

Применение интегрального метода обеспечивает более высокую точность расчетов влияния факторов по сравнению со способами цепной подстановки, абсолютных и относительных разниц, позволяя устранить неоднозначную оценку влияния, ибо в данном случае результаты не зависят от местоположения факторов в модели, а дополнительный прирост результативного показателя, возникающий из-за взаимодействия факторов, распределяется между ними равномерно.

Для распределения дополнительного прироста недостаточно взять его часть, соответствующую количеству факторов, так как факторы могут действовать в разных направлениях. Поэтому изменение результативного показателя измеряется на бесконечно малых отрезках времени путем суммирования приращения результата, определяемого как частные произведения, умноженные на приращения факторов на бесконечно малых промежутках. Операция вычисления определенного интеграла сводится к построению подынтегральных выражений, зависящих от вида функции или модели факторной системы.

В связи со сложностью вычисления некоторых определенных интегралов и дополнительных трудностей, связанных с возможным действием факторов в противоположных направлениях, на практике используются специально сформированные рабочие формулы:

1. Модель вида

2. Модель вида

3. Модель вида

4. Модель вида

К основным приемам элиминирования, которые опираются на относительные показатели динамики, пространственных сравнений, выполнения плана (оцениваемых отношением фактического уровня исследуемого показателя со сравниваемым), относится индексный метод.

Индексные модели позволяют построить количественную оценку роли отдельных факторов в тенденциях динамики изменений обобщающих показателей в статистике, планировании и экономическом анализе. Расчет любого индекса предполагает сопоставление соизмеряемой величины с базисной. Если индекс отражается в виде соотношения непосредственно соизмеряемых величин, то его называют индивидуальным, а если индекс представляет соотношения сложных явлений, то групповым, или тотальным. Различают несколько форм индексов (агрегатные, арифметические, гармонические).

Основу любой формы общего индекса составляет агрегатный индекс, позволяющий оценить степень влияния различных факторов на изменение уровня критериальных показателей в мультипликативных и кратных моделях. На корректность определения размера каждого фактора влияют: количество знаков после запятой (не менее четырех); количество самих факторов (связь обратно пропорциональна).

Принципами построения агрегатных индексов являются: изменение одного фактора при неизменном значении всех остальных. При этом если обобщающий экономический показатель представляет собой произведение количественного (объемного) и качественного показателей факторов, то при определении влияния количественного фактора качественный показатель фиксируется на базисном уровне, а при определении влияния качественного фактора количественный показатель фиксируется на уровне отчетного периода.

Допустим, что Y - а * b * с х d,

а;

Факторный индекс, показывающий, как изменяется показатель b и т.д.;

Так называемый «общий индекс изменений в результирующем показателе» в зависимости от всех факторов.

При этом

С помощью индексного метода можно разложить по факторам не только относительные, но и абсолютные отклонения обобщающего показателя, определяя при этом влияние отдельных факторов с помощью разности между числителем и знаменателем соответствующих индексов, т.е. при расчете влияния одного фактора элиминируя влияние другого:

С помощью индексного метода факторного анализа можно разложить по факторам не только относительные, но и абсолютные отклонения в обобщающем показателе. Другими словами, влияние отдельного фактора можно определить при помощи разности между числителем и знаменателем соответствующих индексов, т.е. при расчете влияния одного фактора элиминируя влияние другого.

Допустим:

где а - количественный фактор, а b - качественный,

показателя за счет фактора а ;

Абсолютный прирост результирующего

показателя за счет фактора Ь

- абсолютный прирост результирующего

показателя за счет влияния всех факторов.

Рассмотренный принцип разложения абсолютного прироста обобщающего показателя по факторам целесообразно применять, если число факторов равно двум (один из них количественный, другой - качественный), а анализируемый показатель представлен как их произведение, так как теория индексов не дает общего метода разложения абсолютных отклонений обобщающего показателя по факторам при числе факторов более двух. Для решения этой задачи используется метод цепных подстановок.

Методы факторного анализа успешно применяются в целях объективной оценки влияния факторов на критериальный показатель деятельности организации. В качестве одного из примеров такого подхода рассмотрим, каким образом изменения в объеме реализации продукции оказывают влияние на финансовые результаты деятельности организации. Как правило, изменение выручки от реализации происходит вследствие: 1) изменения объема реализации (в натуральном выражении); 2) изменения отпускных цен. Общее изменение выручки от реализации может быть представлено в виде суммы факторных отклонений:

где N x - выручка отчетного года;

N 0 - выручка базисного года;

А N - изменение выручки в результате изменения объема реализации;

AN p - изменение выручки в результате изменения отпускных цен на продукцию;

AN c - изменение выручки в результате изменения структуры реализации продукции.

Представим выручку (N) как произведение цены реализации (Р) на объем реализации (Q ):

N 0 = Р 0 х Q 0 - выручка базисного года;

jV, = Р, х (2, - выручка отчетного года.

Оценка влияния изменения объема реализации продукции (при неизменных ценах) на изменение выручки производится следующим образом:

Оценка влияния изменения цены реализации (при неизменном объеме) на изменение выручки осуществляется следующим образом:

В процессе анализа определяется влияние такого фактора, как изменение структуры реализации, а также удельный вес отдельных ассортиментных позиций в общем объеме реализации в базисном и анализируемом периодах, а затем рассчитывается влияние структурных сдвигов на общий объем реализации. Недополученная выручка в результате изменения ассортимента реализованной продукции оценивается отрицательно, а сверхплановая выручка - положительно.

Для того, чтобы эффективно управлять продажами, необходимо правильно оценивать факторы, которые оказывают влияние на выручку. В сети можно найти множество примеров факторного анализа выручки в Excel. Однако большинство из них написаны для того, чтобы показать методологические аспекты и не имеют большой практической пользы.

Цель данной статьи — показать, как разработать факторную модель выручки в соответствии с потребностями бизнеса. На практике такая модель может быть достаточно сложной, и для того, чтобы не тратить время на выполнение факторного анализа в Excel, мы будем использовать надстройку Fincontrollex® Variances Analysis Tool , которая позволяет полностью автоматизировать этот процесс. Благодаря такому подходу мы сможем сфокусироваться на анализе данных, а не на разработке формул в Excel.

Как разработать факторную модель выручки

Вы продаете продукт, который имеет цену. Для того чтобы рассчитать выручку, нужно умножить количество (или объём) проданных продуктов, на их цену:

Это базовая модель расчета выручки. Все остальные модели являются её производными и детализируют фактор объёма, цены, или выделяют влияние других факторов по заданному условию. Окончательный вид формулы будет зависеть от бизнес-процесса продаж, которым необходимо управлять. Давайте рассмотрим наиболее распространённые из них.

Если вы продаете несколько видов продуктов по разной цене, то вы можете управлять ассортиментом продаж. Для этого следует разделить фактор объёма на общий объём реализации всех продуктов и удельный вес каждого продукта в общем объеме:

На практике менеджеры по продажам часто не понимают суть этого фактора, что приводит к неправильному пониманию результатов анализа. Этот фактор следует трактовать как изменение структуры объёмов продаж в сторону продуктов с большей или меньшей ценой. Например, если фактор ассортимента оказал положительное влияние, это означает, что в структуре продаж увеличилась доля продуктов с более высокой ценой, а доля продуктов с более низкой ценой сократилась. Если фактор ассортимента оказал отрицательное влияние — то картина будет противоположной: рост доли продуктов с более низкой ценой и сокращение доли продуктов с более высокой ценой. Не стоит путать влияние этого фактора с изменением цены, так как при расчете фактора ассортимента влияние других факторов элиминируется (исключаются).

Если ваша компания использует различные способы поставки своих продуктов на рынок (каналы продаж), то для того, чтобы оценить влияние структуры каналов продаж нужно добавить удельный вес каждого канала в формулу расчета выручки. Например, факторная модель выручки по сетям и розничным торговым точкам может иметь вид:

Горизонтальный и вертикальный рост

В сетевой торговой структуре часто возникает необходимость оценить изменение объёмов за счет открытия новых точек или изменения объема продаж в уже существующих точках. Провести такую оценку можно с помощью выделения факторов горизонтального и вертикального изменения объёмов продаж.

Горизонтальные изменение — это изменения объемов продаж за счет открытия новых точек.

Вертикальные изменение — это изменения объёмов продаж в уже существующих точках.

Для того, чтобы выделить эти изменения, в модель расчета выручки необходимо добавить следующие условия. Если в текущем месяце произошла продажа в торговой точке, в которой до этого продукция не продавалась — это горизонтальные изменения. Если же продукт уже продавался в точке, то речь идет о вертикальном изменении.

Ввод новых продуктов

Если в ассортимент вводиться новый продукт, то целесообразно оценить влияние этого решения на общую выручку. Для этого необходимо исключить влияние продукта из всех факторов и выделить выручку по этому продукту в отдельный фактор.

Для этого во все факторы модели необходимо добавить условие проверки, является ли продукт новым. Продукт считается новым, если в предыдущем периоде он не продавался.

Выделить выручку по новому продукту в отдельный фактор можно с помощью следующего условия:

В результате вы получите факторы, очищенные от влияния новых продуктов, и отдельную сумму выручки по новым продуктам. Это позволит точно оценить увеличение выручки из-за ввода новых продуктов.

Вывод продуктов из ассортимента

Оценка эффекта от вывода продуктов из ассортимента проводится аналогично оценке эффекта от ввода новых продуктов, с той лишь разницей, что из факторов исключается влияние выведенного продукта. Продукт считается выведенным если в предыдущем периоде он продавался, а в текущем нет.

Выделить выручку по выведенному продукту в отдельный фактор можно с помощью следующего условия:

В результате вы сможете оценить снижение выручки за счёт вывода продуктов из ассортимента.

Оценивая одновременно ввод новых и вывод старых продуктов, вы сможете оценить эффективность изменения ассортимента.

Управление конверсией

Если вы работаете в розничном бизнесе, то наверняка знаете, что не все посетители магазина совершают покупку. Для того, чтобы оценить какой процент посетителей осуществляет покупку, необходимо рассчитать коэффициент конверсии:

Коэффициент конверсии зависит от эффективности работы персонала, который закрывает продажи. Если вы хотите его оценить в стоимостном выражении, то вам следует добавить его в факторную модель. Для расчета коэффициента конверсии используется количество покупателей, поэтому для того, чтобы выделить этот фактор в факторной модели выручки, необходимо добавить показатель, который свяжет цену с количество покупателей. Например, размер среднего чека.

Управление размером среднего чека

Предлагая сопутствующие продукты, можно увеличить общий объём продаж. Для того, чтобы оценить эффективность этого процесса, необходимо рассчитать размер среднего чека:

Размер среднего чека, как и коэффициент конверсии, зависит от эффективности работы персонала, который закрывает продажи. Поэтому если вы хотите оценить эффективность этих показателей, то вам следует добавить их в факторную модель.

Для того, чтобы стимулировать продажи, вы можете предоставлять скидки. Размер скидки может зависеть от различных условий: объёмов продаж, условий оплаты и т.д. Для того, чтобы оценить влияние скидки на выручку, необходимо добавить этот фактор в модель:

При анализе скидки стоит не забывать про основную цель предоставления скидки — увеличение объёма продаж. Поэтому фактор скидки необходимо оценивать совместно с фактором объёма.

Если вы являетесь производителем продукции, то у вас есть возможность стимулировать интенсивность продаж своих товаров в розничных сетях с помощью ретро-бонусов. Ретро-бонус — это вознаграждение выплачиваемое дистрибьюторам и дилерам за продвижение продукции. Для оценки эффективности стимулирования продаж с помощью ретро-бонусов обычно рассчитывается процент ретро-бонусов к выручке (без учета скидок). Для того, чтобы оценить влияние ретро-бонусов на выручку, необходимо добавить этот фактор в модель:

Собираем все вместе: факторная модель выручки производителя FMCG

В качестве примера, давайте рассмотрим факторную модель выручки производителя FMCG. Для производителей FMCG характерно продавать свою продукцию с помощью каналов дистрибуции, предоставляя дополнительные скидки за объём. Чтобы отразить эту особенность, добавим в базовую модель расчета выручки формулы для управления ассортиментом, скидками и ретро-бонусами, которые мы рассмотрели выше.

Наша факторная модель содержит пять факторов: общий объём реализации, ассортимент, цена, скидка и ретро-бонус. Очередность расчета факторов зависит от степени контроля предприятием над этими показателями (от большего к меньшему). Поэтому мы рассчитаем их в следующей последовательности:

  1. Общий объём
  2. Ассортимент
  3. Ретро-бонус
  4. Скидка

Факторная модель готова, и теперь можно перейти к факторному анализу в Excel.

Факторный анализ выручки в Excel — это просто!

Выполнение факторного анализа в Excel достаточно трудоемкая задача даже для опытного пользователя. Поэтому чтобы её существенно упростить мы будем использовать специальную надстройку для Excel . Для активации бесплатной пробной версии вам понадобится своей электронной почты, на который придет сообщение с ключом активации и ссылкой для скачивания.

Эта надстройка избавит вас от необходимости вводить формулы расчета каждого фактора в книге Excel, самостоятельно создаст сводный отчет по всем факторам и детальный отчет по продуктам, а также, если вы используете Excel 2016 или Office 365, построит диаграмму waterfall (если вы не знакомы с этой диаграммой, то обязательно прочтите статью т.к. эта диаграмма является превосходным способом показать результаты факторного анализа).

В этой статье мы не будем останавливаться на всех возможностях этой надстройки, т.к. вы самостоятельно можете посмотреть видео обзор ниже или ознакомиться со , а сразу же перейдем к настройке факторной модели.

В качестве исходных данных используем условные данные из отчета о реализации продукции за январь и февраль. Скачать архив с примером вы можете по этой ссылке.


Для того, чтобы запустить надстройку на ленте Excel перейдите на вкладку сайт и в группе Variances Analysis Tool нажмите кнопку Выполнить . Откроется окно надстройки.


Введем название модели



Следующим шагом необходимо ввести математическую формулу факторной модели. Для этого в поле формулы введем нашу факторную модель и нажмем кнопку Enter .


Надстройка автоматически определит название всех факторов и заполнит ими первый столбец таблицы настройки факторов. Нам остается настроить параметры этих факторов.


Теперь настроим порядок расчета факторов. Расчета факторов осуществляется в порядке их следования в таблице: первым будет рассчитан фактор, который находиться вверху таблицы, а последним тот, который находиться внизу таблицы. С помощь перетаскивания факторов в первом столбце необходимо настроить порядок расчета, который мы определили в предыдущем разделе. Для этого щёлкнем левой кнопкой мыши на названии фактора в первом столбце и не отпуская кнопку мыши перетащим фактор в необходимую строку и отпустим кнопку. В результате у нас должна получиться последовательность как на картинке ниже.


У нас остался ненастроенным последний параметр: диапазон с названиями продуктов. Давайте его настроим. На ленте Fincontrollex® Variances Analysis Tool на вкладке Главная в группе Модель нажмите кнопку Диапазон названий .


Все готово и теперь можно выполнить факторный анализ. Для этого на ленте Fincontrollex® Variances Analysis Tool на вкладке Главная в группе Анализ нажмите кнопку Выполнить . Через пару секунд вы получите результат факторного анализа, который будет создан в новой книге Excel.


По результатам факторного анализа можно сделать вывод о том, что рост общего объёма реализации в феврале по сравнению с январем был достигнут за счет снижения базовых цен и изменения ассортимента продаж в сторону продукции с более низкой ценой. Для того, чтобы разобраться по каким продуктам произошли основные изменения, можно дополнительно проанализировать лист "Подробно" в отчете.

Заключение

Мы рассмотрели базовую модель выручки и основные формулы по приведению её в соответствие с потребностями бизнеса. Эти формулы приведены в качестве примера и могут служить отправной точкой для разработки факторной модели выручки в соответствии с вашими целями и задачами. Использование надстройки Fincontrollex® Variances Analysis Tool для факторного анализа позволяет выполнить анализ моделей любой сложности. Благодаря этому вы сможете сфокусироваться на управлении факторами, которые оказывают влияние на выручку в вашем бизнесе.

Статья допускается к свободной публикации только при условии неизменности содержания и ссылки на первоисточник. Использование изображений вне этой статьи не допускается и является нарушением авторских прав.

Все процессы, происходящие в бизнесе, взаимосвязаны. Между ними прослеживается как прямая, так и косвенная связь. Различные экономические параметры изменяются под действием различных факторов. Факторный анализ (ФА) позволяет выявить эти показатели, проанализировать их, изучить степень влияния.

Понятие факторного анализа

Факторный анализ – это многомерная методика, позволяющая изучить взаимосвязи между параметрами переменных. В процессе происходит исследование строения ковариационных или корреляционных матриц. Факторный анализ используется в самых различных науках: психометрике, психологии, экономике. Основы этого метода были разработаны психологом Ф. Гальтоном.

Задачи проведения

Для получения достоверных результатов лицу требуется сравнить показатели по нескольким шкалам. В процессе определяется корреляция полученных значений, их сходство и различия. Рассмотрим базовые задачи факторного анализа:

  • Обнаружение существующих значений.
  • Подбор параметров для полноценного анализа значений.
  • Классификация показателей для системной работы.
  • Обнаружение взаимосвязей между результативными и факторными значениями.
  • Определение степени влияния каждого из факторов.
  • Анализ роли каждого из значений.
  • Применение факторной модели.

Исследован должен быть каждый параметр, который влияет на итоговое значение.

Методики факторного анализа

Методы ФА могут использоваться как в совокупности, так и раздельно.

Детерминированный анализ

Детерминированный анализ используется наиболее часто. Связано это с тем, что он достаточно прост. Позволяет выявить логику воздействия основных факторов компании, проанализировать их влияние в количественных значениях. В результате ДА можно понять, какие факторы следует изменить для улучшения эффективности работы компании. Преимущества метода: универсальность, легкость использования.

Стохастический анализ

Стохастический анализ позволяет проанализировать существующие косвенные связи. То есть происходит исследование опосредованных факторов. Метод используется в том случае, если невозможно найти прямые связи. Стохастический анализ считается дополнительным. Он используется только в некоторых случаях.

Что понимается под косвенными связями? При прямой связи при изменении аргумента изменятся и значение фактора. Косвенная связь предполагает изменение аргумента с последующим изменением сразу нескольких показателей. Метод считается вспомогательным. Связано это с тем, что специалисты рекомендуют изучать в первую очередь прямые связи. Они позволяют составить более объективную картину.

Этапы и особенности факторного анализа

Анализ по каждому фактору дает объективные результаты. Однако применяется он крайне редко. Связано это с тем, что в процессе выполняются сложнейшие вычисления. Для их проведения потребуется специальное программное обеспечение.

Рассмотрим этапы ФА:

  1. Установление цели проведения расчетов.
  2. Отбор значений, которые непосредственно или косвенно влияют на конечный результат.
  3. Классификации факторов для комплексного исследования.
  4. Обнаружение зависимости между выбранными параметрами и конечным показателем.
  5. Моделирование взаимных связей между результатом и факторами, влияющими на него.
  6. Определение степени воздействия значений и оценка роли каждого из параметров.
  7. Использование образованной факторной таблицы в деятельности предприятия.

К СВЕДЕНИЮ! Факторный анализ предполагает сложнейшие вычисления. Поэтому лучше доверить его проведение профессионалу.

ВАЖНО! Крайне важно при проведении расчетов правильно отобрать факторы, которые влияют на результат деятельности предприятия. Отбор факторов зависит от определенной сферы.

Факторный анализ рентабельности

ФА рентабельности проводится для анализа рациональности распределения ресурсов. В результате можно определить, какие факторы наибольшим образом влияют на конечный результат. В результате можно оставить только те факторы, которые наилучшим образом воздействуют на эффективность. На основании полученных данных можно изменить ценовую политику компании. На себестоимость продукции могут влиять следующие факторы:

  • постоянные издержки;
  • переменные издержки;
  • прибыль.

Уменьшение издержек провоцирует повышение прибыли. При этом себестоимость не изменяется. Можно сделать вывод о том, что на прибыльность влияют имеющиеся издержки, а также объем проданной продукции. Факторный анализ позволяет определить степень влияния этих параметров. Когда имеет смысл его проводить? Основной повод к проведению – уменьшение или повышение прибыльности.

Факторный анализ проводится посредством следующей формулы:

Rв= ((Вт-СБ -КРБ-УРБ)/ Вт) - (ВБ-СБ-КРБ-УРБ)/ВБ, где:

ВТ – выручка за нынешний период;

СБ – себестоимость за нынешний период;

КРБ – коммерческие траты за нынешний период;

УРБ – управленческие траты за предшествующий период;

ВБ – выручка за предшествующий период;

КРБ – коммерческие траты за предшествующий период.

Иные формулы

Рассмотрим формулу расчета степени воздействия себестоимости на прибыльность:

Rс= ((Вт-СБот -КРБ-УРБ)/ Вт) - (Вт-СБ-КРБ-УРБ)/Вт ,

СБот – это себестоимость продукции за нынешний период.

Формула для расчета влияния управленческих трат:

Rур= ((Вт-СБ -КРБ-УРот)/ Вт) - (Вт-СБ-КРБ-УРБ)/Вт ,

УРот – это управленческие траты.

Формула для вычисления степени воздействия коммерческих издержек:

Rк= ((Вт-СБ -КРо-УРБ)/ Вт) - (Вт-СБ-КРБ-УРБ)/Вт ,

КРо – это коммерческие траты за предыдущее время.

Совокупное воздействие всех факторов высчитывается по следующей формуле:

Rоб=Rв+Rс+Rур+Rк.

ВАЖНО! При расчетах имеет смысл высчитывать влияние каждого фактора в отдельности. Результаты общего ФА имеют небольшую ценность.

Пример

Рассмотрим показатели организации за два месяца (за два периода, в рублях). В июле доход организации составил 10 тысяч, себестоимость продукции – 5 тысяч, административные траты – 2 тысячи, коммерческие траты – 1 тысяча. В августе доход компании составил 12 тысяч, себестоимость продукции – 5,5 тысяч, административные траты – 1,5 тысячи, коммерческие траты – 1 тысяча. Проводятся следующие расчеты:

R=((12 тысяч-5,5 тысяч-1 тысяча-2 тысячи)/12 тысяч)-((10 тысяч- 5,5 тысяч-1 тысяча-2 тысячи)/10 тысяч)=0,29-0,15=0,14

Из этих расчетов можно сделать вывод о том, что прибыль организации повысилась на 14%.

Факторный анализ прибыли

Р = РР+ РФ + РВН, где:

Р –прибыль или убыток;

РР – прибыль от реализации;

РФ – результаты финансовой деятельности;

РВН – сальдо доходов и расходов от внереализационных действий.

Затем нужно определить результат от продажи товаров:

РР = N – S1 –S2, где:

N – выручка от продажи товаров по отпускным ценам;

S1 – себестоимость проданной продукции;

S2 – коммерческие и управленческие траты.

Ключевым фактором при расчете прибыли является оборот компании по продаже компании.

К СВЕДЕНИЮ! Факторный анализ крайне сложно проводить вручную. Для него можно использовать специальные программы. Самая простая программа для расчетов и автоматического анализа – Microsoft Excel. В ней есть инструменты для анализа.

Свои способности человек может узнать, только попытавшись приложить их. (Сенека)

Дисперсионный анализ

Вводный обзор

В этом разделе мы рассмотрим основные методы, предположения и терминологию дисперсионного анализа.

Отметим, что в англоязычной литературе дисперсионный анализ обычно называется анализом вариации. Поэтому, для краткости, ниже мы иногда будем использовать термин ANOVA (An alysis o f va riation ) для обычного дисперсионного анализа и термин MANOVA для многомерного дисперсионного анализа. В этом разделе мы последовательно рассмотрим основные идеи дисперсионного анализа (ANOVA ), ковариационного анализа (ANCOVA ), многомерного дисперсионного анализа (MANOVA ) и многомерного ковариационного анализа (MANCOVA ). После краткого обсуждения достоинств анализа контрастов и апостериорных критериев рассмотрим предположения, на которых основаны методы дисперсионного анализа. Ближе к концу этого раздела поясняются преимущества многомерного подхода для анализа повторных измерений по сравнению с традиционным одномерным подходом.

Основные идеи

Цель дисперсионного анализа. Основной целью дисперсионного анализа является исследование значимости различия между средними. Глава (глава 8) содержит краткое введение в исследование статистической значимости. Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t - критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или t - критерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений). Если вы не достаточно знакомы с этими критериями, рекомендуем обратиться к вводному обзору главы (глава 9).

Откуда произошло название Дисперсионный анализ ? Может показаться странным, что процедура сравнения средних называется дисперсионным анализом. В действительности, это связано с тем, что при исследовании статистической значимости различия между средними, мы на самом деле анализируем дисперсии.

Разбиение суммы квадратов

Для выборки объема n выборочная дисперсия вычисляется как сумма квадратов отклонений от выборочного среднего, деленная на n-1 (объем выборки минус единица). Таким образом, при фиксированном объеме выборки n дисперсия есть функция суммы квадратов (отклонений), обозначаемая, для краткости, SS (от английского Sum of Squares – Сумма Квадратов). В основе дисперсионного анализа лежит разделение (или разбиение) дисперсии на части. Рассмотрим следующий набор данных:

Средние двух групп существенно различны (2 и 6 соответственно). Сумма квадратов отклонений внутри каждой группы равна 2. Складывая их, получаем 4. Если теперь повторить эти вычисления без учета групповой принадлежности, то есть, если вычислить SS исходя из общего среднего этих двух выборок, то получим 28. Иными словами, дисперсия (сумма квадратов), основанная на внутригрупповой изменчивости, приводит к гораздо меньшим значениям, чем при вычислении на основе общей изменчивости (относительно общего среднего). Причина этого, очевидно, заключается в существенной разнице между средними значениями, и это различие между средними и объясняет существующее различии между суммами квадратов. В самом деле, если использовать для анализа приведенных данных модуль Дисперсионный анализ , будут получены следующие результаты:

Как видно из таблицы, общая сумма квадратов SS =28 разбита на сумму квадратов, обусловленную внутригрупповой изменчивостью (2+2=4 ; см. вторую строку таблицы) и сумму квадратов, обусловленную различием средних значений. (28-(2+2)=24; см первую строку таблицы).

SS ошибок и SS эффекта. Внутригрупповая изменчивость (SS ) обычно называется дисперсией ошибки. Это означает, что обычно при проведении эксперимента она не может быть предсказана или объяснена. С другой стороны, SS эффекта (или межгрупповую изменчивость) можно объяснить различием между средними значениями в изучаемых группах. Иными словами, принадлежность к некоторой группе объясняет межгрупповую изменчивость, т.к. нам известно, что эти группы обладают разными средними значениями.

Проверка значимости. Основные идеи проверки статистической значимости обсуждаются в главе Элементарные понятия статистики (глава 8). В этой же главе объясняются причины, по которым многие критерии используют отношение объясненной и необъясненной дисперсии. Примером такого использования является сам дисперсионный анализ. Проверка значимости в дисперсионном анализе основана на сравнении дисперсии, обусловленной межгрупповым разбросом (называемой средним квадратом эффекта или MS эффект ) и дисперсии, обусловленной внутригрупповым разбросом (называемой средним квадратом ошибки или MS ошибка ). Если верна нулевая гипотеза (равенство средних в двух популяциях), то можно ожидать сравнительно небольшое различие в выборочных средних из-за случайной изменчивости. Поэтому при нулевой гипотезе внутригрупповая дисперсия будет практически совпадать с общей дисперсией, подсчитанной без учета группой принадлежности. Полученные внутригрупповые дисперсии можно сравнить с помощью F - критерия, проверяющего, действительно ли отношение дисперсий значимо больше 1. В рассмотренном выше примере F - критерий показывает, что различие между средними статистически значимо.

Основная логика дисперсионного анализа. Подводя итоги, можно сказать, что целью дисперсионного анализа является проверка статистической значимости разницы между средними (для групп или переменных). Эта проверка проводится с помощью анализа дисперсии, т.е. с помощью разбиения общей дисперсии (вариации) на части, одна из которых обусловлена случайной ошибкой (то есть внутригрупповой изменчивостью), а вторая связана с различием средних значений. Последняя компонента дисперсии затем используется для анализа статистической значимости различия между средними значениями. Если это различие значимо, нулевая гипотеза отвергается и принимается альтернативная гипотеза о существовании различия между средними.

Зависимые и независимые переменные. Переменные, значения которых определяется с помощью измерений в ходе эксперимента (например, балл, набранный при тестировании), называются зависимыми переменными. Переменные, которыми можно управлять при проведении эксперимента (например, методы обучения или другие критерии, позволяющие разделить наблюдения на группы) называются факторами или независимыми переменными. Более подробно эти понятия описаны в главе Элементарные понятия статистики (глава 8).

Многофакторный дисперсионный анализ

В рассмотренном выше простом примере вы могли бы сразу вычислить t-критерий для независимых выборок, используя соответствующую опцию модуля Основные статистики и таблицы. Полученные результаты, естественно, совпадут с результатами дисперсионного анализа. Однако дисперсионный анализ содержит гибкие и мощные технические средства, которые могут быть использованы для гораздо более сложных исследований.

Множество факторов. Мир по своей природе сложен и многомерен. Ситуации, когда некоторое явление полностью описывается одной переменной, чрезвычайно редки. Например, если мы пытаемся научиться выращивать большие помидоры, следует рассматривать факторы, связанные с генетической структурой растений, типом почвы, освещенностью, температурой и т.д. Таким образом, при проведении типичного эксперимента приходится иметь дело с большим количеством факторов. Основная причина, по которой использование дисперсионного анализа предпочтительнее повторного сравнения двух выборок при разных уровнях факторов с помощью t - критерия, заключается в том, что дисперсионный анализ более эффективен и, для малых выборок, более информативен.

Управление факторами. Предположим, что в рассмотренном выше примере анализа двух выборок мы добавим еще один фактор, например, Пол - Gender . Пусть каждая группа состоит из 3 мужчин и 3 женщин. План этого эксперимента можно представить в виде таблицы 2 на 2:

Эксперимент. Группа 1 Эксперимент. Группа 2
Мужчины 2 6
3 7
1 5
Среднее 2 6
Женщины 4 8
5 9
3 7
Среднее 4 8

До проведения вычислений, можно заметить, что в этом примере общая дисперсия имеет, по крайней мере, три источника:

(1) случайная ошибка (внутригрупповая дисперсия),

(2) изменчивость, связанная с принадлежностью к экспериментальной группе, и

(3) изменчивость, обусловленная полом объектов наблюдения.

(Отметим, что существует еще один возможный источник изменчивости – взаимодействие факторов , который мы обсудим позднее). Что произойдет, если мы не будем включать пол gender как фактор при проведении анализа и вычислим обычный t -критерий? Если мы будем вычислять суммы квадратов, игнорируя пол – gender (т.е., объединяя объекты разного пола в одну группу при вычислении внутригрупповой дисперсии, получив при этом сумму квадратов для каждой группы равную SS =10, и общую сумму квадратов SS = 10+10 = 20), то получим большее значение внутригрупповой дисперсии, чем при более точном анализе с дополнительным разбиением на подгруппы по полу - gender (при этом внутригрупповые средние будут равны 2, а общая внутригрупповая сумма квадратов равна SS = 2+2+2+2 = 8). Это различие связано с тем, что среднее значение для мужчин - males меньше, чем среднее значение для женщин – female , и это различие в средних значениях увеличивает суммарную внутригрупповую изменчивость, если фактор пола не учитывается. Управление дисперсией ошибки увеличивает чувствительность (мощность) критерия.

На этом примере видно еще одно преимущество дисперсионного анализа по сравнению с обычным t -критерием для двух выборок. Дисперсионный анализ позволяет изучать каждый фактор, управляя значениями остальных факторов. Это, в действительности, и является основной причиной его большей статистической мощности (для получения значимых результатов требуются меньшие объемы выборок). По этой причине дисперсионный анализ даже на небольших выборках дает статистически более значимые результаты, чем простой t - критерий.

Эффекты взаимодействия

Существует еще одно преимущество применения дисперсионного анализа по сравнению с обычным t - критерием: дисперсионный анализ позволяет обнаружить взаимодействие между факторами и, следовательно, позволяет изучать более сложные модели. Для иллюстрации рассмотрим еще один пример.

Главные эффекты, попарные (двухфакторные) взаимодействия. Предположим, что имеется две группы студентов, причем психологически студенты первой группы настроены на выполнение поставленных задач и более целеустремленны, чем студенты второй группы, состоящей из более ленивых студентов. Разобьем каждую группу случайным образом пополам и предложим одной половине в каждой группе сложное задание, а другой - легкое. После этого измерим, насколько напряженно студенты работают над этими заданиями. Средние значения для этого (вымышленного) исследования показаны в таблице:

Какой вывод можно сделать из этих результатов? Можно ли заключить, что: (1) над сложным заданием студенты трудятся более напряженно; (2) целеустремленные студенты работают упорнее, чем ленивые? Ни одно из этих утверждений не отражает сущность систематического характера средних, приведенных в таблице. Анализируя результаты, правильнее было бы сказать, что над сложными заданиями работают упорнее только целеустремленные студенты, в то время как над легкими заданиями только ленивые работают упорнее. Другими словами характер студентов и сложность задания взаимодействуя между собой влияют на затрачиваемое усилие. Это пример парного взаимодействия между характером студентов и сложностью задания. Отметим, что утверждения 1 и 2 описывают главные эффекты .

Взаимодействия высших порядков. В то время как объяснить попарные взаимодействия еще сравнительно легко, взаимодействия высших порядков объяснить значительно сложнее. Представим себе, что в рассматриваемый выше пример, введен еще один фактор пол -Gender и мы получили следующую таблицу средних значений:

Какие теперь выводы можно сделать из полученных результатов? Графики средних позволяют легко интерпретировать сложные эффекты. Модуль дисперсионного анализа позволяет строить эти графики практически одним щелчком мышки.

Изображение на графиках внизу представляет собой изучаемое трехфакторное взаимодействие.

Глядя на графики, можно сказать, что у женщин существует взаимодействие между характером и сложностью теста: целеустремленные женщины работают над трудным заданием более напряженно, чем над легким. У мужчин это же взаимодействие носит обратный характер. Видно, что описание взаимодействия между факторами становится более запутанным.

Общий способ описания взаимодействий. В общем случае взаимодействие между факторами описывается в виде изменения одного эффекта под воздействием другого. В рассмотренном выше примере двухфакторное взаимодействие можно описать как изменение главного эффекта фактора, характеризующего сложность задачи, под воздействием фактора, описывающего характер студента. Для взаимодействия трех факторов из предыдущего параграфа можно сказать, что взаимодействие двух факторов (сложности задачи и характера студента) изменяется под воздействием пола Gender . Если изучается взаимодействие четырех факторов, можно сказать, что взаимодействие трех факторов, изменяется под воздействием четвертого фактора, т.е. существуют различные типы взаимодействий на разных уровнях четвертого фактора. Оказалось, что во многих областях взаимодействие пяти или даже большего количества факторов не является чем-то необычным.

Сложные планы

Межгрупповые и внутригрупповые планы (планы с повторными измерениями)

При сравнении двух различных групп обычно используется t - критерий для независимых выборок (из модуля Основные статистики и таблицы ). Когда сравниваются две переменные на одном и том же множестве объектов (наблюдений), используется t -критерий для зависимых выборок. Для дисперсионного анализа также важно зависимы или нет выборки. Если имеются повторные измерения одних и тех же переменных (при разных условиях или в разное время) для одних и тех же объектов , то говорят о наличии фактора повторных измерений (называемого также внутригрупповым фактором, поскольку для оценки его значимости вычисляется внутригрупповая сумма квадратов). Если сравниваются разные группы объектов (например, мужчины и женщины, три штамма бактерий и т.п.), то разница между группами описывается межгрупповым фактором. Способы вычисления критериев значимости для двух описанных типов факторов различны, но общая их логика и интерпретации совпадает.

Меж- и внутригрупповые планы. Во многих случаях эксперимент требует включение в план и межгруппового фактора, и фактора повторных измерений. Например, измеряются математические навыки студентов женского и мужского пола (где пол – Gender -межгрупповой фактор) в начале и в конце семестра. Два измерения навыковкаждого студента образуют внутригрупповой фактор (фактор повторных измерений). Интерпретация главных эффектов и взаимодействий для межгрупповых факторов и факторов повторных измерений совпадает, и оба типа факторов могут, очевидно, взаимодействовать между собой (например, женщины приобретают навыки в течение семестра, а мужчины их теряют).

Неполные (гнездовые) планы

Во многих случаях можно пренебречь эффектом взаимодействия. Это происходит или когда известно, что в популяции эффект взаимодействия отсутствует, или когда осуществление полного факторного плана невозможно. Например, изучается влияние четырех добавок к топливу на расход горючего. Выбираются четыре автомобиля и четыре водителя. Полный факторный эксперимент требует, чтобы каждая комбинация: добавка, водитель, автомобиль - появились хотя бы один раз. Для этого нужно не менее 4 x 4 x 4 = 64 групп испытаний, что требует слишком больших временных затрат. Кроме того, вряд ли существует взаимодействие между водителем и добавкой к топливу. Принимая это во внимание, можно использовать план Латинские квадраты, в котором содержится лишь16 групп испытаний (четыре добавки обозначаются буквами A, B, C и D):

Латинские квадраты описаны в большинстве книг по планированию экспериментов (например, Hays, 1988; Lindman, 1974; Milliken and Johnson, 1984; Winer, 1962), и здесь они не будут детально обсуждаться. Отметим, что латинские квадраты это не n олные планы, в которых участвуют не все комбинации уровней факторов. Например, водитель 1 управляет автомобилем 1 только с добавкой А, водитель 3 управляет автомобилем 1 только с добавкой С. Уровни фактора добавок (A, B, C и D) вложены в ячейки таблицы автомобиль x водитель – как яйца в гнезда. Это мнемоническое правило полезно для понимания природы гнездовых или вложенных планов. Модуль Дисперсионный анализ предоставляет простые способы анализ планов такого типа.

Ковариационный анализ

Основная идея

В разделе Основные идеи кратко обсуждалась идея управления факторами и то, каким образом включение аддитивных факторов позволяет уменьшать сумму квадратов ошибок и увеличивать статистическую мощность плана. Все это может быть распространено и на переменные с непрерывным множеством значений. Когда такие непрерывные переменные включаются в план в качестве факторов, они называются ковариатами .

Фиксированные ковариаты

Предположим, что сравниваются математические навыки двух групп студентов, которые обучались по двум различным учебникам. Предположим также, что имеются данные о коэффициенте интеллекта (IQ) для каждого студента. Можно предположить, что коэффициент интеллекта связан с математическими навыками, и использовать эту информацию. Для каждой из двух групп студентов можно вычислить коэффициент корреляции между IQ и математическими навыками. Используя этот коэффициент корреляции, можно выделить долю дисперсии в группах, объясняемую влиянием IQ и необъясняемую долю дисперсии (см. также Элементарные понятия статистики (глава 8) и Основные статистики и таблицы (глава 9)). Оставшаяся доля дисперсии используется при проведении анализа как дисперсия ошибки. Если имеется корреляция между IQ и математическими навыками, то можно существенно уменьшить дисперсии ошибки SS /(n -1) .

Влияние ковариат на F- критерий. F- критерий оценивает статистическую значимость различия средних значений в группах, при этом вычисляется отношение межгрупповой дисперсии (MS effect ) к дисперсии ошибок (MS error ) . Если MS error уменьшается, например, при учете фактора IQ, значение F увеличивается.

Множество ковариат. Рассуждения, использованные выше для одной ковариаты (IQ), легко распространяются на несколько ковариат. Например, кроме IQ, можно включить измерение мотивации, пространственного мышления и т.д. Вместо обычного коэффициента корреляции при этом используется множественный коэффициент корреляции.

Когда значение F -критерия уменьшается. Иногда введение ковариат в план эксперимента уменьшает значение F -критерия. Обычно это указывает на то, что ковариаты коррелированы не только с зависимой переменной (например, математическими навыками), но и с факторами (например, с разными учебниками). Предположим, что IQ измеряется в конце семестра, после почти годового обучения двух групп студентов по двум разным учебникам. Хотя студенты разбивались на группы случайным образом, может оказаться, что различие учебников настолько велико, что и IQ и математические навыки в разных группах будут сильно различаться. В этом случае, ковариаты не только уменьшают дисперсию ошибок, но и межгрупповую дисперсию. Другими словами, после контроля за разностью IQ в разных группах, разность в математических навыках уже будет несущественной. Можно сказать иначе. После “исключения” влияния IQ, неумышленно исключается и влияние учебника на развитие математических навыков.

Скорректированные средние. Когда ковариата влияет на межгрупповой фактор, следует вычислять скорректированные средние , т.е. такие средние, которые получаются после удаления всех оценок ковариат.

Взаимодействие между ковариатами и факторами. Также как исследуется взаимодействие между факторами, можно исследовать взаимодействие между ковариатами и между группами факторов. Предположим, что один из учебников особенно подходит для умных студентов. Второй учебник для умных студентов скушен, а для менее умных студентов этот же учебник труден. В результате имеется положительная корреляция между IQ и результатом обучения в первой группе (более умные студенты, лучше результат) и нулевая или небольшая отрицательная корреляция во второй группе (чем умнее студент, тем менее вероятно приобретение математических навыков из второго учебника). В некоторых исследованиях эта ситуация обсуждается как пример нарушения предположений ковариационного анализа. Однако так как в модуле Дисперсионный анализ используются самые общие способы ковариационного анализа, можно, в частности, оценить статистическую значимость взаимодействия между факторами и ковариатами.

Переменные ковариаты

В то время как фиксированные ковариаты обсуждаются в учебниках достаточно часто, переменные ковариаты упоминаются намного реже. Обычно, при проведении экспериментов с повторными измерениями, нас интересуют различия в измерениях одних и тех же величин в разные моменты времени. А именно, нас интересует значимость этих различий. Если одновременно с измерениями зависимых переменных проводится измерение ковариат, можно вычислить корреляцию между ковариатой и зависимой переменной.

Например, можно изучать интерес к математике и математические навыки в начале и в конце семестра. Интересно было бы проверить, коррелированы ли между собой изменения в интересе к математике с изменением математических навыков.

Модуль Дисперсионный анализ в STATISTICA автоматически оценивает статистическую значимость изменения ковариат в тех планах, где это возможно.

Многомерные планы: многомерный дисперсионный и ковариационный анализ

Межгрупповые планы

Все рассматриваемые ранее примеры включали только одну зависимую переменную. Когда одновременно имеется несколько зависимых переменных, возрастает лишь сложность вычислений, а содержание и основные принципы не меняются.

Например, проводится исследование двух различных учебников. При этом изучаются успехи студентов в изучении физики и математики. В этом случае имеются две зависимые переменные и нужно выяснить, как влияют на них одновременно два разных учебника. Для этого можно воспользоваться многомерным дисперсионным анализом (MANOVA). Вместо одномерного F критерия, используется многомерный F критерий (l-критерий Уилкса), основанный на сравнении ковариационной матрицы ошибок и межгрупповой ковариационной матрицы.

Если зависимые переменные коррелированы между собой, то эта корреляция должна учитываться при вычислении критерия значимости. Очевидно, если одно и то же измерение повторяется дважды, то ничего нового получить при этом нельзя. Если к имеющемуся измерению добавляется коррелированное с ним измерение, то получается некоторая новая информация, но при этом новая переменная содержит избыточную информацию, которая отражается в ковариации между переменными.

Интерпретация результатов. Если общий многомерный критерий значим, можно заключить, что соответствующий эффект (например, тип учебника) значим. Однако встают следующие вопросы. Влияет ли тип учебника на улучшение только математических навыков, только физических навыков, или одновременно на улучшение тех и других навыков. В действительности, после получения значимого многомерного критерия, для отдельного главного эффекта или взаимодействия исследуется одномерный F критерий. Другими словами, отдельно исследуются зависимые переменные, которые вносят вклад в значимость многомерного критерия.

Планы с повторными измерениями

Если измеряются математические и физические навыки студентов в начале семестра и в конце, то это и есть повторные измерения. Изучение критерия значимости в таких планах это логическое развитие одномерного случая. Заметим, что методы многомерного дисперсионного анализа обычно также используются для исследования значимости одномерных факторов повторных измерений, имеющих более чем два уровня. Соответствующие применения будут рассмотрены позднее в этой части.

Суммирование значений переменных и многомерный дисперсионный анализ

Даже опытные пользователи одномерного и многомерного дисперсионного анализа часто приходят в затруднение, получая разные результаты при применении многомерного дисперсионного анализа, например, для трех переменных, и при применении одномерного дисперсионного анализа к сумме этих трех переменных, как к одной переменной.

Идея суммирования переменных состоит в том, что каждая переменная содержит в себе некоторую истинную переменную, которая и исследуется, а также случайную ошибку измерения. Поэтому при усреднении значений переменных, ошибка измерения будет ближе к 0 для всех измерений и усредненное значений будет более надежным. На самом деле, в этом случае применение дисперсионного анализа к сумме переменных разумно и является мощным методом. Однако если зависимые переменные по своей природе многомерны, суммирование значений переменных неуместно.

Например, пусть зависимые переменные состоят из четырех показателей успеха в обществе . Каждый показатель характеризует совершенно независимую сторону человеческой деятельности (например, профессиональный успех, преуспеваемость в бизнесе, семейное благополучие и т.д.). Сложение этих переменных подобно сложению яблока и апельсина. Сумма этих переменных не будет подходящим одномерным показателем. Поэтому с такими данными нужно обходится как с многомерными показателями в многомерном дисперсионном анализе .

Анализ контрастов и апостериорные критерии

Почему сравниваются отдельные множества средних?

Обычно гипотезы относительно экспериментальных данных формулируются не просто в терминах главных эффектов или взаимодействий. Примером может служить такая гипотеза: некоторый учебник повышает математические навыки только у студентов мужского пола, в то время как другой учебник примерно одинаково эффективен для обоих полов, но все же менее эффективен для мужчин. Можно предсказать, что эффективность учебника взаимодействует с полом студента. Однако этот прогноз касается также природы взаимодействия. Ожидается значительное различие между полами для обучающихся по одной книге и практически не зависимые от пола результаты для обучающихся по другой книге. Такой тип гипотез обычно исследуется с помощью анализа контрастов.

Анализ контрастов

Если говорить коротко, то анализ контрастов позволяет оценивать статистическую значимость некоторых линейных комбинаций эффектов сложного плана. Анализ контрастов главный и обязательный элемент любого сложного плана дисперсионного анализа. Модуль Дисперсионный анализ имеет достаточно разнообразные возможности анализа контрастов, которые позволяют выделять и анализировать любые типы сравнений средних.

Апостериорные сравнения

Иногда в результате обработки эксперимента обнаруживается неожиданный эффект. Хотя в большинстве случаев творческий исследователь сможет объяснить любой результат, это не дает возможностей для дальнейшего анализа и получения оценок для прогноза. Эта проблема является одной из тех, для которых используются апостериорные критерии , то есть критерии, не использующие априорные гипотезы. Для иллюстрации рассмотрим следующий эксперимент. Предположим, что на 100 карточках записаны числа от 1 до 10. Опустив все эти карточки в шапку, мы случайным образом выбираем 20 раз по 5 карточек, и вычисляем для каждой выборки среднее значение (среднее чисел, записанных на карточки). Можно ли ожидать, что найдутся две выборки, у которых средние значения значимо отличаются? Это очень правдоподобно! Выбирая две выборки с максимальным и минимальным средним, можно получить разность средних, сильно отличающуюся от разности средних, например, первых двух выборок. Эту разность можно исследовать, например, с помощью анализа контрастов. Если не вдаваться в детали, то существует несколько, так называемых апостериорных критериев, которые основаны в точности на первом сценарии (взятие экстремальных средних из 20 выборок), т. е. эти критерии основаны на выборе наиболее отличающихся средних для сравнения всехсредних значений в плане. Эти критерии применяются для того, чтобы чисто случайно не получить искусственный эффект, например, обнаружить значимое различие между средними, когда его нет. Модуль Дисперсионный анализ предлагает широкий выбор таких критериев. Когда в эксперименте, связанном с несколькими группами, встречаются неожиданные результаты, то используются апостериорные процедуры для исследования статистической значимости полученных результатов.

Сумма квадратов типа I, II, III и IV

Многомерная регрессия и дисперсионный анализ

Существует тесная взаимосвязь между методом многомерной регрессии и дисперсионным анализом (анализом вариаций). И в том и в другом методе исследуется линейная модель. Если говорить коротко, то практически все планы эксперимента можно исследовать с помощью многомерной регрессии. Рассмотрим следующий простой межгрупповой 2 x 2 план.

DV A B AxB
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Столбцы А и В содержат коды, характеризующие уровни факторов А и В, столбец АxВ содержит произведение двух столбцов А и В. Мы можем анализировать эти данные с помощью многомерной регрессии. Переменная DV определяется как зависимая переменная, переменные от A до AxB как независимые переменные. Исследование значимости для коэффициентов регрессии будет совпадать с вычислениями в дисперсионном анализе значимости главных эффектов факторов A и B и эффекта взаимодействия AxB .

Несбалансированные и сбалансированные планы

При вычислении корреляционной матрицы для всех переменных, например, для данных, изображенных выше, можно заметить, что главные эффекты факторов A и B и эффект взаимодействия AxB некоррелированы. Это свойство эффектов называют также ортогональностью. Говорят, что эффекты A и B - ортогональны или независимы друг от друга. Если все эффекты в плане ортогональны друг другу, как в приведенном выше примере, то говорят, что план сбалансирован .

Сбалансированные планы обладают “хорошим свойством”. Вычисления при анализе таких планов очень просты. Все вычисления сводятся к вычислению корреляции между эффектами и зависимыми переменными. Так как эффекты ортогональны, частные корреляции (как в полной многомерной регрессии) не вычисляются. Однако в реальной жизни планы не всегда сбалансированы.

Рассмотрим реальные данные с неравным числом наблюдений в ячейках.

Фактор A Фактор B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Если закодировать эти данные как выше и вычислить корреляционную матрицу для всех переменных, то окажется, что факторы плана коррелированы друг с другом. Факторы в плане теперь не ортогональны и такие планы называются несбалансированными. Заметим, что в рассматриваемом примере, корреляция между факторами полностью связана с различием частот 1 и -1 в столбцах матрицы данных. Другими словами, планы экспериментов с неравными объемами ячеек (точнее, непропорциональными объемами) будут несбалансированными, это означает, что главные эффекты и взаимодействия будут смешиваться. В этом случае для вычисления статистической значимости эффектов нужно полностью вычислять многомерную регрессию. Здесь имеется несколько стратегий.

Сумма квадратов типа I, II, III и IV

Сумма квадратов типа I и III . Для изучения значимости каждого фактора в многомерной модели можно вычислять частную корреляцию каждого фактора, при условии, что все другие факторы уже учтены в модели. Можно также вводить факторы в модель пошаговым способом, фиксируя все факторы, уже введенные в модель и игнорируя все остальные факторы. Вообще, в этом и состоит различие между типом III и типом I суммы квадратов (эта терминология была введена в SAS, см. например, SAS, 1982; подробное обсуждение можно также найти в Searle, 1987, стр. 461; Woodward, Bonett, and Brecht, 1990, стр. 216; или Milliken and Johnson, 1984, стр. 138).

Сумма квадратов типа II. Следующая “промежуточная” стратегия формирования модели состоит: в контроле всех главных эффектов при исследовании значимости отдельного главного эффекта; в контроле всех главных эффектов и всех попарных взаимодействий, когда исследуется значимость отдельного попарного взаимодействия; в контроле всех главных эффектов всех попарных взаимодействий и всех взаимодействий трех факторов; при исследовании отдельного взаимодействия трех факторов и т.д. Суммы квадратов для эффектов, вычисляемые таким способом, называются типом II суммы квадратов. Итак, тип II суммы квадратов контролирует все эффекты того же порядка и ниже, игнорируя все эффекты более высокого порядка.

Сумма квадратов типа IV . Наконец, для некоторых специальных планов с пропущенными ячейками (неполными планами) можно вычислять, так называемые, типа IV суммы квадратов. Этот метод будет обсуждаться позднее в связи с неполными планами (планами с пропущенными ячейками).

Интерпретация гипотезы о сумме квадратов типа I, II, и III

Сумму квадратов типа III легче всего интерпретировать. Напомним, что суммы квадратов типа III исследуют эффекты после контроля всех других эффектов. Например, после нахождения статистически значимого типа III эффекта для фактора A в модуле Дисперсионный анализ , можно сказать, что существует единственный значимый эффект фактора A , после введения всех других эффектов (факторов) и соответственно интерпретировать этот эффект. Вероятно в 99% всех приложений дисперсионного анализа именно этот тип критерия интересует исследователя. Этот тип суммы квадратов обычно вычисляется в модуле Дисперсионный анализ по умолчанию, независимо от того выбрана опция Регрессионный подход или нет (стандартные подходы принятые в модуле Дисперсионный анализ обсуждаются ниже).

Значимые эффекты, полученные с помощью сумм квадратов типа или типа II суммы квадратов интерпретировать не так легко. Лучше всего их интерпретировать в контексте пошаговой многомерной регрессии. Если при использовании суммы квадратов типа I главный эффект фактора В оказался значим (после включения в модель фактора А, но перед добавлением взаимодействия между А и В), можно заключить, что существует значимый главный эффект фактора В, при условии, что нет взаимодействия между факторами А и В. (Если при использовании критерия типа III , фактор В также оказался значимым, то можно заключить, что существует значимый главный эффект фактора B, после введения в модель всех других факторов и их взаимодействий).

В терминах маргинальных средних гипотезы типа I и типа II обычно не имеют простой интерпретации. В этих случаях говорят, что нельзя интерпретировать значимость эффектов, рассматривая только маргинальные средние. Скорее представленные p значений средних имеют отношение к сложной гипотезе, которая комбинирует средние и объем выборки. Например, тип II гипотезы для фактора А в простом примере плана 2 x 2, рассматриваемом ранее будут (см. Woodward, Bonett, and Brecht, 1990, стр. 219):

nij - число наблюдений в ячейке

uij - среднее значение в ячейке

n . j - маргинальное среднее

Если не вдаваться в детали (более подробно см. Milliken and Johnson, 1984, глава 10), то ясно, что это не простые гипотезы и в большинстве случаев ни одна из них не представляет особенного интереса у исследователя. Однако существуют случаи, когда гипотезы типа I могут быть интересны.

Принимаемый по умолчанию вычислительный подход в модуле Дисперсионный анализ

По умолчанию, если не отмечена опция Регрессионный подход , модуль Дисперсионный анализ использует модель средних по ячейкам . Для этой модели характерно, что суммы квадратов для разных эффектов вычисляются для линейных комбинаций средних значений по ячейкам. В полном факторном эксперименте это приводит к суммам квадратов, которые совпадают с суммами квадратов, обсуждаемыми ранее как тип III . Однако в опции Спланированные сравнения (в окне Результаты дисперсионного анализа ), пользователь может проверять гипотезу относительно любой линейной комбинации взвешенных или невзвешенных средних по ячейкам. Таким образом, пользователь может проверять не только гипотезы типа III , но гипотезы любого типа (включая тип IV ). Этот общий подход особенно полезен, когда исследуются планы с пропущенными ячейками (так называемые неполные планы).

Для полных факторных планов этот подход полезно также использовать в тех случаях, когда хотят анализировать взвешенные маргинальные средние. Например, предположим, что в рассматриваемом ранее простом 2 x 2 плане, нужно сравнить взвешенные (по уровням фактора B ) маргинальные средние для фактора А. Это бывает полезным, когда распределение наблюдений по ячейкам не готовилось экспериментатором, а строилось случайно, и эта случайность отражается в распределении числа наблюдений по уровням фактора B в совокупности.

Например, имеется фактор - возраст вдов. Возможная выборка респондентов разбита на две группы: моложе 40 лет и старше 40 (фактор В). Второй фактор (фактор А) в плане - получали или нет социальную поддержку вдовы в некотором агентстве (при этом одни вдовы были выбраны случайно, другие служили в качестве контроля). В этом случае распределение вдов по возрастам в выборке отражает действительное распределение вдов по возрастам в совокупности. Оценке эффективности группы социальной поддержки вдов по всем возрастам будет соответствовать взвешенное среднее для двух возрастных групп (с весами соответствующими числу наблюдений в группе).

Спланированные сравнения

Заметим, что сумма введенных коэффициентов контрастов не обязательно равна 0 (нулю). Вместо этого программа будет автоматически вносить поправки, чтобы соответствующие гипотезы не смешивались с общим средним.

Для иллюстрации этого вернемся опять к простому 2 x 2 плану, рассмотренному ранее. Напомним, что числа наблюдений в ячейках этого несбалансированного плана -1, 2, 3, и 1. Предположим, что мы хотим сравнить взвешенные маргинальные средние для фактора А (взвешенные с частотой уровней фактора В). Можно ввести коэффициенты контраста:

Заметим, что эти коэффициенты не дают в сумме 0. Программа будет устанавливать коэффициенты так, что в сумме они будут давать 0, и при этом будут сохраняться их относительные значения, т. е.:

1/3 2/3 -3/4 -1/4

Эти контрасты будут сравнивать взвешенные средние для фактора А.

Гипотезы о главном среднем. Гипотеза, о том, что не взвешенное главное среднее равно 0 может исследоваться с помощью коэффициентов:

Гипотеза о том, что взвешенное главное среднее равно 0 проверяется с помощью:

Ни в одном случае программа не производит корректировки коэффициентов контрастов.

Анализ планов с пропущенными ячейками (неполные планы)

Факторные планы, содержащие пустые ячейки (обработка комбинаций ячеек, в которых нет наблюдений) называются неполными. В таких планах некоторые факторы обычно не ортогональны и некоторые взаимодействия не могут быть вычислены. Вообще не существует лучшего метода анализа таких планов.

Регрессионный подход

В некоторых старых программах, которые основаны на анализе планов дисперсионного анализа с помощью многомерной регрессии, факторы в неполных планах по умолчанию задаются обычным образом (как будто план полный). Затем производится многомерный регрессионный анализ для этих фиктивно закодированных факторов. К несчастью, этот метод приводит к результатам, которые очень трудно, или даже невозможно, интерпретировать, так как неясно, как каждый эффект участвует в линейной комбинации средних значений. Рассмотрим следующий простой пример.

Фактор A Фактор B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Пропущено

Если будет выполняться многомерная регрессия вида Зависимая переменная = Константа + Фактор A + Фактор B , то гипотеза о значимости факторов A и B в терминах линейных комбинаций средних выглядит так:

Фактор A: Ячейка A1,B1 = Ячейка A2,B1

Фактор B: Ячейка A1,B1 = Ячейка A1,B2

Этот случай прост. В более сложных планах невозможно фактически определить, что точно будет исследоваться.

Средние ячеек, подход дисперсионного анализа, гипотезы типа IV

Подход, который рекомендуется в литературе и который кажется предпочтительнее - исследование осмысленных (с точки зрения исследовательских задач) априорных гипотез о средних, наблюдаемых в ячейках плана. Подробное обсуждение этого подхода можно найти в Dodge (1985), Heiberger (1989), Milliken and Johnson (1984), Searle (1987), или Woodward, Bonett, and Brecht (1990). Суммы квадратов, ассоциированные с гипотезами о линейной комбинации средних в неполных планах, исследующие оценки части эффектов, называются также суммами квадратов IV .

Автоматическая генерация гипотез типа IV . Когда многофакторные планы имеют сложный характер пропущенных ячеек, желательно определить ортогональные (независимые) гипотезы, исследование которых эквивалентно исследованию главных эффектов или взаимодействий. Были развиты алгоритмические (вычислительные) стратегии (основанные на псевдообратной матрице плана) для генерирования подходящих весов для таких сравнений. К сожалению, окончательные гипотезы определяются не единственным образом. Конечно, они зависят от порядка, в котором эффекты были определены и редко допускают простую интерпретацию. Поэтому рекомендуется внимательно изучить характер пропущенных ячеек, затем формулировать гипотезы типа IV , которые наиболее содержательно соответствуют целям исследования. Затем исследовать эти гипотезы, используя опцию Спланированные сравнения в окне Результаты . Самый легкий путь задать сравнения в этом случае - требовать введения вектора контрастов для всех факторов вместе в окне Спланированные сравнения. После вызова диалогового окна Спланированные сравнения будут показаны все группы текущего плана и помечены те, которые пропущены.

Пропущенные ячейки и проверка специфического эффекта

Существует несколько типов планов, в которых расположение пропущенных ячеек не случайно, но тщательно спланировано, что позволяет проводить простой анализ главных эффектов не затрагивая другие эффекты. Например, когда необходимое число ячеек в плане недоступно, часто используются планы Латинские квадраты для оценивания главных эффектов нескольких факторов с большим числом уровней. Например, 4 x 4 x 4 x 4 факторный план требует 256 ячеек. В то же время можно использовать Греко-латинский квадрат для оценки главных эффектов, имея только 16 ячеек в плане (глава Планирование эксперимента , том IV, содержит детальное описание таких планов). Неполные планы, в которых главные эффекты (и некоторые взаимодействия) могут быть оценены с помощью простых линейных комбинаций средних, называются сбалансированными неполными планами .

В сбалансированных планах стандартный (по умолчанию) метод генерирования контрастов (весов) для главных эффектов и взаимодействий будет затем производить анализ таблицы дисперсий, в которой суммы квадратов для соответствующих эффектов не смешиваются друг с другом. Опция Специфический эффекты окна Результаты будет генерировать пропущенные контрасты, записывая ноль в пропущенные ячейки плана. Сразу после того, как будет запрошена опция Специфический эффекты для пользователя, изучающего некоторую гипотезу, появляется таблица результатов с фактическими весами. Заметим, что в сбалансированном плане, суммы квадратов соответствующих эффектов вычисляются только, если эти эффекты ортогональны (независимы) всем другим главным эффектам и взаимодействиям. В противном случае нужно воспользоваться опцией Спланированные сравнения для изучения содержательных сравнений между средними.

Пропущенные ячейки и объединенные эффекты/члены ошибки

Если опция Регрессионное подход в стартовой панели модуля Дисперсионный анализ не выбрана, то при вычислении суммы квадратов для эффектов будет использоваться модель средних по ячейкам (установка по умолчанию). Если план не сбалансирован, то при объединении неортогональных эффектов (см. выше обсуждение опции Пропущенные ячейки и специфический эффект ) можно получить сумму квадратов, состоящую из неортогональных (или перекрывающихся) компонент. Полученные при этом результаты, обычно не интерпретируемы. Поэтому нужно быть очень осторожным при выборе и реализации сложных неполных экспериментальных планов.

Существует много книг с детальным обсуждением планов разного типа. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken and Johnson, 1984; Searle, 1987; Woodward and Bonett, 1990), но такого рода информация лежит вне границ этого учебника. Тем не менее, позднее в этом разделе будет продемонстрирован анализ различного типа планов.

Предположения и эффекты нарушения предположений

Отклонение от предположения о нормальности распределений

Предположим, что зависимая переменная измерена в числовой шкале. Предположим также, что зависимая переменная имеет нормальное распределение внутри каждой группы. Дисперсионный анализ содержит широкий набор графиков и статистик для обоснования этого предположения.

Эффекты нарушения. Вообще F критерий очень устойчив к отклонению от нормальности (подробные результаты см. в работе Lindman, 1974). Если эксцесс больше 0, то значение статистики F может стать очень маленьким. Нулевая гипотеза при этом принимается, хотя она может быть и не верна. Ситуация меняется на противоположную, когда эксцесс меньше 0. Асимметрия распределения обычно незначительно влияет на F статистику. Если число наблюдений в ячейке достаточно большое, то отклонение от нормальности не имеет особого значения в силу центральной предельной теоремы , в соответствии с которой, распределение среднего значения близко к нормальному, независимо от начального распределения. Подробное обсуждение устойчивости F статистики можно найти в Box and Anderson (1955), или Lindman (1974).

Однородность дисперсии

Предположения. Предполагается, что дисперсии разных групп плана одинаковы. Это предположение называется предположением об однородности дисперсии. Вспомним, что в начале этого раздела, описывая вычисление суммы квадратов ошибок, мы производили суммирование внутри каждой группы. Если дисперсии в двух группах отличаются друг от друга, то сложение их не очень естественно и не дает оценки общей внутригрупповой дисперсии (так как в этом случае общей дисперсии вообще не существует). Модуль Дисперсионный анализ - ANOVA /MANOVA содержит большой набор статистических критериев обнаружения отклонения от предположений однородности дисперсии.

Эффекты нарушения. Линдман (Lindman 1974, стр. 33) показывает, что F критерий вполне устойчив относительно нарушения предположений однородности дисперсии (неоднородность дисперсии, см. также Box, 1954a, 1954b; Hsu, 1938).

Специальный случай: коррелированность средних и дисперсий. Бывают случаи, когда F статистика может вводить в заблуждение. Это бывает, когда в ячейках плана средние значения коррелированы с дисперсией. Модуль Дисперсионный анализ позволяет строить диаграммы рассеяния дисперсии или стандартного отклонения относительно средних для обнаружения такой корреляции. Причина, по которой такая корреляция опасна, состоит в следующем. Представим себе, что имеется 8 ячеек в плане, 7 из которых имеют почти одинаковое среднее, а в одной ячейке среднее намного больше остальных. Тогда F критерий может обнаружить статистически значимый эффект. Но предположим, что в ячейке с большим средним значением и дисперсия значительно больше остальных, т.е. среднее значение и дисперсия в ячейках зависимы (чем больше среднее, тем больше дисперсия). В этом случае большое среднее значение ненадежно, так как оно может быть вызвано большой дисперсией данных. Однако F статистика, основанная на объединенной дисперсии внутри ячеек, будет фиксировать большое среднее, хотя критерии, основанные на дисперсии в каждой ячейке, не все различия в средних будут считать значимыми.

Такой характер данных (большое среднее и большая дисперсия) - часто встречается, когда имеются резко выделяющиеся наблюдения. Одно или два резко выделяющихся наблюдений сильно смещают среднее значение и очень увеличивают дисперсию.

Однородность дисперсии и ковариаций

Предположения. В многомерных планах, с многомерными зависимыми измерениями, также применяются предположение об однородности дисперсии, описанные ранее. Однако так как существуют многомерные зависимые переменные, то требуется так же чтобы их взаимные корреляции (ковариации) были однородны по всем ячейкам плана. Модуль Дисперсионный анализ предлагает разные способы проверки этих предположений.

Эффекты нарушения . Многомерный аналог F - критерия - λ-критерий Уилкса. Не так много известно об устойчивости (робастности) λ-критерия Уилкса относительно нарушения указанных выше предположений. Тем не менее, так как интерпретация результатов модуля Дисперсионный анализ основывается обычно на значимости одномерных эффектов (после установления значимости общего критерия), обсуждение робастности касается, в основном, одномерного дисперсионного анализа. Поэтому должна быть внимательно исследована значимость одномерных эффектов.

Специальный случай: ковариационный анализ. Особенно серьезные нарушения однородности дисперсии/ковариаций могут происходить, когда в план включаются ковариаты. В частности, если корреляция между ковариатами и зависимыми измерениями различна в разных ячейках плана, может последовать неверное истолкование результатов. Следует помнить, что в ковариационном анализе, в сущности, проводится регрессионный анализ внутри каждой ячейки для того, чтобы выделить ту часть дисперсии, которая соответствует ковариате. Предположение об однородности дисперсии/ковариации предполагает, что этот регрессионный анализ проводится при следующем ограничении: все регрессионные уравнения (наклоны) для всех ячеек одинаковы. Если это не предполагается, то могут появиться большие ошибки. Модуль Дисперсионный анализ имеет несколько специальных критериев для проверки этого предположения. Можно посоветовать использовать эти критерии, для того, чтобы убедиться, что регрессионные уравнения для различных ячеек примерно одинаковы.

Сферичность и сложная симметрия: причины использования многомерного подхода к повторным измерениям в дисперсионном анализе

В планах, содержащих факторы повторных измерений с более чем двумя уровнями, применение одномерного дисперсионного анализа требует дополнительных предположений: предположения о сложной симметрии и предположения о сферичности. Эти предположения редко выполняются (см. ниже). Поэтому в последние годы многомерный дисперсионный анализ завоевал популярность в таких планах (оба подхода совмещены в модуле Дисперсионный анализ ).

Предположение о сложной симметрии Предположение о сложной симметрии состоит в том, что дисперсии (общие внутригрупповые) и ковариации (по группам) для различных повторных измерений однородны (одинаковы). Это достаточное условие для того, чтобы одномерный F критерий для повторных измерений был обоснованным (т.е. выданные F-значения в среднем соответствовали F-распределению). Однако в данном случае это условие не является необходимым.

Предположение о сферичности. Предположение о сферичности является необходимым и достаточным условием того, чтобы F-критерий был обоснованным. Оно состоит в том, что внутри групп все наблюдения независимы и одинаково распределены. Природа этих предположений, а также влияние их нарушений обычно не очень хорошо описаны в книгах по дисперсионному анализу - эта будет описано в следующих параграфах. Там же будет показано, что результаты одномерного подхода могут отличаться от результатов многомерного подхода, и будет объяснено, что это означает.

Необходимость независимости гипотез. Общий способ анализа данных в дисперсионном анализе – это подгонка модели . Если относительно модели, соответствующей данным, имеются некоторые априорные гипотезы, то дисперсия разбивается для проверки этих гипотез (критерии главных эффектов, взаимодействий). С точки зрения вычислений, этот подход генерирует некоторое множество контрастов (множество сравнений средних в плане). Однако если контрасты не независимы друг от друга, разбиение дисперсий становится бессодержательным. Например, если два контраста A и B тождественны и выделяется соответствующая им часть из дисперсии, то одна и та же часть выделяется дважды. Например, глупо и бессмысленно выделять две гипотезы: “среднее в ячейке 1 выше среднего в ячейке 2” и “среднее в ячейке 1 выше среднего в ячейке 2”. Итак, гипотезы должны быть независимы или ортогональны.

Независимые гипотезы при повторных измерениях. Общий алгоритм, реализованный в модуле Дисперсионный анализ , будет пытаться для каждого эффекта генерировать независимые (ортогональные) контрасты. Для фактора повторных измерений эти контрасты задают множество гипотез относительно разностей между уровнями рассматриваемого фактора. Однако если эти разности коррелированы внутри групп, то результирующие контрасты не являются больше независимыми. Например, в обучении, где обучающиеся измеряются три раза за один семестр, может случиться, что изменения между 1 и 2 измерением отрицательно коррелируют с изменением между 2 и 3 измерениями субъектов. Те, кто большую часть материала освоил между 1 и 2 измерениями, осваивают меньшую часть в течение того времени, которое прошло между 2 и 3 измерением. В действительности, для большинства случаев, где дисперсионный анализ используются при повторных измерениях, можно предположить, что изменения по уровням коррелированы по субъектам. Однако когда это случается, предположение о сложной симметрии и предположения о сферичности не выполняются и независимые контрасты не могут быть вычислены.

Влияние нарушений и способы их исправления. Когда предположения о сложной симметрии или о сферичности не выполняются, дисперсионный анализ может выдать ошибочные результаты. До того, как были достаточно разработаны многомерные процедуры, было предложено несколько предположений для компенсации нарушений этих предположений. (см., например, работы Greenhouse & Geisser, 1959 и Huynh & Feldt, 1970). Эти методы до сих пор широко используются (поэтому они представлены в модуле Дисперсионный анализ ).

Подход многомерного дисперсионного анализа к повторным измерениям. В целом проблемы сложной симметрии и сферичности относятся к тому факту, что множества контрастов, включенных в исследование эффектов факторов повторных измерений (с числом уровней большим, чем 2) не независимы друг от друга. Однако им не обязательно быть независимыми, если используется многомерный критерий для одновременной проверки статистического значимости двух или более контрастов фактора повторных измерений. Это является причиной того, что методы многомерного дисперсионного анализа стали чаще использоваться для проверки значимости факторов одномерных повторных измерений с более чем 2 уровнями. Этот подход широко распространен, так как он, в общем случае, не требует предположения о сложной симметрии и предположения о сферичности.

Случаи, в которых подходмногомерного дисперсионного анализа не может быть использован. Существуют примеры (планы), когда подход многомерного дисперсионного анализа не может быть применен. Обычно это случаи, когда имеется небольшое количество субъектов в плане и много уровней в факторе повторных измерений. Тогда для проведения многомерного анализа может быть слишком мало наблюдений. Например, если имеется 12 субъектов, p = 4 фактора повторных измерений, и каждый фактор имеет k = 3 уровней. Тогда взаимодействие 4-х факторов будет “расходовать”(k -1)P = 2 4 = 16 степеней свободы. Однако имеется лишь 12 субъектов, следовательно, в этом примере многомерный тест не может быть проведен. Модуль Дисперсионный анализ самостоятельно обнаружит эти наблюдения и вычислит только одномерные критерии.

Различия в одномерных и многомерных результатах. Если исследование включает большое количество повторных измерений, могут возникнуть случаи, когда одномерный подход дисперсионного анализа к повторным измерениям дает результаты, сильно отличающиеся от тех, которые были получены при многомерном подходе. Это означает, что разности между уровнями соответствующих повторных измерений коррелированы по субъектам. Иногда этот факт представляет некоторый самостоятельный интерес.

Многомерный дисперсионный анализ и структурное моделирование уравнений

В последние годы моделирование структурных уравнений стало популярным, как альтернатива многомерному анализу дисперсии (см. например, Bagozzi and Yi, 1989; Bagozzi, Yi, and Singh, 1991; Cole, Maxwell, Arvey, and Salas, 1993). Этот подход позволяет проверять гипотезы не только о средних в разных группах, но так же и о корреляционных матрицах зависимых переменных. Например, можно ослабить предположения об однородности дисперсии и ковариаций и явно включить в модель для каждой группы дисперсии и ковариации ошибки. Модуль STATISTICA Моделирование структурными уравнениями (SEPATH ) (см. том III) позволяет проводить такой анализ.

Любое коммерческое предприятие, работающее на рынке в достаточно жесткой конкурентной среде, обязано эффективно распоряжаться имеющимися внутренними ресурсами и своевременно реагировать на изменение внешних условий. Эти цели и преследуют соответствующие аналитические мероприятия, о которых пойдет речь в публикации.

Факторный анализ прибыли

Объектом пристального внимания аналитика является прибыль предприятия , поскольку именно она отображает эффективность работы компании, ее ликвидность и платежеспособность. Прибыль выступает индикатором, реагируя на любые изменения внешней среды и внутри фирмы, поэтому важно уметь анализировать этот показатель, правильно оценивая степень воздействия всех критериев.

Факторный анализ чистой прибыли компании рассматривает два влияющих блока: внешние и внутренние.

Внутренними считают факторы, влиять на которые предприятие в состоянии. К примеру, фирма может влиять на прибыль, поскольку степень загруженности мощностей и уровень применяемых технологий сказываются на качестве выпускаемых продуктов. Сложнее с непроизводственными факторами, как то – реакция персонала на изменение трудовых условий, логистика и др.

Под внешними понимают факторы рыночных реалий, контролировать которые компания не может, но принимает во внимание. Например, невозможно воздействовать на рыночную конъюнктуру, уровень инфляции, удаленность от ресурсов, особенности климата, смену гостарифов, нарушение условий соглашений партнерами и др.

Факторный анализ чистой прибыли – составляющая анализа финансовой деятельности компании. Применяется он для определения степени воздействия различных показателей на результат. К примеру, исследуют:

  • динамику изменений величины выручки ;
  • прирост объема продаж;
  • влияние на прибыль динамики продаж, изменения цен и себестоимости .

Анализируют показатели, сравнивая итоги двух конкретных периодов. Начинают анализ с группировки влияющих на прибыль факторов. Чистая прибыль определяется как выручка, уменьшенная на себестоимость, налоги, коммерческие, административные и прочие расходы.

В основе факторного анализа лежит исследование изменений каждого фактора, влияющего на величину прибыли, т. е. анализ изменения чистой прибыли в рассматриваемом периоде осуществляется сравнением изменений всех составляющих ее значений.

Факторный анализ чистой прибыли: пример расчета

Рассмотрим детальнее все этапы анализа перечисленных факторов на основе данных таблицы:

Значение

Объем продаж (т. р.) за

Абсолютное отклонение

прошлый год

отчетный год

(гр 3 - гр2)

100 х ((гр 3 / гр2)) – 100

Себестоимость

Проведем факторный анализ чистой прибыли. Пример наш упрощен и базируется на вычислении (по формулам в таблице):

  • абсолютных величин отклонений данных выручки и себестоимости за отчетный период в сравнении с предыдущим годом;
  • прироста показателей в %.

Вывод: за отчетный год чистая прибыль компании выросла к прошлому году на 1000 тыс. руб. Негативным фактором стало увеличение себестоимости, составившее 11,2% к предыдущему году. Необходимо обратить внимание на рост себестоимости и выявить причины явления, поскольку его увеличение существенно опережает рост прибыли.

Упростив задачу и проанализировав показатели, мы выяснили, что необходимо провести более детальное исследование себестоимости, поскольку в нашем примере она складывается из нескольких показателей и расчет следует провести по группам всех затрат: производственных, коммерческих и управленческих. Расширив блок исходных данных, приступим к факторному анализу прибыли от продаж и определим основные изменяющие критерии.

Факторный анализ прибыли от продаж: пример расчета

Значение

Объем реализации (т. р.) за

Абсолютное отклонение

прошлый год

отчетный год

(гр 3 – гр 2)

100 х ((гр 3 / гр 2)) – 100

Себестоимость

Коммерческие расходы

Управленческие расх.

Прибыль от продаж

Индекс изменения цен

Объем продаж в сопоставимых ценах

Определим влияние:

  1. Объема продаж умножением прибыли на изменение объема:
    • 73 451 т.р. (83 000 / 1,13)
    • фактический объем продаж с учетом изменений составил 88,5% (73 451 / 83 000 х 100), т. е. объем продаж снижен на 11,5% (100 – 88,5).
    • из-за этого прибыль от продаж фактически снизилась на 1495 тыс. руб. (13 000 х (– 0,115) = – 1495).
  2. Ассортимента продукции:
    • фактические продажи, рассчитанные по базисной себестоимости 47 790 тыс. руб. (54 000 х 0,885);
    • прибыль отчетного года, вычисленная по базисным себестоимости и ценам (АУР и коммерческие расходы) 16 661 тыс. руб. (73 451 – 47 790 – 4000 – 5000). Т.е. изменение состава ассортимента повлекло изменение прибыли на 5156 тыс. руб. (16 661 – (13 000 х 0,885). Это означает, что увеличился удельный вес продуктов с большей доходностью.
  3. Себестоимости в пересчете по базису:
    • (54 000 х 0,885) – 60 000 = – 12 210 тыс. руб. – себестоимость повысилась, а, значит, прибыль от продаж снизилась на ту же сумму.
  4. АУР и коммерческих расходов, сравнив их абсолютные величины:
    • коммерческие расходы увеличились на 6000 тыс. руб. (10 000 – 4000), т. е. прибыль снизилась;
    • за счет снижения АУР на 1000 тыс. руб. (4000 – 5000) прибыль увеличилась.
  5. Продажных цен, сопоставив объем реализации в базовых и отчетных ценах:
    • 83 000 – 73451 = 9459 тыс. руб.
    • Подсчитаем влияние всех факторов:
    • 1495 + 5156 – 12 210 – 6000 + 1000 + 9459 = – 4090 тыс. руб.

Вывод: Существенный рост себестоимости произошел на фоне повышения цен на сырье и тарифы. Отрицательно сказалось уменьшение объема продаж, хотя фирма обновила ассортимент, выпустив ряд продуктов с большей доходностью. К тому же, значительно увеличились коммерческие расходы. Резервами роста прибыли фирмы являются повышение объема продаж, выпуска рентабельных продуктов и снижение себестоимости и коммерческих расходов.