Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Методы статистической обработки маркетинговой информации



Первичная обработка информации

Анализ и обобщение данных осуществляется как с помощью описа-тельных, так и с помощью аналитических методов. Среди аналитических методов в маркетинговых исследованиях часто применяются: анализ трендов, методы регрессионно-корреляционного анализа, дискриминантны анализ, кластерный анализ, факторный анализ и другие. Количественна информация измерима и может быть обработана так, как это было показано ранее. При этом следует помнить, что исходная информация может содержать в себе ошибки. По своим свойствам и характеру влияния на результаты наблюдений ошибки подразделяют на грубые, системати­ческие и случайные.

Грубые ошибки возникают в случае невнимательности человека, эту информацию записывающего, передающего или получающего. В резуль­тате этой невнимательности измеренное число увеличивается на порядок или резко выделяется в общей совокупности данных. В этой связи с та­кой ошибкой легко бороться — она легко обнаруживается и легко устраняется. Для этого есть несколько возможных процедур:

1. Графический анализ. При этом статистические данные наносят на некоторый график. Если рассматривается некоторая статистическая вза­имосвязь, то изучается эта взаимосвязь. Данные, которые выделяются и: совокупности наблюдений, отбрасываются. Если изучаются динамические ряды, то строится зависимость изменения показателей во времени; Данные, которые выделяются из общей тенденции, отбрасываются.

2. Табличный анализ. Данные, которые невозможно или нежелательно изображать графически, располагают в некотором порядке, присуще» анализируемому процессу. Те из них, которые выбиваются из этого по­рядка, отбрасываются.

3. Статистический анализ. Полученные данные проверяются на одну из статистических гипотез относительно характера распределения ве­роятностей появления анализируемой совокупности данных. В случае выявления некоторого закона распределения вероятностей данные, про­тиворечащие этому закону, отбрасываются. В самом простом случае, когда измеренные величины колеблются около некоторого значения, рассчи­тывается средняя арифметическая этого значения, дисперсия, доверитель­ные интервалы. Данные, выходящие за эти интервалы, отбрасываются.

Источниками систематической ошибки могут являться как инструмент сбора и об­работки информации, так и человеческий фактор (желание приукрасить ситуацию или скрыть часть неблагоприятной информации). К сожалению, в маркетинговых исследованиях при работе с вторичными данными (официальной и неофициаль­ной статистикой) очень часто приходится иметь дело именно с такого рода ошибками Дело в том, что большая часть экономических показателей отражает эффек­тивность деятельности того или иного подразделения, той или иной системы, того или иного региона.

Сегодня причиной возникновения подобной ошибки может быть, например, жела­ние уменьшить выплаты по платежам в бюджеты и внебюджетные фонды, искаже­ние данных в ходе «информационной войны» с конкурентами и т. п.

Систематические ошибки могут быть также выявлены и исключены, так как имеют примерно одну и ту же величину, один и тот же знак, поэтому исходные данные, содержащие этот тип ошибки, всегда несколько за­вышены или занижены. Объективным источником этих ошибок служат в ос­новном измерительные устройства, приёмы или приборы, вносящие одну и ту же погрешность при измерениях.

Случайные ошибки неизбежны. Причины их появления многообраз­ны. Они вызваны действием множества случайных неконтролируемых фак­торов и поэтому не поддаются анализу. В результате этого практически любое измерение содержит случайные ошибки, но так как источников возникновения случайных ошибок достаточно много, они, как правило, об­ладают следующими свойствами.

Первое свойство. Для ряда результатов наблюдений с известным па­раметром распределения абсолютные величины случайных ошибок с за­данной вероятностью Р не превосходят определенного предела. Это значит, что влияние случайных ошибок на результат все-таки незначительно.

Второе свойство. Положительные и отрицательные случайные ошиб­ки равновозможны, т. е. они одинаково часто встречаются при наблюде­ниях. Из этого вытекает и следующее свойство.

Третье свойство. Математическое ожидание случайной ошибки равно нулю.

Четвертое свойство. Малые по абсолютной величине случайные ошиб­ки встречаются при наблюдениях чаще, чем большие.

Следовательно, можно предполагать в большинстве случаев, что слу­чайные ошибки подчиняются закону нормального распределения веро­ятностей и их математическое ожидание равно нулю. Таким образом маркетинговая информация содержит ошибки наблюдений, но они в об­щем случае несоизмеримы по сравнению с самими наблюдениями.

С учетом перечисленных свойств создается ситуация, когда проявля­ются условия действия центральной предельной теоремы теории веро­ятностей (закон больших чисел), в соответствии с которой совокупное действие большого числа случайных факторов приводит при некоторых достаточно широких условиях к результату, почти не зависящему от слу­чая. Таким образом, избежать влияния случайных ошибок можно, если увеличить объем выборки.

После того, как будут устранены ошибки информации, перед исследователем возникает проблема ее систематизации и обработки. В достаточно редких случаях необходимая исследователю информация представлена в систематизированном виде и в виде, пригодном для последующего анализа и обработки. Чаще всего информация представлена в некоторой неупорядоченной совокупности. Для того, чтобы ее обработан и сделать соответствующие выводы, необходимо ее упорядочить и систематизировать.

Систематизация информации заключается в ее представлении в виде таблиц, графиков, диаграмм и других формах, удобных для исследователя и показывающих некоторые наиболее очевидные закономерности. В большинстве случаев маркетологи предпочитают сведение информации в статистические таблицы — при этом возможен их последующий формализованный анализ с помощью математических методов.

Для того, чтобы неупорядоченную совокупность данных можно было свести в таблицу, необходимо определить признак упорядочивания данных. Такими признаками могут являться:

• время — период наблюдения или конкретные наблюдения в зафиксированный момент времени;

• номера экспертов, дававших оценку объекту исследования; В первом случае осуществить систематизацию достаточно просто. Информация рассматривается в качестве зависимого

• ранги, полученные для свойств товара по шкале отношений или интервалов;

• товарный ряд и т. п.

от времени фактора. Тогда в первой колонке таблицы указывается время или промежуток времени, а в последующих колонках — количественная информация об объекте исследования в эти моменты времени или промежутки времени. Точно так же систематизируются данные и по другим указанным критериям.

Довольно часто на практике встречаются случаи, когда сведенная таблицы информация оказывается неполной — часть данных отсутствует. Это может возникнуть, например, в случае, когда при опросе один из респондентов ответил не на все вопросы. В подобном случае возни­кает необходимость восстановления утерянной в процессе сбора и об­работки наблюдений информации. Определить неизвестную величину внутри статистического ряда можно с помощью одного из методов ин­терполяции.

Теория интерполяции является одним из старейших разделов математики и начи­налась она работами И. Ньютона, Ж. Лагранжа, Н. Абеля, Ш. Эрмита и др. По определению интерполирование — это способ нахождения какой-либо величины по известным отдельным значениям этой же или других величин, связанных с ней.

Теория интерполяции является одним из наиболее разработанных раз­делов численных методов, и поэтому поставленная задача может быть решена с той или иной степенью точности.

Проще всего воспользоваться методом разностей, хотя это и не самый точный метод экстраполяции. Его суть заключается в следующем.

Первая производная функции, как известно, находится по формуле:

которая будет в среднем характеризовать первую производную зависимости, а значит, будет являться одной из оценок коэффициента линейной прогрессии. У на X. С помощью этого коэффициента можно решать интерполяции подобных линейных зависимостей. Однако точное такой интерполяции не очень высока, к тому же линейные зависимости встречаются крайне редко в маркетинговой практике. Поэтому метод вычисления конечных разностей для целей интерполяции в настоящее время почти не применяется на практике, но именно конечные разности лег в основу интерполяции методом полинома Ньютона.

Интерполяционная формула Ньютона применяется в том случае, когда упорядоченные значения Xf находятся на равном расстоянии друг друга, то есть, когда дХ, = Xt + 1-Xt = h- const для всех t. Константа h получила название шага наблюдений (шаг таблицы наблюдений). С учёт этого свойства значения функции двух переменных X, и Yt характеризуются только изменением переменной Yt. Эти изменения можно определить, вычислив значения конечных разностей. Сами разности можно осуществлять с шагом назад, как это было сделано в (6.1.3), а можно делать и с шагом вперёд, как это предусмотрено методом Ньютона. При этом формулы для расчёта первых разностей будет иметь вид:

вторых разностей:

третьих разностей:

и так далее для других конечных разностей.

Легко убедиться в том, что если будет не шесть наблюдений, как это показано в табл. 6.1, а, например, восемь, то можно будет вычислить ещё и разности шестого и седьмого порядков; если будет п наблюдений, то можно вычислить разности (п - 1)-го порядка. Разность каждого порядка в определённой степени характеризует производную этой степени, соот­ветствующую данному порядку.

Так как значения Xf в рассматриваемом случае представляют собой арифметическую прогрессию, то введя обозначение:

получим интерполяционную формулу Ньютона на основе вычисленных значений конечных разностей:

Подставляя в (6.1.6) известное значение Xk, легко найти интерполиру­емое значение Yk.

Формула (6.1.7) называется интерполяционной формулой Ньютона для интерполирования вперёд71. Существует также формула Ньютона для интерполирования назад, которая использует разности, вычисленные по принципу (6.1.3).

В случаях, когда необходимо получить более точные результаты интер­поляции, рекомендуется использовать и более сложные нелинейные ин­терполяционные формулы, в первую очередь, интерполяционные форму­лы Лагранжа и Ньютона. Методика интерполяций этими методами исхо­дит из необходимости построения интерполирующей функции, проходящей через все точки Xt и Yt. Подобной функцией является многочлен (n-1 в1)-oй степени, который, очевидно, пройдёт через все п точеки:

Однако достаточно часто построение подобных функций оказывается излишним, поскольку с подобной задачей успешно могут справиться и Функции с более низкими степенями. Именно эту задачу решают мето­ды вычисления интерполяционного многочлена (полинома) Лагранжа, который рассчитывается по формуле72:

Этот интерполяционный многочлен вычисляется для имеющихся пар значений, а затем, по известному значению Xk (k^t) интерполируют знчение Yk, подставляя это значение Xk в формулу (6.1.9). Каждая из интерполяционных формул (6.1.7) и (6.1.9) даёт при вычислении ошибки, которые при необходимости можно вычислить и учесть в расчётах. Однако величина этих ошибок достаточно мала, поэтому влиянием пренебрегают, тем более, что эмпирические данные маркетинговых исследований загрязнены другими многочисленными ошибками.

Уже в ходе обработки маркетинговой информации могут возникнуть две принципиально различные ошибки:

• связанные с неточностью исходной информации;

• вызванные несовершенством инструментария обработки данных

Первые могут быть названы ошибками наблюдений, вторые — ошибками инструментария.

В современной экономической и математической науке наибольшее
внимание уделяется анализу и устранению ошибок первого рода. При этом считается, что специалист, использующий математическую статистику настолько грамотен, что просто не допустит появления ошибок второго рода. Значительно сложнее дело с ошибками инструментария. И здесь можно выделить два типа ошибок.

Первый тип ошибок связан с ошибками в применении инструментария, разработанного для изучаемого процесса. Такие ошибки вызваны не
грамотностью исследователя и могут быть очень просто удалены заменой исследователя или прикреплением к нему специалиста, владеющего методологией данных исследований.

Второй тип ошибок связан с несоответствием инструментария исследований характеру и свойствам исследуемой системы, что вызван не разработанностью самого инструментария, так как эти проблемы находятся на рубеже «знания-незнания» и являются предметом научного исследования.

К числу методов интерполирования относят также и интерполирование методами моделирования с использованием методов математической статистки — чаще всего с помощью метода наименьших квадратом Суть этого метода заключается в следующем. По имеющимся статистическим данным двух переменных X, и Yt строится регрессионна модели зависимости Yt от Xt или наоборот. Затем, по известным данным Xk с по|мощью модели рассчитывается интерполируемая величина Yk или наоброт.





Дата публикования: 2015-10-09; Прочитано: 357 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.008 с)...