![]() |
Главная Случайная страница Контакты | Мы поможем в написании вашей работы! | |
|
Первичная обработка информации
Анализ и обобщение данных осуществляется как с помощью описа-тельных, так и с помощью аналитических методов. Среди аналитических методов в маркетинговых исследованиях часто применяются: анализ трендов, методы регрессионно-корреляционного анализа, дискриминантны анализ, кластерный анализ, факторный анализ и другие. Количественна информация измерима и может быть обработана так, как это было показано ранее. При этом следует помнить, что исходная информация может содержать в себе ошибки. По своим свойствам и характеру влияния на результаты наблюдений ошибки подразделяют на грубые, систематические и случайные.
Грубые ошибки возникают в случае невнимательности человека, эту информацию записывающего, передающего или получающего. В результате этой невнимательности измеренное число увеличивается на порядок или резко выделяется в общей совокупности данных. В этой связи с такой ошибкой легко бороться — она легко обнаруживается и легко устраняется. Для этого есть несколько возможных процедур:
1. Графический анализ. При этом статистические данные наносят на некоторый график. Если рассматривается некоторая статистическая взаимосвязь, то изучается эта взаимосвязь. Данные, которые выделяются и: совокупности наблюдений, отбрасываются. Если изучаются динамические ряды, то строится зависимость изменения показателей во времени; Данные, которые выделяются из общей тенденции, отбрасываются.
2. Табличный анализ. Данные, которые невозможно или нежелательно изображать графически, располагают в некотором порядке, присуще» анализируемому процессу. Те из них, которые выбиваются из этого порядка, отбрасываются.
3. Статистический анализ. Полученные данные проверяются на одну из статистических гипотез относительно характера распределения вероятностей появления анализируемой совокупности данных. В случае выявления некоторого закона распределения вероятностей данные, противоречащие этому закону, отбрасываются. В самом простом случае, когда измеренные величины колеблются около некоторого значения, рассчитывается средняя арифметическая этого значения, дисперсия, доверительные интервалы. Данные, выходящие за эти интервалы, отбрасываются.
Источниками систематической ошибки могут являться как инструмент сбора и обработки информации, так и человеческий фактор (желание приукрасить ситуацию или скрыть часть неблагоприятной информации). К сожалению, в маркетинговых исследованиях при работе с вторичными данными (официальной и неофициальной статистикой) очень часто приходится иметь дело именно с такого рода ошибками Дело в том, что большая часть экономических показателей отражает эффективность деятельности того или иного подразделения, той или иной системы, того или иного региона.
Сегодня причиной возникновения подобной ошибки может быть, например, желание уменьшить выплаты по платежам в бюджеты и внебюджетные фонды, искажение данных в ходе «информационной войны» с конкурентами и т. п.
Систематические ошибки могут быть также выявлены и исключены, так как имеют примерно одну и ту же величину, один и тот же знак, поэтому исходные данные, содержащие этот тип ошибки, всегда несколько завышены или занижены. Объективным источником этих ошибок служат в основном измерительные устройства, приёмы или приборы, вносящие одну и ту же погрешность при измерениях.
Случайные ошибки неизбежны. Причины их появления многообразны. Они вызваны действием множества случайных неконтролируемых факторов и поэтому не поддаются анализу. В результате этого практически любое измерение содержит случайные ошибки, но так как источников возникновения случайных ошибок достаточно много, они, как правило, обладают следующими свойствами.
Первое свойство. Для ряда результатов наблюдений с известным параметром распределения абсолютные величины случайных ошибок с заданной вероятностью Р не превосходят определенного предела. Это значит, что влияние случайных ошибок на результат все-таки незначительно.
Второе свойство. Положительные и отрицательные случайные ошибки равновозможны, т. е. они одинаково часто встречаются при наблюдениях. Из этого вытекает и следующее свойство.
Третье свойство. Математическое ожидание случайной ошибки равно нулю.
Четвертое свойство. Малые по абсолютной величине случайные ошибки встречаются при наблюдениях чаще, чем большие.
Следовательно, можно предполагать в большинстве случаев, что случайные ошибки подчиняются закону нормального распределения вероятностей и их математическое ожидание равно нулю. Таким образом маркетинговая информация содержит ошибки наблюдений, но они в общем случае несоизмеримы по сравнению с самими наблюдениями.
С учетом перечисленных свойств создается ситуация, когда проявляются условия действия центральной предельной теоремы теории вероятностей (закон больших чисел), в соответствии с которой совокупное действие большого числа случайных факторов приводит при некоторых достаточно широких условиях к результату, почти не зависящему от случая. Таким образом, избежать влияния случайных ошибок можно, если увеличить объем выборки.
После того, как будут устранены ошибки информации, перед исследователем возникает проблема ее систематизации и обработки. В достаточно редких случаях необходимая исследователю информация представлена в систематизированном виде и в виде, пригодном для последующего анализа и обработки. Чаще всего информация представлена в некоторой неупорядоченной совокупности. Для того, чтобы ее обработан и сделать соответствующие выводы, необходимо ее упорядочить и систематизировать.
Систематизация информации заключается в ее представлении в виде таблиц, графиков, диаграмм и других формах, удобных для исследователя и показывающих некоторые наиболее очевидные закономерности. В большинстве случаев маркетологи предпочитают сведение информации в статистические таблицы — при этом возможен их последующий формализованный анализ с помощью математических методов.
Для того, чтобы неупорядоченную совокупность данных можно было свести в таблицу, необходимо определить признак упорядочивания данных. Такими признаками могут являться:
• время — период наблюдения или конкретные наблюдения в зафиксированный момент времени;
• номера экспертов, дававших оценку объекту исследования; В первом случае осуществить систематизацию достаточно просто. Информация рассматривается в качестве зависимого
• ранги, полученные для свойств товара по шкале отношений или интервалов;
• товарный ряд и т. п.
от времени фактора. Тогда в первой колонке таблицы указывается время или промежуток времени, а в последующих колонках — количественная информация об объекте исследования в эти моменты времени или промежутки времени. Точно так же систематизируются данные и по другим указанным критериям.
Довольно часто на практике встречаются случаи, когда сведенная таблицы информация оказывается неполной — часть данных отсутствует. Это может возникнуть, например, в случае, когда при опросе один из респондентов ответил не на все вопросы. В подобном случае возникает необходимость восстановления утерянной в процессе сбора и обработки наблюдений информации. Определить неизвестную величину внутри статистического ряда можно с помощью одного из методов интерполяции.
Теория интерполяции является одним из старейших разделов математики и начиналась она работами И. Ньютона, Ж. Лагранжа, Н. Абеля, Ш. Эрмита и др. По определению интерполирование — это способ нахождения какой-либо величины по известным отдельным значениям этой же или других величин, связанных с ней.
Теория интерполяции является одним из наиболее разработанных разделов численных методов, и поэтому поставленная задача может быть решена с той или иной степенью точности.
Проще всего воспользоваться методом разностей, хотя это и не самый точный метод экстраполяции. Его суть заключается в следующем.
Первая производная функции, как известно, находится по формуле:
которая будет в среднем характеризовать первую производную зависимости, а значит, будет являться одной из оценок коэффициента линейной прогрессии. У на X. С помощью этого коэффициента можно решать интерполяции подобных линейных зависимостей. Однако точное такой интерполяции не очень высока, к тому же линейные зависимости встречаются крайне редко в маркетинговой практике. Поэтому метод вычисления конечных разностей для целей интерполяции в настоящее время почти не применяется на практике, но именно конечные разности лег в основу интерполяции методом полинома Ньютона.
Интерполяционная формула Ньютона применяется в том случае, когда упорядоченные значения Xf находятся на равном расстоянии друг друга, то есть, когда дХ, = Xt + 1-Xt = h- const для всех t. Константа h получила название шага наблюдений (шаг таблицы наблюдений). С учёт этого свойства значения функции двух переменных X, и Yt характеризуются только изменением переменной Yt. Эти изменения можно определить, вычислив значения конечных разностей. Сами разности можно осуществлять с шагом назад, как это было сделано в (6.1.3), а можно делать и с шагом вперёд, как это предусмотрено методом Ньютона. При этом формулы для расчёта первых разностей будет иметь вид:
вторых разностей:
третьих разностей:
и так далее для других конечных разностей.
Легко убедиться в том, что если будет не шесть наблюдений, как это показано в табл. 6.1, а, например, восемь, то можно будет вычислить ещё и разности шестого и седьмого порядков; если будет п наблюдений, то можно вычислить разности (п - 1)-го порядка. Разность каждого порядка в определённой степени характеризует производную этой степени, соответствующую данному порядку.
Так как значения Xf в рассматриваемом случае представляют собой арифметическую прогрессию, то введя обозначение:
получим интерполяционную формулу Ньютона на основе вычисленных значений конечных разностей:
Подставляя в (6.1.6) известное значение Xk, легко найти интерполируемое значение Yk.
Формула (6.1.7) называется интерполяционной формулой Ньютона для интерполирования вперёд71. Существует также формула Ньютона для интерполирования назад, которая использует разности, вычисленные по принципу (6.1.3).
В случаях, когда необходимо получить более точные результаты интерполяции, рекомендуется использовать и более сложные нелинейные интерполяционные формулы, в первую очередь, интерполяционные формулы Лагранжа и Ньютона. Методика интерполяций этими методами исходит из необходимости построения интерполирующей функции, проходящей через все точки Xt и Yt. Подобной функцией является многочлен (n-1 в1)-oй степени, который, очевидно, пройдёт через все п точеки:
Однако достаточно часто построение подобных функций оказывается излишним, поскольку с подобной задачей успешно могут справиться и Функции с более низкими степенями. Именно эту задачу решают методы вычисления интерполяционного многочлена (полинома) Лагранжа, который рассчитывается по формуле72:
Этот интерполяционный многочлен вычисляется для имеющихся пар значений, а затем, по известному значению Xk (k^t) интерполируют знчение Yk, подставляя это значение Xk в формулу (6.1.9). Каждая из интерполяционных формул (6.1.7) и (6.1.9) даёт при вычислении ошибки, которые при необходимости можно вычислить и учесть в расчётах. Однако величина этих ошибок достаточно мала, поэтому влиянием пренебрегают, тем более, что эмпирические данные маркетинговых исследований загрязнены другими многочисленными ошибками.
Уже в ходе обработки маркетинговой информации могут возникнуть две принципиально различные ошибки:
• связанные с неточностью исходной информации;
• вызванные несовершенством инструментария обработки данных
Первые могут быть названы ошибками наблюдений, вторые — ошибками инструментария.
В современной экономической и математической науке наибольшее
внимание уделяется анализу и устранению ошибок первого рода. При этом считается, что специалист, использующий математическую статистику настолько грамотен, что просто не допустит появления ошибок второго рода. Значительно сложнее дело с ошибками инструментария. И здесь можно выделить два типа ошибок.
Первый тип ошибок связан с ошибками в применении инструментария, разработанного для изучаемого процесса. Такие ошибки вызваны не
грамотностью исследователя и могут быть очень просто удалены заменой исследователя или прикреплением к нему специалиста, владеющего методологией данных исследований.
Второй тип ошибок связан с несоответствием инструментария исследований характеру и свойствам исследуемой системы, что вызван не разработанностью самого инструментария, так как эти проблемы находятся на рубеже «знания-незнания» и являются предметом научного исследования.
К числу методов интерполирования относят также и интерполирование методами моделирования с использованием методов математической статистки — чаще всего с помощью метода наименьших квадратом Суть этого метода заключается в следующем. По имеющимся статистическим данным двух переменных X, и Yt строится регрессионна модели зависимости Yt от Xt или наоборот. Затем, по известным данным Xk с по|мощью модели рассчитывается интерполируемая величина Yk или наоброт.
Дата публикования: 2015-10-09; Прочитано: 357 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!