Студопедия.Орг Главная | Случайная страница | Контакты | Мы поможем в написании вашей работы!  
 

Задачи о правилах остановки



Задачи о правилах остановки образуют простейший подкласс задач быстро развивающейся в настоящее время области проблем последовательных решений с многозначным выбором, включающий в себя такие аспекты как динамическое программирование и последовательные испытания.

Типичный пример – задача о разборчивой невесте. Предположим, имеется N женихов, причем из любых двух женихов можно указать лучшего. Женихи рассматриваются в случайном порядке, и невеста хочет выбрать самого лучшего из них. При этом она может сравнивать жениха с рассмотренными ранее, но если некоторый субъект уже был отвергнут, то возвращаться к нему нельзя. Как ей следует поступить? На каком женихе остановиться, чтобы вероятность того, что он наилучший, была максимальной?

Очевидно, эту задачу можно сформулировать так. Имеется N вещественных чисел b 1, b 2,..., bN, среди которых нет одинаковых. Эти числа перемешаны так, что все перестановки равновероятны. Мы последовательно просматриваем эти числа и хотим выбрать самое большое. Возвращаться к числам уже просмотренным и невыбранным запрещается.

Если некоторое число bk больше всех предыдущих, то мы будем назвать его рекордсменом. Ясно, что наш выбор должен остановиться на каком–то из рекордсменов, поэтому изучим последовательность рекордсменов подробнее. Очевидно, что рекордсменом обязательно будет первое число b 1. Если , то других рекордсменов вообще не будет. Самое большое из чисел bk всегда будет рекордсменом, на каком бы месте оно не стояло.

Обозначим rk номер в порядке рассмотрения чисел (k + 1)-го рекордсмена: r 0 = 1, так как первый рекордсмен b 1. Если rn номер последнего рекордсмена в последовательности b 1, b 2,..., bN, то условимся считать, что rm = ¥ при m > n. Нетрудно проверить, что r 0, r 1,..., rnмарковская цепь. Состояния этой цепи суть числа 1, 2,...., N и точка ¥. Найдем ее переходные вероятности:

При n £ k вероятность, стоящая в числителе, равна нулю. При ¥> n > k событие { ri = k, ri + 1 = n } означает, что среди чисел b 1, b 2,..., bn правее всех оказались bk и bn, причем bk > bn. Вероятность этого события равна Вероятность, стоящая в знаменателе, равна 1/ k.

Таким образом, вероятности pkn для цепи ri равны 0 при n £ k <¥. Вероятность того, что k -й рекордсмен последний, вычисляется по формуле

Если bk – последний рекордсмен, то bk – абсолютный чемпион, наибольшее число. Следовательно, если мы остановимся на рекордсмене bk, то мы выиграем, то есть выберем наибольшее число с вероятностью Pk ¥ = k / N.

Посмотрим, какова будет вероятность qk выигрыша, если мы остановимся на следующем после bk рекордсмене. C вероятностью pkn следующим рекордсменом будет bn и с вероятностью pn ¥ этот рекордсмен будет последним, поэтому

Отношение с ростом k монотонно убывает. Пока оно больше единицы, останавливаться не стоит: вероятность выигрыша на следующем рекордсмене больше, чем на нынешнем. Интуитивно ясно, что надо ждать, пока впервые не появится рекордсмен bk с таким k, что qk / Pk ¥ меньше 1. Именно на нем и нужно останавливаться. Все предыдущие рекордсмены имеют меньшую вероятность быть последним, а других рекордсменов с большой вероятностью не будет.

При больших N и k отношение qk / Pk ¥ = ln (N / k), следовательно, впервые станет меньше 1 при k» N / e.

n Оптимальная стратегия, при больших N состоит в том, что нужно пропустить приблизительно N/e = N/2,71 чисел, а затем выбрать то число, которое больше всех предыдущих. При малых N нужно пропустить kN чисел, а затем выбрать первое число, большее предыдущих, где kN – наименьшее решение неравенства 1/kN + 1/kN + 1 + … + 1/N<1.

Так, при N = 5 нужно будет пропустить три первых числа; при N = 10 оптимальная стратегия состоит в выборе наибольшего после четырех пропущенных.

Можно подсчитать вероятность выигрыша при использовании оптимальной стратегии. Оказывается, при больших N эта вероятность стремится к 1/ e = 0,37.

Задача о разборчивой невесте приводит к отысканию оптимального момента остановки марковской цепи. В задаче о невесте эта цепь – последовательность номеров рекордсменов, и наша задача свелась к такому выбору правила остановки t, чтобы с наибольшей вероятностью остановиться в момент, непосредственно предшествующий скачку в ¥. Из состояния k совершается скачок в ¥ с вероятностью k / N. Поэтому вероятность успеха при стратегии t равна

Таким образом, задача о разборчивой невесте эквивалентна выбору такого правила остановки t для цепи r 0, r 1,..., rn,..., которое бы максимизировало бы М r t.

Общую задачу об оптимальной остановке марковской цепи x 0, x 1,..., xn,... можно сформулировать так. Пусть есть две функции f (x) и g (x) на состояниях цепи. Требуется выбрать такой марковский момент t, чтобы

приняло бы максимальное значение.

Пример 7.1

Задача о бросании монеты при неограниченном капитале. Осуществляются последовательные бросания симметричной монеты; выпадение герба означает выигрыш одного очка, выпадение решки – проигрыш одного очка.

Решение.

Пусть Xk = + 1, если в результате k -го бросания выпал герб, и Xk = –1, если в результате k -го бросания выпала решка, тогда выигрыш, накопившийся за n бросаний .

Поскольку временные и денежные ресурсы предполагаются неисчерпаемыми, то после каждого бросания имеется ровно два решения: прекратить игру и забрать накопившийся к данному моменту выигрыш или продолжить игру, по крайней мере, еще на одно бросание.

Выберем в качестве состояния системы общий накопленный к данному моменту выигрыш. Если мы находимся в состоянии i, то есть если наш выигрыш к данному моменту составляет i, то независимо от того, сколько игр нам пришлось сыграть, чтобы накопить эту сумму, вероятность перехода в состояние i + 1 есть ½ и в состоянии i –1 – тоже ½.

Таким образом

Начальное состояние есть i 0 = 0. Платеж, если мы останавливаемся в состоянии i, – это выигрыш к данному моменту: F (i) = i. Вступительного взноса нет f (i) = 0; состояний с вынужденной остановкой или продолжением также нет.

Для этой игры существует хорошо известная стратегия, которая требует, чтобы игрок выходил из игры, как только начинает выигрывать.

Пример 7.2

Задача о стоянках. Предположим, что мы едем куда–то на автомобиле, и что до места нашего назначения будет еще N стоянок. В поле зрения попадает каждый раз только одна стоянка. Естественно, что если стоянка занята, то мы не можем на ней остановиться; если же стоянка свободна и мы поставим на ней автомобиль, то штраф, или убыток – это то расстояние, которое нам придется пройти до места назначения пешком.

Решение.

В последовательности независимых случайных величин X N, X N + 1, …, X 0, X 1, … все случайные величины принимают значение 0 или 1 с одной и той же вероятностью P (Xk = 0) = p; P (Xk = 1) = 1– p.

Мы может остановиться на Xk, только в том случае, если Xk = 0, но если Xk = 0 и мы действительно останавливаемся, то мы платим штраф | k |.

Возьмем в качестве состояний пары чисел (i, k), где i пробегает значения – N, – N + 1, …, 0, 1, …, а k принимает только значения 0 и 1. Содержательно это означает, что i измеряет расстояние от данной стоянки до пункта назначения, а k отмечает, свободна данная стоянка или нет. Переход из (i, k) в (i + 1, 0) осуществляется с вероятностью p, а переход в (i + 1, 1) – с вероятностью 1–р.

В примере есть состояния с вынужденным продолжением (i, 1), где i = – N, – N + 1, …. Платеж задается формулой F (i, 0) = –| i |, где минус показывает, что платеж – величина, противоположная штрафу. Вступительный взнос равен нулю, а в качестве начального состояния снова берется (– N –1, 0).

Контрольные вопросы

Задание 7.1

Определить оптимальный вариант маршрутной технологии обработки деталей на пяти группах взаимозаменяемого оборудования, если известны технологические себестоимости каждой операции обработки и все возможные варианты технологических маршрутов.

I гр. II гр. III гр. IV гр. V гр.


1 5 8 12

3 2 3 9

2 4 7 20

1 4





Дата публикования: 2015-01-10; Прочитано: 600 | Нарушение авторского права страницы | Мы поможем в написании вашей работы!



studopedia.org - Студопедия.Орг - 2014-2024 год. Студопедия не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования (0.01 с)...