Сделать свой сайт бесплатно

Реклама

Создай свой сайт в 3 клика и начни зарабатывать уже сегодня.

@ADVMAKER@

ЕЩЁ РАЗ О BETFAIR

СТРАТЕГИИ BETFAIR

Тема биржевых ставок  столь же обширна и многогранна как и  общепринятых в обычной букмекерской конторе. При этом игроки, как правило, наступают на те же грабли  что и при игре в обычной букм. конторе. Многие отталкиваются от статических расчётов и пытаются найти золотое дно в тёмном омуте. Многие псевдо-стратегии  базируются именно на возможности поднять деньгу в единичной операции на бирже---любая ставка (какая бы дурная она не была) способна на это. Но вопрос состоит в том,---будем ли мы иметь положительный баланс при многократном использовании данной стратегии и продолжении подобных ставок.Таким образом  совершенно очевидно что для игры на бирже мы должны использовать вероятностный подход к построению стратегий и сопоставлять частоту наступления прибыли и частоту убытков помноженные на соответствующие величины прибыли (убытков).  Если вы в 9-ти случаях из десяти  зарабатываете по рублю, а в одном попадаете на  15 рублей, то какой вам прок от сей стратегии?

Таким образом для построения продвинутых стратегий нам необходимы вероятностные оценки как для всего матча так и для отдельных его временных участков. Мы так же должны уметь переоценивать вероятности при наступлении некоторых событий (например:  забит гол фавориту---какова вероятность что фаворит выиграет или какова вероятность что выиграет аутсайдер забивший гол ?  итд итп )

Совершенно очевидно --- что интуитивно мы таких оценок с приемлемой точностью не сделаем и нам необходима какая либо модель описывающая некоторые процессы в лиге для конкретных пар команд. Ко всему прочему "удачливых" игроков поджидают с распростёртыми обьятиями роботы которые в зависимости от заложенных алгоритмов в той или иной степени могут прогнозировать поведение рынка и имеют преимущества как по скорости операций так и по скорости принятия решений (они могут просто отнять ваши деньги).

 

Весь анализ ситуаций может быть очевидно перенесён в  N-мерное пространство, в зависимости от числа событий в полной группе. Полная группа—группа несовместных событий сумма вероятностей которых равна 1. (например В Н П  или  <2,5  >2,5  итд итп)

Будем рассматривать наиболее популярную линию 1Х2.

 Коэффициенты  при  любой динамике ( даже если они стоят на месте) выбираются с учётом  уравнивания интереса сторон  и недопущения   вилочных конфигураций  для полной группы исходов.

Это фактически означает следующее -- для коэфф. «ЗА»  и  «ПРОТИВ» значения векторов(1/Ki) лежат в  некоторой  окрестности векторной плоскости                           (в других ставках – в окрестности гиперплоскости) и можно записать   для них

 

Для  «ЗА»    1/Kv+1/Kh+1/Kp=1+έ                                 ( 1 )

 

Для «ПРОТИВ»  1/Kv+1/Kh+1/Kp=1-έ                έ—положительное число  порядка  0,02—0,06

 

При таком положении относительно векторной плоскости (Рв+Рн+Рр-1=0     (Рв,Рн,Рр)  рассматриваем как вектор )  например для ставок  В Н П                                          ни каких вилок как с одной так и с другой стороны  для данного набора создать невозможно – таким образом

интересы сторон в этом отношении соблюдены .

Когда  коэффиц. приходят в движение  то для фиксированного момента времени  динамический набор

можно формально считать статическим  и в нём действуют те же соотношения   (1 )

 

Такое положение вещей неизменно приводит к возникновению динамических вилок, а так же спекулятивных

конфигураций  в  конкретной позиции (например в Н).

 

Полезно понимать также—что происходит на бирже при её функционировании.

Все инвесторы торгующие на рынке имеют разные ивестиционные горизонты, также можно сказать что информация  которая важна для каждого горизонта различна. Источник ликвидности на рынке—инвесторы с разными горизонтами (различной информацией и как следствие---различными  представлениями о справедливой (подходящей) цене. Мнение некоторых игроков--что биржа спортивных ставок является упрощённой копией например Форекса не совсем верно. На бетфаир мы имеем консолидацию процессов функционирования биржи, игры самих команд (которую можно в каком-то смысле рассматривать как множество генераторов           (в зависимости от пренадлежности к группе) новостных прорывов---т.е формально как например информацию об изменении процентных ставок, состоянии экономик итд итп. т.е информацию способную быстро изменить психологию игроков. Для бетфаир например –буксование команд, забит гол  итд.) и  непосредственно участников торгов—игроков.  На бирже спортивных ставок игроки в разное время входят в рынок в разное выходят и торгуют разное количество пунктов—за щет этого создаётся  процесс в каждую точку которого игроки приходят из разных начальных точек  и с разными запросами на получение прибыли (или убытков) если бы этого не было биржа просто встала бы и превратилась в подобие обычной букмекерской конторы.

 

Исходя из сей приамбулы  следует  как-то разграничить стратегии игры для бетфаир. При этом  торговля с использованием трендов представляется мне не менее сложным мероприятием чем для обычной биржи. Часть торговых индикаторов (осцилляторов) в ин-плее часто  не работают так как они должны, во вторых --- на нашу стратегию (с точки зрения различных оценок) накладываются возможные события, время наступления которых нам не известно (мы можем оценить лишь возможное их число которое будет влиять на вероятность дефолтовых ситуаций для некоторого временного отрезка.), в третьих: проблема в трактовке горизонта---если мы играем ориентируясь на количество пунктов, которые собираемся наторговать, то скорость изменения тренда будет влиять на временной горизонт (когда мы например должны выходить из торгов), а этот временной промежуток когда мы вошли и вышли совместно с моментом входа в рынок T_in (так как это тоже важно—например мы что-то вымучиваем в конце игры) тесно связан с    информационной составляющей которую нам желательно знать (спрогнозировать, оценить итд) заблаговременно. Провести такой анализ, просто припав к экрану монитора тупо наблюдая за движением тренда—невозможно! Если вы конечно родились в золотой рубашке, то флаг вам в руки. Исходя из этого целесообразно создавать стратегии, где мы можем более менее контролировать ситуацию---иметь некоторые оценки, статистику итд….При этом необходимо понимать, что на любой бирже присутствуют как крупные так и мелкие игроки и последние чаще всего попадают. Поэтому желательно идти на биржу не с постулатами толпы, а со здравыми концепциями игры, которые лучше обкатать виртуально или маленькими суммами. Боты (типа Bfexplorer PRO , FairBot , BetAngel , BetTrader Evolution , Geeks Toy , BetFair and Square ….. итд ) по сути дают вам лишь молоток, но без гвоздей---что-то построить в плане стратегии приносящей прибыль при таком положении дел  сложно (всё будет можно сказать на соплях), с другой   стороны  «забивать гвозди  только головой» -- тоже не вполне здраво…..

 

Попробуем  дать некое (чисто условное) деление стратегий  базирующихся на разных механизмах оценок.

 

1. Игра на   до матчевом  движении  линии (линий)  (тут возможны и вилки с другими БК)

2. Игра как в обычной бук. конторе с частичным спасением ставок при явном преимуществе.

3. В ин-плее используя обвалы рынка (при забивании голов)

4. В ин-плее – торговля на повышении или понижении

  А) на одной позиции (горизонтальная)

  Б)  используя динамические вилки

Можно использовать более сложные механизмы ставок на группу событий используя

                   и нестыковки в линиях.

5. В ин-плее используя текущие оценки (т.е. ставка делается по ходу игры при наличии перевеса над текущей линией)

6.Ставки-последовательности с плавающими горизонтами ( последовательное открытие-закрытие позиций (возможно с частью убытков)) .

 

 

Рассмотрим  скачки (дефолты) при забитом голе.

 

 

 

 

 

 

Образуя кластеры с помощью моделей мы можем не только выделять пары со сходными свойствами для интересующей нас линии,

но иметь определённую статистику по которой можно сделать определённые оценки для некоторых ставок.

SST=Pz1[(Ko/Kt-1)*0,95+1]-1 >0  Ko-начальный коэфф. «ЗА»  Kt-коэфф «ПРОТИВ» после забитого

гола. Pz1-вероятность забить первой для превосходящей команды (которая формально сильнее по данным)

Ps является грубой теоретической оценкой  для вероятностей забить первыми.

Среднестатист. прибыль приводится для равных прибылей при наступлении «за» и «против»

 

 

Ясно что коэфф Kt сразу так не упадёт (если не конец матча) и реальная sst будет отрицательна.

Если 1/Phnn велико после гола, то может рассматриваться продолжение—ПРОТИВ Н для некоторых пар .

 Для первого гола по модели может быть просчитана любая стратегия (например против Н с последующей ставкой ЗА)

При этом совершенно очевидно что работоспособность стратегии будет существенно зависить от пар которые мы

выбираем для подобных ставок, а выделить однотипные пары для стратегии без модели очень сложно (практически невозможно,

если мы охватываем большое число ставок и лиг)

 

Убедитесь что для некоторых групп играть ПРОТИВ Н с последующей ставкой ЗА после гола не актуально (убыточно).

Для ставки против ничьи с последующей ставкой «за» при забитом голе для равных прибылей получим:

SST=0,95*(1-Р00)*(Kt-Ko)/(Kt*(Ko-1))-P00    Ko-коэфф против   Kt- текущий после скачка (коэфф за )

Таким образом ожидаемый размер скачка  должен  соответствовать нашим  потугам заработать.

 

 

В общем случае очевидно выражения для ожидаемой прибыли (убытков) на дистанции для одной позиции будут следующими

 

PR(back)=Si(Ki-1)-Qi(τ)       PR(lay)= Qi(τ)/(Ki(τ)-1)  -  Si          Si—ставка в момент to (считаем что ставим изначально ЗА если играть на повышении , то соответственно

первая ставка будет ПРОТИВ(lay) с обязательствами Qi ,  а временной горизонт будет соответствовать ставке ЗА Si(τ) )

 

SSTi(to, τ)=0,95( Pi* PR(back)+(1-Pi)* PR(lay))   где Pi- вероятность наступления события i

Если мы играем по нескольким позициям, то очевидно необходимо просуммировать SSTi

Для простоты можно рассматривать игру с равными прибылями или игру на границах (т.е. когда ставка ЗА или ПРОТИВ только компенсирует потерю противоположной без прибыли.)

 

Рассмотрите самостоятельно распределения для разных сочетаний групп команд. При этом видно что 15-ти минутные интервалы, которые часто

используют--- слишком грубы, и  нам  необходима и более мелкая сетка ---7-8 минут   при этом начальные и конечные значения можно детализировать

сужая интервалы (например начало и конец матча).

 

 

 

 

 

.

Для того чтобы создать распределения нам нужна временная матрица, для всех рассматриваемых нами случаев( в нашем примере для первых забитых) из которой мы выбираем данные для интересующего нас кластера (в нашем примере ХХ-кластера) и интересной нам ситуации, которую мы исследуем.

Получить данные временных меток можно обрабатывая например комментарии (или получать данные из других источников).

 

 

                          Предположим нами получены нормализованные трендовые функции     TR1(W,T)   TR2(W,T)  , тогда очевидно F1(W,T)=Pz1*TR1(W,T)   F2(W,T)=Pz2*TR2(W,T)

                          Нормализация заключается в делении функции тренда на площадь им ограниченную на отрезке Т0-Т90   TR= fTr(W,T)/S(0-90)

    Зная вероятность забить первой мы можем считать что она распределена сообразно этой кривой на на всём интервале (90 мин.)

 

 

 

 

 

Предположим мы играем на не очень большом интервале или интервале где для простоты рассуждений можно считать что тренд коэф-та  линейно растёт,

                             тогда за τ если мы вошли в момент to коэфф. увеличится на  ξ*τ ,  ξ=∆К/∆Т—скорость изменения коэфф. (т.е. тангенс угола наклона тренда коэффициента).

                             Обычно торгуют некоторое число пунктов m  m*d=M –изменение коэффициента    d-число приращений на один пункт.

                             При известном ξ  необходимое время для того чтобы наторговать М  очевидно τm= М/ ξ ,  отвлечёмся пока от пунктов и для простоты понимания привяжемся

                             к  временному горизонту τ . Для простоты также будем считать что мы имеем стационарный поток в интервале (λ=const) и не будем пока особо рассматривать

                             внутренние точки интервала, а будем ориентироваться на горизонт. При этом следует оговориться и  усомниться---насколько правомерно можно считать что

                             в конце матча например наша F(t) будет отражать истинное положение дел . Мы можем с таким же «успехом» полагать что команды имеют специфику

уже в самом кластере. Мы же в нашем примере считаем исходя из F(t) —если команда грубо говоря буксовала весь матч, то и вероятность отметиться в его конце – мала. Если мы рассматриваем другую F(t) то сообразно ей и будет умозаключение (которое может быть и обманчивым --- как было сказано).

Поэтому это обстоятельство требует прояснения. К сожалению каких-то чётких рекомендаций я дать не могу ибо не занимался подробно этим вопросом, но попытаюсь определить кажущееся мне перспективным направление.

                             Будем рассматривать, для очевидности логики рассуждений, выражения для равной прибыли (хотя можно выписать всё в общем виде).

                             При наступлении события против (мы играем на повышении и следовательно наша начальная ставка в момент to будет «против» и по ней мы отвечаем

                             обязательствами  Q ) будет прибыль:   Pr=0,95(Q/(Ko-1) -Sτ)  где Ko—коэфф(«против») в момент to, Sτ---размер ставки «за» на горизонте.

                             При наступлении события «за»  прибыль (убыток) определяется выражением  0,95(Sττ -1)- Q)  , Кτ— коэфф. на горизонте.

                             Тогда для равной прибыли от двух ставок можно записать PR(=) =[0,95Q/(Ko-1)]*[( Кτ – Ko)/ Кτ]

                             Для горизонта известны оценки  P1=P1(to , τ )    P2=P2(to , τ )    P0=1-(P1+P2)  определяемые по своим функциям распределения для ком.1 и ком.2.

                             То есть на интервале у нас могут наступить три события: 1—забила первая  2—первый гол забила вторая и 3—ни кто не забил. Именно для третьего

                             случая мы рассматриваем  торговлю, а остальные дефолты, но один положительный для нас, а второй отрицательный. Допустим мы ставили против

                             первой (пусть более сильной команды), тогда если забила-1 тренд резко упадёт на ∆Кн из некоторой внутренней точки to+τх  , можно для простоты

                             положить её to+τ/2 (средина интервала) и новый кефф.  Кн=Ко+ ξ*τ/2-∆Кн  т.е. нам нужна оценка мат.ожидания величины ---∆Кн (Ко, to), которую

можно получить перелапатив базу данных трендов биржи (долго играющие на бирже всегда примерно знают на сколько может упасть или возрасти кеф          так как ситуации имеют свойство повторяться). Чтобы не слишком заморачивать читателя примем в качестве Кн=Ко+ ξ*τ/2-∆Кн ≈ Ко-∆Кн  так можно

даже в ряде реальных случаев полагать  так как кеф. падает (возрастает) на дефолте часто заметно больше чем он «корячился» на тренде.

 

 

 

                             Тогда пока для равных убытков (хотя можно и нужно играть иначе) в случае неблагоприятного дефолта  

                             PR(-)=-0,95Q*∆Кн/[(Ko-1)*( Ко-∆Кн)]  оставлен для простоты коэффициент 0,95 так как мы завысим оценку вероятности для неблагоприятного случая.     

                             Это событие имеет оценку Р1(её можно завысить в формуле для SST).

                             Для благоприятного для нас дефолта имеем: PR(+)=0,95Q*∆Кв/[(Ko-1)*( Ко+∆Кв)]  с вероятностью Р2

 

                             Тогда  MO(Q=1)=SST=b=[0,95/(Ko-1)]*[P2*∆Кв/( Ко+∆Кв)- P1*∆Кн/( Ко-∆Кн)+P0*( Кτ – Ko)/ Кτ ]

 

                             Из которого следует  выражение определяющее скорость тренда на to—to+τ                                                                                ξ*τ > Ko*(b-0,95D) / (0,95(P0+D-b))

                             Где  D= P2*∆Кв/( Ко+∆Кв)- P1*∆Кн/( Ко-∆Кн)

                             ЗАМЕЧАНИЕ: % подсчитан от обязательства, что на самом деле не вполне корректно.

                             Так как мы задействуем и сумму для ставки ЗА, то надо исходить для срогого вывода из

                             общей суммы задействованных средств для проведения торговой операции (спекуляции) 

 

    Например для    Р1=0,15  Р2=0,1  Ко=1,7  ∆Кн=0,5    ∆Кв=1 для 8-ми минутного интервала для нулевого баланса имеем вроде бы

  конечный кеф. не очень большой (т.е без проблем торгующийся) Кτ=1,76 , но вот для 7% прибыли он 1,96 , а для 15% его оценка  2,24 .

    Посчитайте сами. Данные немного утрированы чтобы подчеркнуть невозможность интуитивной оценки данной ситуации. Поскольку наши оценки вероятностей сами случайные, то резонно, как было сказано, искусственно завышать или занижать некоторые из них. Теперь остановимся на финальной точке нашей торговли. Представьте что вы играете в шахматы, совершенно очевидно,--что вы будете стараться продумывать не один ход, а некоторое количество шагов вперёд оценивая вероятное поведение противника. Мы конечно не в шахматы играем, но тем не менее мы должны иметь оценку и в нижних или верхних точках дефолта---мы например можем закрыть позицию завысив ставку ЗА для нашего случая . Возникает вопрос –сколько ставить? Без оценки вероятности как матч закончится или каковы возможные продолжения по голам и какова их вероятность мы эту нижнюю ставку (для нашего примера) грамотно не сделаем. При этом мы можем ориентироваться на сделанный анализ для перестраховки, а ставку выбирать наилучшим образом. Благо у нас есть некоторые инструменты для этого чтобы провести анализ.

                             Знание даже приближённых оценок и тенденций может заметно поднять качество вашей игры, хотя от попадания в убыток    ни кто не застрахован.

                             Иногда бывает ситуация, например, при игре «против» Н с последующей «за»  для некоторого вида пар что если тренд продолжает расти после дефолта

             можно  поставить через некоторое время ЗА  с запасом (то есть как бы закрыть позицию и формально играть за ничью некоторой суммой –возможно до   упора)

                        

 

 

                             Остановимся теперь на вопросе—что реально может происходить во временном интервале нашей сетки (или выбранного небольшого интервала). Рассмотрим небольшой интервал времени (например 7-8мин.) и будем для простоты считать что в этом интервале мы имеем постоянный поток

00→01  (замечание: для следующих переходов наприме 01→11   мы функциями F(t) построенными по аналогии  воспользоваться не можем).

 

   Приведёнными формулами можно попробовать описать поведение коэффициентов в инплей (желательно вводя поправки используя уже прошедший интервал наблюдения, например по минималному среднекв. отклонению от точек рынка). Фрмулы будут практически мало отличаться от формул для линий (приведённых для бином.. распределения). За оценки потоков в этом случае бурутся оценки инплейного рынка (грубо говоря через коэффициенты находятся оценки потоков)  Если мы заставим команды играть много раз и наблюдать за каким-то интервалом  то данные выражения определят возможное число голов в нём через вероятность при условии стационарности потока (имеется в виду от одной команды) . 

Ясно что мы получим разное их число, но вероятности будут близки к найденным (если поток стационарный). Ожидаемое значение интервала между голами будет определяться  как  1/λ , но и  отклонение велико и равно тоже 1/λ , а это значит что событие может произойти в любой момент в

рассматриваемом интервале.  Например для   λ= 0,164/8=0,0205    tsr≈49 мин.     λ= 0,116/8=0,0145   tsr≈69 мин.  τ=8мин.   Совершенно очевидно -- что внутри   этих промежутков tsr и за их пределами  может быть гол. Если совсем просто объяснить, то если мы возьмём две команды  для которых известны средние показатели голов за матч между ними (например по 20-ти матчам) и поделим на 90 минут, то это будут средние потоки. Тогда вероятности числа голов в матче

 определятся по Пуассону.

 где а—среднее для команды.  Под потоком уместно подразумевать поток голов.

Исходя из всего вышеизложенного в ряде случаев, за не имением лучшего, возможно уместно даже ориентироваться                         на λsredn= МО(Г)/90  

Не смотря на то что тренд  например на конечном участке F(t) может иметь нулевые значения мы команды без какой либо голоспособности оставлять не можем и следовательно есть смысл  задаться некоторым (страховочным) значением для обеих команд (например 50-75% от среднего).

             То есть нижняя грань всегда должна быть (не смотря на тренд)---можно в связи с этим взять другой механизм формирования F(t) по тренду TR .

Игроки могут также использовать  модели которые прогнозируют поведение рынка и на этой основе могут строить механизмы игры, однако  надо изначально знать каковы будут погрешности чтобы учитывать их при расчёте прибыли и убытков.......

 

Теперь хочется остановиться на предложении ряда публикаций торговать до начала игры , используя

изменения в линии. В чистом виде (как это предлагается) это бред сивой кобылы, так как не предлагаются

механизмы оценок возможного направления движения тренда. Так как нас интересует момент выставления

линии , то особо долго ждать мы не можем . Разумеется когда тренд «торкнуло», то можно предположить, понаблюдав за ним , тенденцию движения (однако она может поменяться ), а во вторых мы не можем контролировать огромное число событий ,а сидеть над одним трендом сутки на пролёт ни кто не будет !

Технология может быть разумеется  реализована в автоматическом режиме, но мы в любом случае должны прописать в БОТе алгоритм входа и выхода из

торгов с  учётом  удачных и неудачных входов и выходов в торги.

Поэтому мы должны определить объекты нашего внимания сразу—в момент выкатывания линии . Это можно сделать зная оценки модели (минимальные коэфф) и вероятности  движения тренда при определённых соотношениях коэфф рынка и нашей оценки . Объясним «на пальцах»--пусть при Кмин принадлежащей некоторой полосе (которую мы исследовали) и положительной разнице >∆=К-Кмин

тренд понижается с вероятностью Рниз  и падает ниже К*(..) с условной вероятностью Р(ниже  К*/начал падать) .Тогда для перестраховки можно считать что мы не ждём когда тренд «торкнет» , а ставим сразу , тогда учитывая что К*-функция от ∆,Кмин можно сделать некоторые грубые оценки для объекта торговли.

(для реальных ставок мы конечно должны проконтролировать что выбранные объекты начали движение в нужном направлении)        SST≈0,95(К/К*-1)*Р(нижеК*/нач.пад)+(1-Рниз)*▲   ▲=К/Квыше -1  (выходим с убытком) При  К=2,1  К*=1,9   Р(нижеК*/нач.пад)=0,5   Рниз=0,7  Квыше=2,2 получим  SST=0,04 те 4% из формулы видно ,что если  мы дождёмся  когда тренд «торкнет» в нужном направлении ,то прибыль может заметно возрасти так как член (1-Рниз) формально будет отсутствовать . Из формулы так же видно что если мы сделаем ставки сразу (опорные) то точность прогнозирования должна быть достаточно высока (в нашем примере лучше 0,7 ) в противном вы будете даже в убытке с такими  рекламируемыми стратегиями . Вероятность что мы на большом числе ставок где-то «проколимся» с оценками достаточно высока и поэтому при таких мизерных % все наши потуги могут быть  «сожраны» одной ставкой.

            То есть у данной стратегии  если мы не учтём все нюансы  риски  будут достаточно высокие.

Думаю читатель согласиться что для того чтобы понять и тем более  описать языком формул все «приблуды» матча надо не один букварь скурить, совершенно очевидно что команда пропустившая гол может включить все свои ресурсы и ответить достойно—т.е. получим очевидную взаимосвязь между событиями, но может произойти другой  эффект—прямо противоположный (первая вдохновится—вторая  приувянет итд итп). Как это описать?

Это очередной раз подчёркивает  важность наличия опыта, интуиции да и удачи в некотором смысле. Исходя из этого мы должны иметь систему анализа, которая преосмысливала бы данные предварительного анализа и адаптировала их к протекающему матчу по уже прошедшему временному отрезку(т.е можно в некоторых случаях говорить о шаблонах). 

Не надо быть мудрецом, чтобы понять ---если мы ожидали 1 гол в тайме а там 3 на 43-ей  минуте, то надо выбирать альтернативную расчетной модель. Это обстоятельство также накладывает серьёзные ограничения на наши стратегии, которые исходя из сказанного должны быть максимально «гибкими», а не «гиблыми», а по сему большенство «выигрышных» стратегий для биржи --блеф. Реальную стратегию ни кто не продаст!

Когда мы рассматривали трендовые функции     TR1(W,T)   TR2(W,T)  , F1(W,T)=Pz1*TR1(W,T)   F2(W,T)=Pz2*TR2(W,T)

Нормализация заключалась в делении функции тренда на площадь им ограниченную на отрезке Т0-Т90   TR= fTr(W,T)/S(0-90)

 


Мы сделали оговорку—что эти данные можно использовать для приближённых оценок

на начальном участке матча. Теперь давайте разберёмся почему.

Рассмотрим опять наши распределения для временных участков для каждой команды.


Обозначим через ni  mi число событий попавших в соответствующий интервал соответственно для 1-ой и 2-ой команды. Тогда очевидно вероятность того что

1-ая ком. забьёт гол первая  Pz1=A/N , для второй соответственно  Pz2=B/N ,

где N-число всех пар кластера А=∑ni   B=∑mi   L=N-(A+B)-число нулевых исх. 0:0

Тогда если на участке to-tx  ни кто не забил, то мы должны формально рассматривать

новое множество W(tx;T)  с новыми параметрами

Pz1=∑ni/(L+∑ni+∑mi) где суммирование ведётся от tx до T для нашего рисунка

индекс i=3,4,5,6  для второй команды вычисления такие же

Pz2=∑mi/(L+∑ni+∑mi)   очевидно  L+∑ni+∑mi (i=3…6)  = N-∑(ni+mi) (i=1,2) т.е слева

сумма(интеграл) от tx до T , а справа от  to до tx .

Таким образом по мере удаления от to (начало матча) мы должны постоянно пересчитывать данные (и строить новые тренды) возможно вводя другие интервалы

дискретизации, что усложняет вычислительный процесс. Однако для начального

участка мы можем положиться на исходный тренд ранее описанный, осознавая

тот факт что чем дальше мы двигаемся тем больше погрешность оценок. В виду малого

числа данных в кластере оценки не могут быть с приемлемой доверительной вероятностью для большинства кластеров и это полезно осознавать и вводить некоторые страховки в виде поправок в худшую для нас сторону (чтоб не остаться с голой Ж.) Выходом как ранее отмечалось может быть—собрать в кластер данные предыдущих сезонов (хотя бы для того чтобы сравнить оценки).   

В самом простом варианте алгоритм может состоять в следующем—сдвигаемся на один

интервал, выводим из кластера пары этого «отработанного» интервала и работаем с новым

«кастрированным» кластером, где все манипуляции будут такими же. При этом мы

опять можем доверять данным только в начале движения из пункта «кастрации».

Показательным будет посмотреть как меняются наши представления о вероятностях

некоторых событий в конце матча. Предположим что мы имеем некоторые данные

а именно n6=3  m6=2  L=8  N=40 A=20  B=12  исходя из начальных трендов мы

можем (ложно) полагать что Pz1(i=6)=3/40 Pz2(i=6)=2/40 что интуитивно полагают

многие игроки видя распределения наших статистических сайтов. Возникает вопрос—

куда прилепить в этих оценках P(0:0) на конечном участке (i=6) P00=8/40 ясно, что

сумма этих оценок не равна единице. А по сему наше представление должно, исходя

из наших данных, быть следующим Pz1(6)=3/(8+3+2)=3/13  Pz2(6)=2/13   P00=8/13.

Таким образом если наблюдаемая пара не забила на предыдущих временных интервалах,

то интуитивные оценки для последнего интервала могут быть обманчивы для некоторых игроков. Так как данных в некоторых  интервалах может быть мало, то резонно вводить

худшие для нас поправки в оценки (например добавляя или уменьшая число исходов

на 1-2 в интервале) получая тем некую страховку. Для сравнения—если бы мы например

имели для первой команды для первого промежутка по оценкам в кластере n1=8 тогда

Pz1(1)=8/40 меньше чем для Pz1(6) что по распределению, которое вам преподносят

явно не усматривается (тем более если, оно для лиги а не для кластера).

Исходя из изложенного мы можем строить тренды и лишь для начальных участков или ориентироваться на первый интервал (после отсечения данных) и для него рассчитывать оценки (от трендов можно и отказаться).

Замечание: от трендов можно отказаться если в кластер собрано достаточное число пар (например за 2 сезона)
и мы проводим общий анализ (чтобы было с чем сравнивать текущие оценки)
Привлекательность кластеров состоит в том что при их "кастрации" появляется возможность переоценок вероятностей
по ходу игры (что многие игроки вообще не мыслят как осуществить). При этом в виду того что кластеры могут
формироваться сообразно разным критериям (подогнанным под линию или линии) то у нас появляется много
дополнительных инструментов для анализа не только на бирже но и по ходу игры в обычных БК) 

В книге по сути описаны три модели произростающие из одной общей концепции и их есть мысл использовать совокупно
при первоначальном анализе лиг с которыми мы начинаем работать или хотим уточнить результаты уже проделанной
работы. Их различие состоит в механизмах учёта влияния полей (дома-гость) на характеристики приписываемые командам
по которым можно не только определять вероятности но и осуществлять деление на группы в которых можно уточнять
детали исходя из дополнительных условий. 

 
Думаю что разумный читатель понимает--- что для того чтобы иметь хоть какие-то намёки на успех необходимо «переварить» немало информации….

Следует заметить что кластеры (группы) можно образовывать по совокупности критериев, которые
группируют данные. Например  [SSFORA.>1]&[P(TOTAL>2,5)>0,7] теперь для этой группировки можно
посмотреть вероятность тотала TOTAL>2,5 и так далее и тому подобное...
 ПЕРЕЙДИТЕ ПО ССЫЛКЕ
И ПОСМОТРИТЕ КАК ПРИМЕРНО РАБОТАЮТ МОДЕЛИ
можете попробовать вставить какие-то свои данные предварительно подготовив их в эксель
при этом в ячейках из которых вы будете их копировать в буфер должны быть только значения.
Для эксперимента лучше используйте закрытую подгруженную матрицу (матрицу в которую подгружаются свежие данные)
это оттносится и к Д/Г матрице вторая Д/Г матрица соответствует предстоящим играм (т.е. которые прогнозируем)
По первым данным находятся параметры модели но имейте в виду --для их подбора алгоритм проводит
всего четыре итерации (поэтому точность может оказаться не высока) на бесплатном хостинге скрипты  не работают
поэтому это как альтернатива вполне сгодится для демонстрации. Вы можете ввести и часть данных
которые готовите, а якобы несостоявшиеся туры заменить символом заполнителем 99, можно попробовать
тянуть окно таким образом из 10-12  последних туров так как закрытые матрицы очень инерционны
чтобы качественно отражать динамику в лиге (окна могут в свою очередь быть черезмерно чувствительными
поэтому  данные определяют по множеству окон приписывая веса окнам при этом последниие окна
имеют больший вес....) Одним словом лучше посмотрите на деле (в самом простом варианте замените часть игр на 99
при этом пары симетричны относительно главной диагонали)
Матрица отражает количество забитых командой в строке команде в столбце. Матрицы-шахматки пусть статисты засунут
в известное место.....с ними работать не получится ...... Для реальных прогнозов такую простейшую модель тоже можно
использовать но учитывать что она ограничена пятью голами (в голоспособных лигах можно взять 6) для больших фор лучше
посмотреть линии по форам или тоталы итд итп (а для буксовальщиков можно и по счёту проставиться).......
Эта модель приведена для возможности поэкспериментировать, на деньги не следует играть так как для этого
проводится серия дополнительных мероприятий которая тут не описана(исследуются полосы вероятностей--как
они прогнозируются, как отсекаются коэффициенты, выявляются линии и полосы где можно играть и  так далее)ДЕМОНСТРАЦИОННАЯ МОДЕЛЬ РАСЧИТАНА НА ЛИГИ ИЗ 20-ти КОМАНД  (с меньшим числом работать не будет)!!!
D G матрицы формируются по аналогичному принципу с матрицей игр и относятся к команде в СТРОКЕ
(необходимо понимать смысл получаемых по моделям данных--это ожидания и если у вас SSFORA=1, то
это совершенно не означает что разница в данной игре будет такова, а если вероятность больше то это не
значит что команда непременно выиграет или будет такой-то счёт и так далее..... счёт может быть любой!)
Для демонстрации приведена самая неудачная (с моей точки зрения) модель. При определении параметров
можно исходить например из следующих соображений--приписать команде параметр А и ввести поправку Е
учитывающую гостевое и домашнее состояние или разделить модель какбы на две независимые и определять
параметр А для дома и параметр В для гостевого состояния, но эти два механизма имеют недостатки---
для первого Е постоянно, а для второго варианта мы сокращаем объём выборки поэтому для базовой модели
описанной в книге было принято ввести плавающие Д/Г поправки (зависящие от пары i-j) за щет  этого базовый параметр
А ----определяется по всем данным, а поправки по разделенным на два множества параметрам. Поскольку
порядок поправок меньше базового параметра то это уменьшает погрешности модели и увеличивает доверие
к основному (базовому параметру (или параметрам если использоавать более сложные модели) который и
определяет распределение на  условной дуге между командами. Не смотря на всю эту многословность модели
получаются очень простые и понятные для любого обывателя.
Приведена достаточно неудачная полоса для модели, чтобы читатели поняли что очень важным
является отслеживание динамики команд, а также дополнительные интуитивные оценки
позволяющие сдвигать оценки моделей в зависимости от дополнительных факторов и информации
которую модель не   учитавает. Идеальных моделей построить невозможно и наши оценки всегда
будут иметь погрешности (больше или меньше в зависимости от модели)
Более подробно можете почитать об этом в статье  "Проблемы Value Betting"..

На практике в оценки вероятностей вводят искуственно погрешности и смотрят -- остаёмся ли мы в области положительного баланса и какие имеем показатели SST(мат. ожидания)  и риска итд итп.
При дисбалансе прогнозирование будет плохое поэтому при непонимании какой баланс должен быть
в данных лучше подгружайте матрицу чтобы она была заполнена (при этом в Д/Г матрицах по которым определяются параметры модели  должно быть близкое по строке число игр дома и в гостях). Лига должна исповедовать принцип достижимости лучших результатов на командах с худшими показателями .Если лига плохо прогнозируема то лучше отказаться от неё-- лиги надо подбирать или ограничиваться небольшой частью игр в неадекватных для модели лигах)

value bets в инплей

Немного математики (пример расчёта для ставок «против»-«за»)

 

Коо-кефф на 0-0 НТ (или полный матч если исследуют вариант на весь матч)

tx –точка входа  ty-точка выхода

На самом деле за точки можно брать и размеры кефоф пересчитывая их в соответствующие временные параметры…можно и смешанный вариант кефф—время  или время---кефф для точек вход—выход.

 

MO1+MO2=MO=LN(Koo)

L=MO/46—интенсивность потока

Kx =EXP(L*(46- tx))*1,05  для всего матча не 46 а 94

Ky =EXP(L*(46- ty))

 

Или можно вот так

Kx=EXP(L*(46- tx))      IN

Ky=EXP(L*(46- ty))/1,02  OUT

 

Пусть

 Е—это доля забитых первых голов от вала  в интервале  [tx;ty] вычисляется делением числа голов N в интервале на вал  (вал =общее число матчей минус число матчей N где забито до tx)

1.05  и 1.02—это коэффициенты учитывающие спред (как бы маржу) их можно другие взять это просто пример…надо учесть и следующее—спред сужается и там надо экспериментально попробовать подходящие более менее пропорции (вполне возможно что эти поправочные коэффициенты можно взять не фиксированными, а типа функции---простейшая А*Х+В линейная  Х суть EXP(E*(46- tx)))

 

Баланс на дистанции (похоже на К*Р-1 по сути)  входим—ставкой «ПРОТИВ»  выходим ст. «ЗА»

BALANS DIST= Е*0,935/(Kx-1)+(1-Е)*(Ky-Kx)/(Ky*(Kx-1))

 

(     Примечание:  формально играем на кефе Кигр=1-(0,935/(Kx-1))/((Ky-Kx)/(Ky*(Kx-1)))     )

 

Надо заметить вот что ---- функцию BALANS DIST не рационально брать в качестве целевой функции

для оптимизации (нахождения максимума)—это связано с тем что система возьмёт маленький интервал в окрестности наибольшего скопления голов в кластере и покажет его вам в качестве решения, но там будет мало матчей и маленькая доля Е    …Игрока в первую очередь всегда интересует получение максимальной прибыли с совокупности (с некого множества игр)  поэтому тут рационально отталкиваться именно от этого.

Что тогда надо? Надо хотя б формально определиться с долей которой мы будем играть от банка---возьмём например 0,75 Келли (хотите можете другое—например 0,5 келли  итд итп)

Тогда вот что получим  %Bank=  = BALANS DIST /( Кигр -1)*0,75 (взяли 0.75 келли)

А целевой функцией будет Fcel= BALANS DIST*%Bank*N ( с дополнительным условием  %Bank>0 )

N-число игр с забитыми голами в интервале [tx;ty] (эта цифра у нас есть так как она фигурирует в расчёте Е-доли)

 

Теперь задача решается в рамках задач оптимизации max Fcel с дополнительными условиями в виде равенств или неравенств (надо наложить ещё допустим вот такие условия (помимо %Bank>0 )  tx, ty >=0  ty<46 (можно тут и 45 взять или другое итд итп.) tx<ty

 

Это только теоретический расклад, который не учитывает главной вещи---функция, которая взята за основу вычисления коэф. на горизонтах входа и выхода, на самом деле не соответствует тем трендам которые реально присутствуют и нуждается в коррекции (это будет особенно ощутимо для других стратегий когда нужны начальные участки ближе к началу матча—там тренд заметно отстаёт от теоретического и в кефах будут расхождение—это связано с тем что рынок формируется несколько минут и бывает что не мало

и там существенные расхождения с расчётом….при желании этот вопрос решаем при наличии  базы данных…)

 

При этом для подобных расчётов нужна большая база данных по временным параметрам голов (в противном Вы получите непредставительные  выборки—малых объёмов).

 

Описанная система например для игр  с участием сильных фаворитов скорее всего будет смещать интервал [tx;ty] к концу 1-го тайма примерно в 41-45 минуты (то есть приблизительно с 40-41 до упора)

Для более точных расчётов выборка(по критериям для команд или всей пары) должна формировать не очень широкую полосу по разбросу начальных кефоф на 0-0 тогда можно взять средний кефф по которому  определяется интенсивность и использовать в функции тренда--по которой рассчитываются  коэффициенты Кх, Кy на горизонтах (то есть не должно быть кефыы там 2.9 и 5 в общей кече на 0-0 HT 

ПОСЕТИТЕ ФОРУМ ПОЛЕЗНЫЙ ДЛЯ ИГРОКОВ  http://www.moneypunter.com/ 

j

30.01.2012
Просмотров (2365)