XG, xPoints и продвинутая статистика российской Премьер-Лиги. Xg в футболе


Что такое xG? Новый подход к оценке эффективности в футболе

xG (или же Expected Goals) — это относительно новая футбольная метрика, статистический показатель основанный на различных формулах, который позволяет оценить эффективность команды или игрока.

В такой игре с низкой результативностью, как в футболе, важность голов настолько же высока, насколько и фактор везения. На всех уровнях часто проходят матчи, где несмотря на победу хозяев со счетом 1:0, например, однозначно лучше в атаке выглядела проигравшая команда гостей. Если раньше это нужно было увидеть или доказывать, ссылаясь на субъективный опыт, то xG дает возможность четко определить, кто в матче выглядел эффективнее, несмотря на счет.

Измеряющий xG показатель суммирует все созданные моменты и провалы в защите у обеих команд, и на основе неких коэффициентов показывает вероятный счет исходя из них. Например, счет в игре между Челси и Бернли первого тура АПЛ был по xG модели BBC 1.55 против 0.64 (в то время как на табло 2:3). На видео ниже аналитик из Opta рассказывает подробно что такое xG и как это трактуют статистические порталы:

 

Когда появился xG

Упоминание первой xG -модели, пусть и очень тривиальной, приписывают бывшему тренеру сборной Норвегии Эгилу Ольсену. С 1990 года по 1998 он прошел путь от молодежки до национальной сборной Норвегии, дважды выводил подопечных на финальный этап чемпионата мира (в 94-ом и 98-ом). В своих интервью он неоднократно утверждал, что даже такой показатель, как количество ударов в створ ворот, может быть более важен, чем итоговый счет в матче. Ольсена часто называли “футбольным профессором” за любовь к цифрам и прагматичных подход к статистике.

Сперва он считал лишь количество ударов по воротам, и на их основе формировал ожидаемый уровень эффективности команды. Позже в своих моделях Ольсен начал разделять удары на три категории, в зависимости от остроты момента, но в итоге пришел к выводу, что это было не нужно. На большой дистанции все три категории неизменно уравновешивались (с небольшим отклонением). Таким образом он строил игру команды отталкиваясь не на результаты и очки, а на более объективные показатели, пусть и в виде ударов. Итак, первые модели xG получили популярность в середине 90-х.

Эгил Ольсен - норвежский Колумб во всем, что касается xG

Правда, тогда их еще так не называли. Библиография xG говорит, что само понятие Expected Goals впервые встречалось в 2004 году в НХЛ. Что же касается футбола, то первые попытки серьезно взглянуть на взаимосвязь ударов и результативности команд в футболе замечены в 2011 году.

Как измеряют xG сейчас

Единственной, удобной и подходящей всем формулы для измерения xG сейчас нет. Существует большое количество различных xG-моделей, каждая из которых может проявить свои преимущества (или недостатки) относительно других только на очень длинной дистанции. Должно пройти какое-то время, пока разные источники статистики утвердят какие-то общие правила подсчета, но уже сейчас можно ориентироваться на крупные площадки. Такие как Opta.

При помощи огромной базы из сотен тысяч примеров, имеющейся у этой компании для анализа, они выделили для каждого опасного момента свои коэффициенты (от 0 до 0,99 в зависимости от того, как часто забивают в подобных случаях на дистанции). Исходя из позиции, положения защитников, этапа игры, расположения вратаря и даже части тела с которой бьет игрок — около 10 параметров влияют на конечный итоговый xG каждого момента. Далее по ходу игры каждый момент суммируется в общий показатель, и уже по истечению всего времени матча мы можем видеть “ожидаемый счет”.

xG-эффективность Харри Кейна в атаке Тоттенхэма

На графике каждый удар Харри Кейна в сезоне 2016/17 изобразили в виде точек. Чем больше точка — тем больший был xG у момента, если точка красная — момент закончился голом. Как и у любого другого игрока, у Кейна было большое количество хороших незабитых моментов, но число реализованных ударов с низкой вероятностью просто поражает.

Какие из моментов сумел реализовать Деле Алли в сезоне 2016/17

Еще один пример по Деле Али. На картинке видны все моменты лучшего молодого игрока АПЛ в сезоне 2016/17. Зеленым обозначены удары, которые привели к голам, синим — удары в каркас или сейвы, красным — удары мимо.

Недостатки большинства моделей

Так как система подсчета вероятности забитых голов по xG только формируется, у текущих моментов есть несколько существенных проблем. Решения для них пока не очевидны, но ознакомиться с ними для понимания ситуации обязательно стоит:

1) Если момент не закончился ударом, то по нему большинство моделей xG не учитывают. Это огромный минус, так как есть очень много случаев, когда игрок либо из-за брака техники, либо из-за внешних факторов не успевает бить по пустым воротам, например. Таким образом если бы удар был выполнен, его xG мог быть 0,98 но так как игрок не отправлял мяч в ворота, то и плюсовать модели (когда модель ориентируется по ударам) нечего.

2) Если в игре получилась ситуация, когда ворота оказались незащищенными (вратарь вышел на угловой, например), игроки с большей вероятностью стараются моментами такими пользоваться, бьют чуть ли не с центра поля. Однако, основанные на аналогичных позициях xG-модели скажут, что вероятность попадания таких ударов стремится к нулю. Очевидно, это не так. Сразу виден более сильный недостаток многих моделей — мало где учитывается расположение игроков обороны.

3) Из-за того, что модель не учитывает мастерство игрока атаки, многие коэффициенты для опытных форвардов не будут верными. Точно также как мы знаем, что средние показатели реализации в чемпионате Венгрии, например, ниже чем в чемпионате Испании, знаем и то, что нападающий в Ла Лиге с большей вероятностью забьет в пределах штрафной площади, чем нападающий Вышки венгерского дивизиона. Но xG-модели никак не учитывают этот момент. Для них есть одна и та же цифра, независимо от полей и исполнителей. Наверное, в этом контексте стоит подумать об индивидуальных моделях для каждого игрока, но что тогда должно быть основой первичных данных?

4) Автогол или пенальти никак не учитывается, берутся только моменты “с игры”. Это одновременно и плюс, и недостаток, поскольку очень часто они становятся итогами опасных атак без ударов. А о проблеме атак без ударов мы уже знаем (смотри пункт 1).

Идеальной ни одну xG-модель назвать нельзя

Это не все недостатки современных xG-моделей, но для справедливости стоит признать, что из года в год они совершенствуются. Технологии все дешевле, обработанных данных все больше. Важно только принять подход, наиболее верный и наиболее эффективный для измерения силы команды.

Будущее xG в футболе

Пока что сложно предсказать, как именно и на каком уровне появление xG будет влиять на самый популярный вид спорта. Но исходя из природы его появления и применения моделей на данный момент, можно точно сказать, что:

— все статистические порталы рано или поздно начнут учитывать xG в альтернативных турнирных таблицах чемпионатов

Если этот показатель настолько хорошо говорит об уровне игры команд, вполне логично использовать его в качестве одного из важных параметров статистики. Любая аналитика перед матчем без изучения xG сейчас — это попытка найти иголку в стоге сена человеком с плохим зрением, который отказывается надевать очки. Ведущие медиа-площадки, спрос на которые напрямую зависит от того, как часто они справедливы в своих прогнозах, это понимают. На Туманном Альбионе и в США, пусть и осторожно, но пользуются показателями xG у всех команд ведущих лиг. Но есть еще одна очевидная сфера, где модели могут пригодиться.

— все ведущие прогнозисты с большой аудиторией скоро будут учитывать, если не учитывают xG уже сейчас

Во-первых, глупо не использовать его тем аналитикам, которые пытаются зарабатывать на ставках. Если есть показатель, способный помочь тебе заработать больше чем ты получаешь со ставок сейчас, ты ним обязательно воспользуешься. Однако, если “вольные игроки”, работающие чисто на себя, могут действовать как сами захотят, то популярные прогнозисты с продажами своих прогнозов будут вынуждены сделать это как можно скорее. Пользователи очень трепетно относятся к трате своих денег, и не будут спускать их на людей, которые не следят за современными тенденциями. Даже если прогнозист прибыльный, незнание того как работает и зачем нужен xG, клиента отпугнет. Имейте это ввиду, конкуренцию никто не отменял.

— в отличие от западного ТВ, в странах СНГ на телевидении никакого xG можно не ждать еще очень долго

Какой там xG, если наши спортивные каналы даже время и элементарное владение мячом не всегда показывают. Все тренды до людей, работающих на ТВ у нас доходят крайне медленно. Для описания причин понадобится отдельный пост (или книга?), поэтому просто примите это как факт: пока США и Европа будет просвещать зрителей новыми статистиками и пытаться углублять знания в своих аналитических передачах, наши комментаторы еще долго будут игнорировать xG.

— обыгрывать букмекера, основываясь на xG можно, но только нашего и недолго

Как мы уже писали выше, тот же Sky Sports занимается xG вплотную. С Opta тоже сотрудничает сразу несколько лидеров рынка беттинга, само собой что за бугром все давно его используют. Пока до наших букмекеров это доходит только под видом “исправленных” коэффициентов на основе линий Bet365 и Pinnacle, но вскоре свои команды экспертов в этой сферы появятся и здесь. А если так, то чтобы быть на пару шагов впереди — стоит учиться использовать его раньше и выигрывать на ошибках местных буков, пока это еще возможно. Серьезно, стоит пробовать, вилками тоже когда-то заработать можно было в рамках одной конторы. Реагируют быстро далеко не все.

Куда заходить и что изучать

Для начала подружитесь с порталом understat.com — поможет понять как собирают данные для ведущих топ-5 чемпионатов. С недавних пор там также показываются цифры и по РФПЛ.

Главная страница одного из самых популярных сайтов в этой теме

В конкретной турнирной таблице чемпионата, в котором разбираетесь лучше всего, посмотрите насколько набранные очки каждой из команд сейчас соответствуют ожиданиям по xG. Куда идет отклонение — набрали больше чем должны были, или меньше? В первом случае команда, возможно, в ближайшее время опуститься на несколько строчек, во втором — займет справедливое место выше на более длительной дистанции.

Также присмотритесь к таблице с голами и ассистами от игроков. Здесь все аналогично: у некоторых из них xG явно больше чем забитых голов, значит реализация вскоре станет лучше. Те же, кто забивают явно больше чем моменты позволяют в среднем, скорее всего в показателях должны потерять.

Далее откройте страницу команды. Для каждой из команд здесь сделали очень обширную по функционалу таблицу, которая позволяет смотреть кто чаще отдает пасы под удар, при каких игровых схемах xG был больше, на каких скоростях лучше реализация — огромный пласт для анализа.

Отсюда изучайте последние сыгранные матчи. Там тоже очень подробная аналитика, которая позволит найти верные взаимосвязи между успешностью тех или иных команд, четче увидеть недочеты в игре каждой из команд.

В заключении пройдитесь по топ-форвардам, анализируя их выступления как в отдельных матчах, так и в прошлых сезонах глобально. Это позволит вам предсказать, в какой форме к следующему отрезку чемпионата подойдет тот или иной лидер атаки, и какие последствия это окажет на результаты матчей.

Итоги

Как видите, если пару лет назад еще можно было считать анализ при подготовке к матчам делом сложным, то сейчас он со скоростью света упрощается. Появление xG — это не просто еще одна возможность подробнее изучить матч, это прямой показатель того, как технологии в спайке с Big Data и нейросетями упрощают аналитикам жизнь. Все становится доступнее, главное уследить за главным и научиться как можно более точно определять, какие факторы в анализе являются ключевыми, а какими на дистанции можно пренебречь.

otstavka.net

Как xG захватывает мир футбольной статистики - Hello - Блоги

Блог Hello подробно рассказывает об одном из самых важных и недооцененных статистических показателей.

Эгил Ольсен – бывший тренер сборной Норвегии и автор одной из первых xG-моделей

Что такое xG?

xG («expected goals») – это модель ожидаемых голов. В основе такой модели лежит показатель (как правило, удары по воротам – это не всегда удары по воротам, но на данном этапе будем отталкиваться от того, что они и есть наш показатель), который помогает заглянуть дальше счета на табло и оценить, сколько голов при прочих равных должна была забить команда с ударами такой остроты.

Каждому удару каждой команды присваивается коэффициент опасности (в каждой xG-модели он присваивается по-разному, с конкретными примерами разберемся позже). Коэффициенты суммируются – мы получаем что-то вроде альтернативного счета матча, основанного на качестве созданных каждой из команд моментов. Следует оговориться, что в качестве базового показателя не всегда выступают удары по воротам (иногда это удары в створ, в одной из последних моделей и вовсе передачи в «убойной зоне»).

Еще не заснули? Тогда вот вам любопытный факт/полезный пример. Автором первой относительно известной xG-модели можно считать Эгила Ольсена, тренера сборной Норвегии на ЧМ-1994 и ЧМ-1998. «Я не в состоянии доверять победе со счетом 1:0, если мы нанесли всего один удар, который стал голевым, а соперник бил по воротам 10 раз. Точно так же я никогда не стану зацикливаться на поражении со счетом 0:1, если у моей команды было 10 ударов, а у соперника – 1. В плане измерения того, насколько хорошо или плохо сыграла команда, удары по воротам даже более важный показатель, чем сами голы», – высказался однажды он.

Ольсен признавал, что не все удары равны, поэтому однажды он решил разделить удары по воротам на 3 категории: «очень большая перспектива гола», «средняя перспектива гола» и «гол практически исключен». Вооружившись этой простой моделью, Ольсен провел немало исследований и пришел к неожиданному для себя выводу – переход от простого подсчета ударов к модели с 3 категориями не оказал практически никакого влияния на его исследования. Как правило, на дистанции количество ударов разных категорий уравновешивалось.

Конечно, система и ключевой вывод Ольсена были далеки от идеала по банальной причине субъективности модели, которую, откровенно говоря, смешно сравнивать с современными аналогами, учитывающими в каждом ударе десятки объективных факторов. Но этот пример отлично олицетворяет простоту принципов, которые лежат в основе xG-моделей. Каждый из вас при желании может пройти путем Ольсена – хотя, используя только субъективные показатели, вы не получите ничего, кроме систематизированной версии вашего восприятия моментов каждой из команд (что тоже может быть полезно).

И действительно, несмотря на модную аббревиатуру и многочисленные попытки записать xG в «advanced stats», одно из главных достоинств показателя в его простоте. Сразу понимаешь, что перед тобой сумма остроты всех созданных командой моментов. Точно так же даже интуитивно без труда можно прийти к выводу, что, если команда выступает лучше, чем должна, исходя из xG-модели, то она… выберите определение, которое вам ближе – в отличной форме/дико эффективна/слишком удачлива.

Кто уже пользуется xG?

Мэттью Бенхэм (слева на фото) использует модель для управления «Брентфордом» и «Мидтьюлландом»

Однажды владельца «Брентфорда» Мэттью Бенхэма спросили, как он оценивает шансы клуба на промоушн. За несколько туров до финиша команда шла на 3-й позиции в Лиге 1, но вместо стандартной фразы аля-«Верю, что поборемся!» с предельно серьезным выражением лица Бэнхэм ответил: «На данный момент наши шансы на выход в чемпионшип – 42,3%».

История Бенхэма (по крайне мере, та ее версия, которую он сам предпочитает рассказывать) очень интересна и даже вдохновляюща. Мэттью сколотил многомиллионное состояние, регулярно обыгрывая футбольных букмекеров. Разумеется, свою систему он не думает раскрывать, но известно, что он исходил из тезиса, что «голы – очень ненадежный показатель истинного уровня игры команды в конкретном матче». Как следствие, используя другие показатели можно выявить недооцененные (в том числе букмекерами) команды. Среди показателей, которые он использовал, ключевую роль играла его собственная основанная на ударах по воротам xG-модель.

Теперь Бенхэм владеет не только «Брентфордом» (уже добравшимся до чемпионшипа), но и «Мидтьюлландом» (который, благодаря его аналитическим методам, стал чемпионом Дании и выбил «Саутгемптон» из Лиги Европы). Он также управляет компаниями SmartOdds (контора, предоставляющая данные профессиональным игрокам на ставках) и MatchBook (букмекерская контора).

***

«После каждого матча мы анализируем количество созданных командой моментов и количество ожидаемых голов, которые мы должны были забить с моментами такого качества. На данный момент существует дефицит между качеством наших шансов и количеством забитых нами голов», – сказал на одной из пресс-конференций этого сезона Арсен Венгер.

Цитата послужила не только подтверждением того, на каком уровне уже используется показатель, но и того, насколько хорошим индикатором качества игры он может быть. Вывод из модели, которую использует «Арсенал», вполне совпадал с данными общедоступных xG-моделей. Как и следовало ожидать, исходя из xG-данных, результаты команды резко улучшились. После той самой пресс-конференции «канониры» выиграли 7 из следующих 8 матчей АПЛ (до – 1 из 3).

Разумеется, каждому такому случаю нужен контекст, и причина такого контраста не только в регрессии к среднему, но это далеко не первый случай за последние годы, когда xG-данные успешно предсказывают ренессанс команды (несколько примеров из прошлого сезона – победная серия «Ньюкасла» при Пардью в первой половине сезона, «Арсенал» и «Барселона» во второй части сезона).  

***

В октябре этого года глава статистической компании 21st Club Омар Шадхури сообщил, что минимум один владелец клуба АПЛ на еженедельной основе изучает данные модели ожидаемых голов.

***

В недавнем интервью Дамьен Комолли рассказывал, как во время его работы в «Ливерпуле» принималось решение о потенциальной смене вратаря. Он не называет используемую методику xG-моделью, но описывает очень схожие принципы.

***

Люди из футбольного мира крайне неохотно делятся настолько глубокой информацией о своих методах. Практически уверен, что скоро мы узнаем о новых случаях применения xG-моделей, но и этих примеров должно быть достаточно, чтобы показать растущую значимость метода.

Что xG может показать?

Модели ожидаемых голов можно сравнить с моделями предсказание итогов выборов. Не существует 0,21 гола или голоса, но, присваивая им основанные на определенных факторах коэффициенты, можно получить массу дополнительной информации о выборах и футбольных матчах.

Модели ожидаемых голов никогда не станут инструментом предсказания отдельных матчей (просто-напросто потому что 20-40 ударов, которые наносятся за матч, никак не соответствуют нескольким миллионам голосов, и их недостаточно для полноценной регрессии к среднему), но они несут важную информацию о качестве моментов команды в матче, следовательно, и об общем качестве ее игры.

Футбол – спорт очень низкой результативности. Вместе со значимостью отдельных эпизодов (как правило, голов) неизбежно растет значимость удачи/фактора случайности. При прочих равных можно утверждать, что хорошая модель ожидаемых голов отражает качество игры команд намного лучше турнирной таблицы и меньше зависит от случайностей.

Как уже упоминалось ранее, существенные расхождения в xG-результатах и реальных результатах нередко сокращаются на более-менее продолжительной дистанции. У случаев, когда этого не происходит, могут быть разные причины, например: 1. тренер команды, которая показывала результаты, но плохо играла, не игнорировал слабое качество игры и внес изменения. 2. команда – интересный пример для изучения, а модель недооценивает какой-то из аспектов ее игры. 3. даже на дистанции всего сезона команды наносят около 600 ударов, что не так уж много для регрессии к среднему.

Подытоживая, хорошая xG-модель в правильных руках может служить: 1. индикатором удачи/неудачи команды в отдельном матче (разумеется, только при значительном расхождении с реальным результатом). 2. базисом для долгосрочных прогнозов (слово «базисом», а не самим прогнозом, тут ключевое и, разумеется, с любыми прогнозами нужно быть острожными, но, пожалуй, xG – лучшая из доступных для футбольных прогнозов альтернатив).

Какие xG есть в открытом доступе уже сейчас?

Модель Майкла Кэйли

Основана на: ударах по воротам

Краткое описание модели: каждому удару присваивается коэффициент от 0 до 1 в зависимости от типа удара (прямой со стандарта, головой после навеса, ногой после обводки вратаря и т.п.), позиции нанесения удара, типа паса, который привел к удару (вразрез, навес и т.п.) и позиции с которой он был отдан, типа атаки, приведшей к удару (контратака, позиционная, стандарт и т.п), типа момента перед ударом (обводка, удар в касание и т.д.), дистанции, которую бивший футболист пробежал с мячом, положения команды в матче (проигрывает, выигрывает, играет вничью).

Полное описание модели на английском

Мой комментарий: пожалуй, лучшая из общедоступных моделей ожидаемых голов. Хорошо продумана, значимость практически каждого из факторов основана на серьезных статистических исследованиях; также постоянно совершенствуется автором.

Пример xG-карты матча:

Как следить: твиттер автора, время от времени обновляемые страницы с данными по АПЛ и европейским лигам.

Модель tegen11

Основана на: ударах по воротам

Краткое описание модели: каждому удару присваивается коэффициент от 0 до 1 в зависимости от типа удара, позиции нанесения удара, места начала атаки, приведшей к удару, типа паса, который привел к удару, типа момента перед ударом, скорости атаки, положения команды в матче.

Полное описание модели на английском

Мой комментарий: альтернатива модели Кэйли. Тоже использует данные от Opta и учитывает практически всю возможную информацию об ударе.

Расхождения между двумя моделями не так уж велики. Например, tegen11 включает пенальти в модель с коэффициентом 0.76, Кэйли считает нецелесообразным сравнивать их с остальными эпизодами и просто отдельно помечает, что во встрече был пенальти, но не включает их в модель. Или: tegen11 учитывает скорости атаки, Кэйли отражает схожую информацию в типе атаки.

Пример xG-карты матча:

Как следить: твиттер автора.

Модель Пола Райли

Основана на: ударах в створ ворот

Краткое описание модели: каждому удару в створ присваивается коэффициент от 0 до 1 в зависимости от позиции нанесения удара.

Полное описание модели на английском

Мой комментарий: слишком упрощенная модель. Упомянул ее только из-за удобных и оперативно обновляемых таблиц (см. ниже) и архива данных за последние сезоны АПЛ.

Как следить: таблицы Tableau с удобными фильтрами.

Каковы основные недостатки xG?

Этот раздел будет скучным (прямо очень, даже скучнее того, что вы прочитали проскролили выше) с кучей технических моментов. Я не обижусь, если вы его пропустите. Для тех, кто пойдет этим путем, отмечу: xG вполне работоспособная и даже крутая вещь, а речь пойдет о мелких недостатках, среди них нет критических огрехов, которые перечеркнули бы изложенную выше пользу от моделей.

Разберемся в недостатках на примере модели Майкла Кэйли, которой я пользуюсь чаще, чем остальными.

1. Ситуации, которые не завершаются ударом

Нет удара – нет увеличения xG. Но отдельные эпизоды, которые не завершаются ударом, выглядят острее большинства ударов (особенно дальних, которые засчитываются, пускай и с небольшим коэффициентом). В идеале такие моменты хотелось бы отражать, но делать это объективно и автоматически на данном этапе невозможно. Недостаток некритический, так как едва ли в мире есть команды, умышленно не бьющие из выгодных позиций.

2. Дальние удары

Есть тот тип дальних ударов, которые наносят только в том случае, если игрок заметил серьезный изъян в позиции вратаря и верит в значительную вероятность гола. Например, xG-вероятность голов Чарли Адама, Микеля Сан Хосе и Алессандро Флоренци стремилась к 0, что логично исходя из позиции удара, но на деле она должна была быть выше, так как игроки в 99% случаев не бьют из таких позиций, если не видят ошибку в позиции вратаря.

3. Модели все равно, кто бьет

Разумеется каждый из нас предпочел бы видеть Лионеля Месси, а не Джонни Эванса, выходящего 1 на 1 с вратарем соперника в футболке любимой команды. И, пожалуй, наоборот Эванса, а не Месси, в ситуации с ударом головой в борьбе после углового. Модель на данный момент не в состоянии учесть разницу в мастерстве игроков завершать атаки.

Проблема не в последнюю очередь в том, что эдакий скилл завершения атаки в футболе практически невозможно измерить: 1. в футболе наносится слишком мало ударов для того, чтобы объективно оценить даже тех нападающих, которые бьют чаще остальных (например, часто бьющие хоккеисты наносят порядка 800 ударов за сезон, у часто бьющих футболистов уходит 5-6 лет на аналогичное количество ударов). 2. из-за такого малого количества ударов цифры реализации ударов сильно разнятся у одних и тех же игроков от сезона к сезону.

Можно привести массу отдельных вопиющих примеров, подчеркивающих значимость скилла завершения атаки у отдельных игроков, но два важных момента, позволяющих не считать недостаток критическим: 1. в последние годы поддерживать уровень реализации, который был бы стабильно выше показателя голов, которые они должны были забить, исходя из xG, удавалось только 2 игрокам (да-да, Месси и Роналду). 2. статистика показывает, что при сравнении большого количества игроков значимость этого фактора уменьшается:

4. Практически невозможно полностью учесть расположение защитников

xG-модели пытаются обойти этот момент. Например, учитывая скорость развития атаки, наличие явной индивидуальной ошибки защитника, обводки футболистом противника перед ударом и т.п. Но все это не одно и то же с реальным осознанием того, сколько давления со стороны оборонительной стороны оказывается на игрока в момент удара. К сожалению, в рамках показателей, которые считает Opta, пока нет объективного способа это отразить.

5. Слегка недооцениваются команды, которые умышленно медленно атакуют

Утверждение, что при прочих равных быстрые атаки опасней и с большей вероятностью могут завершиться голом, правдиво и подтверждается статистикой. Разумеется, проще атаковать соперника, чьи игроки еще не успели вернуться в оборонительную схему. Разумеется, в большинстве случаев затянувшееся владение мячом будет означать просто-напросто то, что команда ничего не может поделать с обороной противника.

Но в отдельных редких случаях (здравствуй, Луи) такие затянувшиеся владения – часть тренерского умысла (философии) и необязательно значат несостоятельность в атаке. Команды, играющие в такой футбол абсолютно в каждом матче, могут слегка недооцениваться системой. Слово «слегка» тут важно – тип атаки оказывает не такое уж большое влияние на итоговый коэффициент, удар из убойной позиции после очень медленной атаки получит очень высокий коэффициент (просто чуточку меньший, чем после быстрой атаки).

6. Трудности с ситуациями с несколькими ударами за одну атаку

Допустим, команда наносит 4 убойных удара за одну атаку. Сумма их xG-коэффициентов составляет, например – 1,44. Но мы же отлично понимаем, что даже теоретически команда не может забить больше 1 гола за одну атаку. Следовательно, засчитывать ей 1,44 в корне неверно. А что верно? Засчитать только самый опасный из 4 ударов (на данный момент применяется именно это решение)? Логично, но тоже не до конца верно так, как вероятность забить гол в атаке с 4 убойными ударами выше, чем вероятность забить одним, самым опасным, из этих ударов.

7. Автоголы, пенальти

На данный момент они просто-напросто не учитываются, а помечаются отдельной строкой.

Итого

xG-модели – полезнейший инструмент для глубокого и достаточно объективного анализа, а также неплохой для долгосрочных прогнозов. Более того, как показывает практика, система может быть полезна не только аутсайдерам футбольного мира (нам), но и самим клубам. Вполне возможно настанет день, когда владельцы будут широко ее применять для решений о тренерских отставках/назначениях, а сами тренеры – для выбора момента смены тактики. Что станет существенным шагом вперед от текущий ситуаций, в которой большинство решений принимаются на основе общественного мнения/давления и рэндомных факторов (конечно, при условии, что она будет не единственным ориентиром таких решений, а только одним из).

Если мне удалось заинтересовать вас, но у вас остались вопросы – велкам в комментарии. Если вы не согласны с ключевыми выводами по моделям – аналогично, буду рад обсудить с вами их критику.

Топовое фото: Global Look Press/Carmen Jaspersen/dpa

ua.tribuna.com

О недостатках моделей xG — Клуб проСпартак

Сегодня я опять отступлю от основной темы данного сайта и поговорю про футбольную аналитику в целом, а именно про недостатки моделей xG. Но в то же время этот текст будет тесно связан с предыдущим, в котором речь шла об игре «Спартака» с точки зрения моделей xG, и в качестве примеров я буду использовать эпизоды из игр «Спартака».

Мой интерес к данной теме не случаен. Я учусь в аспирантуре на экономиста (с уклоном в статистические методы), а в современной экономической науке модели используются повсеместно (нет, предсказание кризисов — это не наука, так что это не ко мне). И есть широко известная среди ученых-экономистов поговорка: «Любая модель хороша настолько, насколько хороши ее предположения». Вот о предположениях модели xG и пойдет речь.

Начну я с упрощенного описания модели. Предполагается, что голы в футбольном мачте забиваются случайно, а для определения качества игры лучше подходят созданные моменты, а точнее, удары по воротам. Каждому удару на основе статистической модели присваивается определенный вес (вероятность забить гол), и для играющих команд подсчитывается ожидаемое число забитых голов. При этом сами удары принимаются за данность и никак не моделируются.

Прежде, чем перейти к критике, скажу, что лично мне в целом очень нравятся модели xG, и я считаю, что они несут в себе массу интересной информации. В то же время у них, как и у любой другой статистической модели, есть определенные недостатки, и слепо им доверять не стоит.

Я выделил бы две группы недостатков.

«Технические»

Сюда я отношу недостатки, касающиеся мелких аспектов модели, в основном невключение в модель факторов, которые потенциально могут быть важны.

Например, в модели 11tegen11 не учитывается число защитников между бьющим игроком и воротами, поэтому не учитывается вероятность того, что удар будет заблокирован. Из-за этого модель может недооценивать игру в обороне команд, которые дают наносить много ударов, но хорошо их блокируют. Вот здесь, например, утверждается, что именно так зачастую действуют команды Тони Пьюлиса.

Сюда же относится вопрос о том, нужно ли (и если да, то как) учитывать мастерство бьющего. Понятно, что Лео Месси бьет по воротам лучше, чем Женя Макеев, а многие модели xG это не учитывают; в то же время в футболе размер выборки (число ударов, нанесенных конкретным игроком) не так велико, чтобы достоверно оценить мастерство и отделить его от удачи.

При всей важности этих моментов, это все же детали. Любую статистическую модель можно улучшить, если добавить в нее дополнительные переменные, но даже переход от самой лучшей xG модели к простой модели, присваивающей всем ударам одинаковый вес, ухудшает качество прогнозов всего на 20%:

(Этот рисунок я приводил в прошлом посте, взят он отсюда)

Другими словами, технические детали на самом деле не так уж и важны, и вряд ли включение лишних переменных в существующие модели xG серьезно повысит их качество. Поэтому от обсуждения мелких деталей я перейду к более существенным вещам, а именно к обсуждению некоторых базовых предположений, на которых основаны модели xG.

«Фундаментальные»

Напомню, что важнейшим предположением моделей xG является то, что голы случайны, а вот удары по воротам принимаются за данность и считаются прямым отражением качества игры команды.

(Для знающих математическую статистику: модели xG подсчитывают вероятность забить гол условно на созданные моменты, но не подсчитывают вероятность создать момент, условно на качество игры.)

С этим предположением возникают две проблемы.

1. Если результат удара (гол или нет) случаен, то почему мы принимаем сам удар за данность? Здесь, в свою очередь, есть два аспекта. Во-первых, одинаково хорошие удары могут возникать из разных ситуаций, и далеко не всегда к удару по воротам из хорошей позиции приводит именно хорошая игра. Во-вторых, одинаково хорошая игра далеко не всегда приводит к одинаково хорошим ударам. Обратимся к примерам.

а) Удар — следствие удачи или мастерства?

Вот гол ЦСКА в ворота «Спартака» в 2013 году (с 25-й секунды):

[youtube https://www.youtube.com/watch?v=ZCP0PCmghZM]

Этот момент имеет очень высокий xG, так как удар наносится с хорошей позиции с по пустым воротам. В то же время к голевому моменту приводит не хорошая игра ЦСКА, а грубая ошибка Реброва после случайного выноса вперед.

Вот гол Промеса в ворота «Рубина» в этом сезоне:

[youtube https://www.youtube.com/watch?v=p_nbHuK7rT4]

Опять видим удар по воротам из хорошей позиции, то есть высокий xG. В то же время момент стал следствием неудачной игры защитника «Рубина», который поскользнулся и промахнулся мимо мяча в достаточно рядовом моменте.

А вот противоположный пример: первый гол Зе Луиша в ворота ЦСКА в этом сезоне, который стал результатом хорошей комбинации и отличного разрезающего паса Глушакова:

[youtube https://www.youtube.com/watch?v=_mWcKKCwqf8]

Вот еще один пример из той же серии модели xG дают одинаковый вес всем пенальти, независимо от того, в какой ситуации пенальти был назначен. Скажем, модель xG не видит разницы между ситуацией, когда нападающий выходит один на один в результате хорошей комбинации, а защитник его сбивает, и ситуацией, когда защитник слышит голос свыше: «Хенде хох!» — и поднимает руки, в которые прилетает мяч, в безобидной ситуации, как Боатенг на Евро.

[youtube https://www.youtube.com/watch?v=BGgQfKR1sC4]

Вроде бы разумно считать, что голы, возникающие в результате удачи или индивидуальных ошибок, не являются отражением хорошей игры атакующей команды, и вряд ли можно рассчитывать такие голы забивать регулярно. И хотя некоторые модели xG и учитывают то, был ли последний пас перед ударом умышленным или нет, они далеко не в полной мере отражают развитие атаки в целом.

б) Всегда ли хорошая игра приводит к удару?

Вот пас Попова на Промеса в матче с «Тереком» (смотреть с 2:30):

[youtube https://www.youtube.com/watch?v=MAWa3W5krQI]

В результате этого паса удар по воротам нанесен не был, но если бы мяч летел чуть слабее, то вратарь мог бы к нему не успеть, и Промес выходил бы один на один. В итоге получаем, что xG момента равен нулю, хотя, будь «Спартак» чуть удачнее, получил бы высокий xG. И наоборот, будь пас Глушакова на Зе Луиша в мачте с ЦСКА чуть сильнее (видео выше), Акинфеев забрал бы мяч, удара по воротам не было бы, и xG был бы равен нулю.

А вот выход Комолова один на один из матча «Спартак» — «Амкар» (смотреть с 1:10):

[youtube https://www.youtube.com/watch?v=T7-Lfv7KJ7c]

Комолов замешкался и удар по воротам не нанес, хотя такую возможность имел. В результате xG момента опять равен нулю, хотя потенциально это атака на высокий xG.

Другими словами, ожидаемые голы не являются непрерывной функцией качества игры; в зависимости от того, нанесен удар по воротам или нет (что зачастую определяется удачей), команда либо получает высокий xG, либо нулевой.

Чтобы решить проблемы, перечисленные в этом пункте, желательно смотреть не на вероятность забить при определенном ударе, а на вероятность забить в результате определенной последовательности действий (например, последовательности передач). Такие попытки уже делаются, но пока они еще недостаточно проработаны и не внедрены в модели xG.

2. Модели xG предполагают, что игра команды (и нанесенные ей удары) не зависят от счета. В реальности же многие команды, забив гол и поведя в счете, начинают играть более осторожно. Это может привести к тому, что модель xG будет систематически недооценивать игру команды, которая ведет в счете.

Вот теоретический пример. Допустим, что команда А способна создавать момент весом в 0,33 xG каждые 10 минут. Если она будет так играть весь матч, то она создаст 9 таких моментов общим весом в 3 xG, что очень много. Но если она решит, что ей достаточно двух голов, забьет два гола к 30-й минуте в результате 3 ударов, то наберет всего 1 xG. В результате мы увидим, что команда А выиграла 2:0 (предполагаем, что соперник не атакует вообще), а счет по xG 1:0, т.е. команде А повезло. Но если бы она играла в свою силу весь матч, что счет по xG был бы 3:0, т.е. на деле она забила меньше, чем могла бы.

А вот реальный пример.

CSKA missed their chances to take something from Spartak here.Two sides with a strong passing midfield presence.#xGplot #passmap pic.twitter.com/C0ubEqY1sM

— 11tegen11 (@11tegen11) 29 октября 2016 г.

Если смотреть на xG, то «Спартак» уступил ЦСКА в матче этого сезона. В то же время мы видим, что при равном счете (0:0 до гола Глушакова) «Спартак» не позволил сопернику нанести ни одного удара по своим воротам. Два серьезных шанса ЦСКА создал при счете 0:1 и 0:2, когда в лучшем случае была возможность сравнять счет, но было физически невозможно выйти вперед.

Мы не знаем, как сложился бы матч, если бы Глушаков не забил. Возможно, ЦСКА все равно создал бы свои моменты, а может быть, что ЦСКА продолжил бы играть осторожно, на ничью 0:0. Точно так же мы не знаем, как развивалась бы игра, если бы ЦСКА сравнял счет в конце первого тайма.

Получается, что модели xG хорошо описывают, какие шансы были у команд в реальности (например, мы видим, что у ЦСКА был хороший шанс сравнять счет в конце первого тайма), но не могут ответить на вопрос, как протекал бы матч в «альтернативной реальности» (например, мы не можем утверждать, был бы у ЦСКА шанс выйти вперед в конце первого тайма, если бы «Спартак» до этого не забил).

Поэтому, если игра команд действительно меняется в зависимости от счета (а разумно предполагать, что часто это именно так, то модели xG применять надо очень осторожно, и симулировать гипотетические исходы матча не имеет большого смысла. Как исправить эту проблему, мне пока не совсем понятно: видимо, надо по аналогии с хоккеем делать поправки на счет, но вот конкретных предложений у меня нет.

Заключение

Я повторю еще раз то, что написал в начале текста: мне нравятся модели xG, они очень полезны, из них можно узнать много интересного. Цель этого текста — вовсе не в том, чтобы доказать, что модели xG плохие; напротив, на мой взгляд, модели xG — самое важное нововведение в футбольной аналитике за последнее время. Но, как и с любой другой моделью (экономической, статистической или какой-то еще), важно помнить, что модели xG делают определенные упрощающие предположения, и эти предположения далеко не всегда выполняются в реальности.

Поэтому, используя модели xG, важно помнить об их возможных недостатках и не доверять слепо их результатам. В частности, стоит смотреть не только на то, сколько xG создает или допускает команда, но и на то, как (за счет мастерства или удачи) и при каком счете это происходит.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Вконтакте

Twitter

Facebook

Google+

Одноклассники

prosm.club

Развёрнутая статистика РФПЛ: xG, удары, голевые атаки

Прежде всего хочу извиниться, что по итогам 6-го тура Премьер-Лиги не будет тактического разбора – из-за командировки в Тулу и дальнейшей загрузки не смог посмотреть хотя бы половину матчей тура целиком. Но есть и ещё один способ, помимо визуального, отобразить силу и слабости российских команд. Это цифры. Мы не будем ходить по поверхности привычной статистики, а немного углубимся, чтобы найти в цифрах стилевые особенности лидеров чемпионата России.

xG – Expected Goals

Благодаря английскому журналисту Майклу Кэйли система xG, которую ещё два десятка лет назад придумал для сборной Норвегии её тренер Эгил Ольсен,

стала понятнее простым людям. Главное для xG – это удары по воротам, каждому из которых присваивается коэффициент, основанный на позиции для удара, его типе (головой/ногой), позиции, откуда была сделана подача, и даже индивидуальных качествах игрока. Разбирая xG Премьер-Лиги, я не стал углубляться так далеко, взяв за основу упрощённую систему Кэйли – она учитывает только позицию для удара и его тип. Кэйли разрабатывал систему, считая, что на дистанции она поможет выделить сильные и слабые стороны команд, их итоговое место в таблице и стиль игры – и хоть сейчас в РФПЛ прошло всего 6 туров, таблица подкидывает несколько интересных выводов.

.

.

Выводы из таблицы

У «Спартака» лучшая атака в лиге. «Красно-белые давно так не играли!» – пишут многие болельщики, восхищённые «Спартаком» Карреры. Такими нацеленными на правильную геометрию атаки, на удар и на высокий прессинг москвичи действительно не были очень давно. Проблемы «Спартака» кроются в защите, которая пока допускает очень много ляпов, в первую очередь на флангах. Несмотря на один-единственный пропущенный мяч по сезону, продвинутая статистика доказывает, что без гола после игры с красно-белыми по праву ушёл с поля лишь «Краснодар» – все остальные на гол наиграли.

Придумай Пирло. Как выглядят первые штрихи «Спартака» Карреры

Массимо Каррера теперь настоящий главный тренер «Спартака» – и кое-какие очертания его работы в начале пути уже вполне заметны.

Даже сбоящий «Зенит» – лучшая команда старта сезона. Высокая оборона и ставка на тотальный контроль мяча позволяют «Зениту» получать меньше всех опасных ударов в Премьер-Лиге, а в атаке создавать моменты в среднем на 2 гола за игру (и это даже при том, что пока петербуржцы тяжеловаты и нечасто взвинчивают скорости). ЦСКА, тоже допускающий минимум моментов у своих ворот, стал единственной командой, которая должна была отнять очки у «Зенита» на старте сезона, исходя из xG – но цифры по конкретному матчу куда менее красноречивы, чем цифры по дистанции.

«Ростов» как аутсайдер. В принципе, очевидная вещь, но требующая разъяснения – команда, играющая на контратаках и запирающаяся у своих ворот даже дома против «Томи» (а на своей трети поля «Ростов» играл пока больше всех в Премьер-Лиге – 32% времени), по xG не будет среди лидеров. При этом у таких команд, как «Ростов», обязательно должна быть повышенная конвертация моментов в голы, и она у жёлто-синих есть – с xG 8,33 ростовчане забили 9 мячей (ЦСКА с куда лучшим xG забил 7).

«Рубин» занимает не своё место в таблице. И это не только из-за того, сколько «Рубин» потратил летом. В Казани, как и в «Малаге», атака Хави Грасии долго запрягала, но её должно было прорвать намного раньше, чем в 6-м туре. За вычетом двух проваленных матчей на старте сезона «Рубин» был симпатичен в атаке, команду губила лишь жуткая реализация – например, в игре с «Анжи» казанцы 14 раз пробили из штрафной площадки. Теперь должно быть легче – по организации защиты «Рубин» уже сейчас в тройке, атака тоже поймала своё настроение. Хотя есть и вероятность побочного эффекта – мнение о несправедливости места «Рубина» в таблице может быть вызвано соперниками, с которыми играли казанцы (из топ-клубов – только «Спартак»).

«Оренбург» смог адаптировать свою систему под Премьер-Лигу. Из трёх новичков, поднявшихся из ФНЛ, именно «Оренбург» оставляет самое цельное впечатление. Ещё в ФНЛ Роберт Евдокимов выстроил крепкую команду, которая научилась массированно защищаться, блокировать путь в штрафную и если уж давала бить, то с неудобных точек. Как минимум в матчах с командами примерно одного с собой статуса «Оренбург» сохраняет свою идею, разливая сгущёнку в центре поля – «Амкар», «Арсенал» и «Анжи» даже вместе взятые едва наиграли на гол. Если верить xG, защита «Оренбурга» – пока 4-я по силе в Премьер-Лиге, и это плоды работы, затеянной ещё в ФНЛ пару лет назад.

Запланированное чудо. Почему «Газовик» может удивить РФПЛ

«Газовик» из Оренбурга – самый ожидаемый победитель ФНЛ за последние годы и, возможно, главный сюрприз следующего сезона РФПЛ.

Типология ударов

Если опять же проследить динамику изменения цифр на дистанции (по сравнению с прошлым сезоном), то кое-что бросится в глаза. Например, ярко выраженная ударная философия «Локомотива» – бить только с правильных точек, об этом мы говорили уже немало, хотя бы тут. Красно-зелёные не жалуют дальние удары – они меньше всех стреляли издали в прошлом сезоне, а в этом стали вторыми с конца по этому показателю, вслед за «Амкаром».

При этом удивительно, как резко меняются акценты игры у того же «Амкара». Если сейчас пермяки бьют издали меньше всех, то в прошлом чемпионате били больше всех – 52% ударов, наряду с ЦСКА. Хотя тренерский штаб остался на месте, а состав команды не потерял ярких лиц, кроме Георги Пеева.

Чаще бить из штрафной площадки стали лидеры – как тот же «Ростов», половину прошлого сезона оттачивавший свои контратаки по учебнику геометрии (60% против 50%). А «Краснодар», начав испытывать трудности со входом в чужую штрафную, стал намного больше, чем в предыдущие годы, бить с дальних дистанций (43% в сезоне-2014/15, 47% в прошлом, дикие 56% в нынешнем). Против «Краснодара» и его короткого паса научились играть, а вероятность того, что дальний удар станет голевым, куда меньше, чем у удара из штрафной площадки. Отчасти эти цифры и объясняют кризис «быков» на старте, вызвавший увольнение Олега Кононова.

.

.

Участие в голевых атаках

Своеобразный показатель полезности для игроков атаки – участие в голевых атаках. Здесь считаются не только голы и голевые передачи, но и предголевые передачи, что помогает более углублённо понять влияние конкретных футболистов на командную игру. Вряд ли кого-то может удивить, что самый активный участник атак в Премьер-Лиге Квинси Промес: он успел поучаствовать в 8 голевых атаках «Спартака», в двух из них – дважды (этим и объясняется процент, один игрок может сделать две предголевые передачи или, например, после предголевой забить сам). Рядом с ним – его одноклубник Зе Луиш, а также два креативщика «Зенита» Шатов и Жулиано. Пока процент голевых атак выше у Олега, но матч в Туле подбросил новую важную мысль – может, с Жулиано на поле Шатов чувствует себя не столь комфортно?

.

.

Одна из главных идей «показателя полезности» – сделать более явным вклад в атакующую игру незаметных героев (опорных полузащитников, защитников). Пока лучшие из подобных героев четырежды засветились в голевых атаках. Роль Дениса Кулакова сложно недооценить, через его правый фланг «Урал» атакует очень часто. Здесь же – Александр Сонг, взявший бразды правления центром поля «Рубина» в свои руки и явно готовый отправить на лавку Магомеда Оздоева. А также два крайних защитника «Спартака» Комбаров и Ещенко – несмотря на претензии к обоим за их непосредственную работу, в атаке они действительно работают продуктивно.

.

.

Тактическое соответствие

Тактика с тремя центральными защитниками стала трендовой – уже на старте сезона её испробовали 8 команд Премьер-Лиги. Добрая половина. Но насколько она приживается на нашей почве? Год назад такой же вопрос стоял перед экспертами по АПЛ, которые убедительно отвечали «нет». В Англии схема с тремя центральными защитниками на сезонной дистанции – это утопия, но многие тренеры (Раньери, Куман, Кике Флорес, Эллардайс) использовали её, чтобы нивелировать сильные стороны конкретного соперника. Раньери и Флорес, например, выставляли 3-5-2 друг против друга.

У нас, в отличии от Туманного Альбиона, есть пример для подражания в игре с пятью защитниками – «Ростов», чья оборона брала сыгранностью и пониманием, что каждый должен делать в конкретный момент. Чужие успехи стали основой тактической перестройки как минимум для «Уфы», но Виктор Гончаренко взял за идеал не «Ростов», а пражскую «Спарту» образца прошлого сезона, легко варьировавшую 4-2-3-1 и 5-3-2, что вживую смотрелось очень эффектно. И всё же как инструмент игры на дистанции, без должной сыгранности, тактика в три центральных пока не слишком действенна и на уровне нашей Премьер-Лиги.

.

.

Я не стал включать в эту таблицу две команды – «Спартак» из-за иной постановки приоритетов в тактике (Комбаров и Ещенко играли там куда более атакующую роль, чем крайние защитники, например, в «Крыльях» Веркотерена) и «Урал», совмещавший на старте сезона диковинные 5-2-3 и 3-4-3. Без них таблица показательна – в матчах с командами, играющими в традиционную четвёрку защитников, 5-3-2 и 5-4-1 терпят крушение, выигрывая лишь один матч из шести. На самом деле ничего удивительного в этом нет, если взять в расчёт два факта:

1. Многие считают тактику в пять защитников сдерживающей и подбирают её специально под матчи с сильными соперниками. Как Валерий Петраков в «Томи» – «Уфу» он побеждал схемой в четыре защитника, а к ЦСКА перестроился на пятёрку. Проблема в том, что лишний оборонец сам по себе не придаст надёжности, она возникает с сыгранностью. «Томь» проиграла тот матч, а гол откровенно проспала (как её защита, так и Антон Коченков).

2. Но ещё более странно, что тактику в три центральных защитника у нас подбирают под соперника всего с одним чистым нападающим. Изначально схема 5-3-2 заточена на сдерживание двух нападающих на передней линии – потому, когда в прошлом сезоне «Лестер» играл с «Уотфордом», именно связка «шершней» Дини – Игало, находившаяся тогда в ударе, вынудила Раньери перестроиться на три центральных. Много ли команд в Премьер-Лиге, играющих в два форварда и не в пять защитников, вы знаете? Эпизодически «Зенит», в котором Кокорин, Жирков или Джорджевич смещаются с фланга и становятся вторыми нападающими. «Рубин» Грасии. И всё. Можно понять осознанную перестройку тактики под них, но странно, когда это делают под ЦСКА или «Локомотив», против которых важнее выставить плотный кулак в середине поля.

Ударная статистика

Не удивляйтесь именно такой выборке – в таблице собрались самые бьющие футболисты Премьер-Лиги, а также уже забытый, но при этом статистически выглядящий очень достойно. Больше всех бьёт Фёдор Смолов – неудивительно, учитывая, что три четверти мячей «Краснодара» в текущем сезоне забил именно он. Он же чаще всех попадает в створ.

Романа Павлюченко очень хочется отметить отдельно – хоть его «Урал» буксует, а сам Павлюченко забил всего дважды, его игра оставляет очень приятное впечатление (и статистика на фоне лучших форвардов стартового отрезка РФПЛ это подтверждает). Во-первых, в отличие от кубанского периода, он не замучен травмами, во-вторых, Роман и сам куда сильнее заряжен – постоянно ищет возможности для удара, бьёт с любых точек. Игра с «Рубином» в Казани была показательной – игра у «Урала» не шла, но Павлюченко, заряженный на гол, стрелял с любых точек (5 ударов, у всех остальных «шмелей» еле набралось 2), а в концовке, уже при 0:3, всё-таки забил. По такому течению сезона Павлюченко по силам забить минимум 7-8 мячей за чемпионат.

.

.

www.championat.com

XG, xPoints и продвинутая статистика российской Премьер-Лиги

«Спартак» атакует лучше всех в России. Цифровые выкладки РФПЛ

Накануне старта 7-го тура РФПЛ – цифровые выкладки, демонстрирующие силу атаки «Спартака», кризис «Краснодара» и потенциал «Зенита».

Ожидаемые очки

Как составлялся график? Ожидаемые очки – это количество очков на основе xG в каждом проведённом матче. Победа в матче присуждается, если xG команды на 0,64 (максимальное значение одного удара) выше, чем у соперника.

.

.

Что читается в графике?

«Спартак» хорош, но мини-спад по игре уже заметен. Из последних пяти матчей, если брать в расчёт xG, красно-белые должны были выиграть лишь один. Причём проигранный, с «Уфой». На осеннем турнирном отрезке «Спартак» набрал 9 очков вместо ожидаемых 6, как раз эта разница и отражена на графике – пока нельзя произносить такие вещи вслух, но кажется, что у «Спартака» появился класс, позволяющий выигрывать ничейные матчи. А вы знаете, как в РФПЛ подобным образом берут даже золото.

Что такое xG – Expected Goals?

Благодаря английскому журналисту Майклу Кэйли система xG, которую ещё два десятка лет назад придумал для сборной Норвегии её тренер Эгил Ольсен, стала понятнее простым людям. Главное для xG – это удары по воротам, каждому из которых присваивается коэффициент, основанный на позиции для удара, его типе (головой/ногой), позиции, откуда была сделана подача, и даже индивидуальных качествах игрока. Разбирая xG Премьер-Лиги, я не стал углубляться так далеко, взяв за основу упрощённую систему Кэйли – она учитывает только позицию для удара и его тип.

ЦСКА недобирает «свои» очки. Глядя на игру «армейцев» в большинстве матчей Премьер-Лиги, нельзя не удивиться, что ЦСКА чуть-чуть, но недобрал своё и по ожидаемым очкам команда Леонида Слуцкого – вторая после «Зенита». По игре ЦСКА в текущем сезоне не уступил никому, а недобор объясняется матчем в Ростове-на-Дону, где красно-синим помешала традиционно высокая реализация соперника. Конечно, «армейцы» добывают свои очки, не играя в запредельный футбол и даже не устраивая бомбардировку чужих ворот, – но это уже совсем другая история.

«Амкар» выгодно отличается от серой массы РФПЛ. Гаджи Гаджиева по-прежнему недооценивают и никогда не оценят по достоинству – всё-таки пенсия по возрасту уже близко, – однако в Перми он построил очень крепкую команду без серьёзных вложений. «Амкар» выступает немного лучше ожиданий, лёгкое проседание результатов неизбежно, но при этом заметно, что потенциал команды куда выше, чем возня в болоте турнирной таблицы. На уровне первой восьмёрки – как минимум.

Лидер не за горами. «Амкар» – самый дерзкий андердог Премьер-Лиги

«Амкар» притаился за спинами «Спартака», ЦСКА и «Зенита» – разбираем тактику команды, оказавшейся на подступах к вершине.

Проседание «Локомотива». Удивительный феномен – мы говорим о кризисе «Локо», атака красно-зелёных хромает на обе ноги, однако в турнирной таблице, основанной на xG, «Локомотив» делит 3-е место со «Спартаком». Отчасти это можно объяснить частыми пенальти (если Майкл Кэйли считает их отдельно, я записываю 11-метровые в результат матча), но сам факт, что команда Юрия Сёмина бьёт их больше всех в Премьер-Лиге, уже наводит на мысль, что в штрафной «Локо» старается действовать агрессивно, провоцировать соперника на нарушения. И даже если вычесть пенальти, чтобы устранить разночтения, картина сильно не поменяется – «Локомотив» в таком случае должен был набрать не 19 очков, а 17. По потенциалу набора очков красно-зелёные в пятёрке, как бы мы ни обсчитывали их результаты, и эта статистика намекает, что кризис «железнодорожников» – по большей части лишь в турнирном положении. Хотя есть и ещё одна беда — реализация, — но о ней позже.

Взлёт «Анжи» похож на случайность. Махачкалинцы набрали на 8 очков больше ожидаемого, и если у «Ростова» подобное разночтение ожидания и реальности логично (где Курбан Бердыев, там бешеная реализация), то у «Анжи» вызывает серьёзные вопросы. Цифры и визуальное впечатление намекают, что Павел Врба пытается научить «Анжи» атаковать, играть от себя, но у своих ворот при этом горит каждый матч. Показатель TSR, который мы ещё обсудим детально, у «Анжи» составляет всего 39,7 – то есть в матчах махачкалинцев лишь 39,7% ударов наносят они сами. Сильнее в Премьер-Лиге доминируют только над тем самым «Ростовом», «Томью» и «Уфой». Странно для команды, которая стремится играть вперёд. Высокое место «Анжи» – явно элемент случайности, и как минимум до зимней паузы команда Врбы должна просесть.

«Оренбург» выгодно выделяется среди аутсайдеров. «Крылья» идут по дистанции, абсолютно соответствуя ожиданиям, «Томь», «Арсенал» и «Урал» выжимают из своей игры чуть больше очков, чем прогнозирует xPoints, и лишь у «Оренбурга» заметен потенциал для дальнейшего роста – опять же он выражается в цифрах. Команда Роберта Евдокимова по игре уступила лишь в трёх матчах, причём два из них – с «Ростовом» и ЦСКА на старте, где и сами «газовики» были слабо готовы психологически, и требовать результата сложно и наивно. Пожалуй, прямо сейчас «Оренбург» – та команда, которая по игре меньше других заслуживает вылета.

Ожидаемая разница мячей

Как составлялся график? Ожидаемая разница мячей – это суммированная разница xG по итогам всех матчей (важное пояснение. Именно xG, а не итогового результата в каждом матче. Expected Goals в одном конкретном случае не может обрисовать полную картину, зато хорошо показывает ситуацию на дистанции).

.

.

По-хорошему, практически все показатели на этом графике коррелируют с предыдущим – по крайней мере в правой половине графика, где обитают лидеры, всё те же 7 команд без изменений. Но я бы в очередной раз обратил внимание на «Ростов». Жёлто-синие демонстрируют цифровые показатели твёрдого середняка, не более, и получают по своим воротам больше ударов, чем новичок Премьер-Лиги «Оренбург» (да, обратите внимание на его ожидаемую разницу мячей – ещё одна деталь прогноза на борьбу за выживание). Однако невероятная реализация моментов в матчах, где «Ростов» не наигрывает хотя бы на один гол (как против «Локомотива» и ЦСКА), помогает команде Бердыева-Кириченко-Данильянца добиваться намного лучшего результата, чем вытекает из цифр. В отличие от «Лестера», с такими же цифрами посыпавшегося на второй сезон, система «Ростова» работает без сбоев, и это уже повод восхищаться командой с берегов Дона.

В остальном всё примерно так же – разница ЦСКА чуть-чуть хуже ожидаемого, разница «Спартака» заметно лучше, а хорошие цифры «Локомотива» в таблице вообще не отражаются.

Продвинутая голевая статистика

Как составлялась таблица? TSR – процентное соотношение ударов команды и общего количества ударов в матчах, в которых она участвовала (то есть если условный «Спартак» в матче с условным ЦСКА бьёт 6 раз и получает по своим воротам 4 удара, TSR составит 60% – 6/10). Во втором столбце – общее количество ударов, требующихся для забитого гола. В третьем – общее количество ударов, требующихся для пропущенного гола. Каждый из параметров учитывает все удары по воротам, а не только удары в створ.

.

.

Что читается в таблице?

Шикарная реализация «Зенита». Золотой стандарт Премьер-Лиги в плане бережного отношения к голевым моментам – «Ростов», но «Зенит» Мирчи Луческу умудрился переплюнуть сенсацию прошлого сезона и здесь. 5,5 удара на один гол – в топ-лигах реализация лучше только у «Барселоны», «Лас-Пальмаса», «Майнца» и «Герты». Цифры мирового уровня объяснимы стилем нового «Зенита», который использует дальние удары нечасто, лишь в случае резервного плана, и старается по максимуму бить из штрафной площадки, из удобных позиций (отсюда, например, и высокий xG). Вот, например, карта ударов «Зенита» в домашнем матче с «Рубином». Статистика матча – 11-8 по ударам, в этом компоненте «Рубин» не был сильно хуже, но после игры говорили только о том, что казанцы творят бардак. Хотя в этом в первую очередь был виноват «Зенит».

.

.

Только у «Спартака» всё хорошо. Три «зелёных» показателя в этой таблице (то есть попадание в топ-5 по каждому параметру) – доказательство того, что «Спартак» хоть и играет чуть выше ожиданий, как указывает таблица xG, но по праву находится в чемпионской гонке. Красно-белые бьют больше всех в Премьер-Лиге с отрывом в 37 ударов, так что неудивительно, что именно они сильнее всех доминируют в своих матчах (TSR – 61,8). Важно, что при средней игре защиты – «Спартак» лишь 7-й в лиге по количеству ударов по своим воротам, меньше дают бить «Урал» и «Локомотив», которых сложно найти в таблице без лупы, – лишь каждый 15-й удар становится голевым.

Ещё одно объяснение успехов «Амкара». Если, опять же, руководствоваться стандартами мирового футбола, 1 пропущенный гол с 20 ударов – это статистика уровня «Баварии» в начале текущего сезона. Связаны такие цифры пермяков с двумя вещами – во-первых, «Амкар» блокирует большинство атак ещё в центре поля, не заставляя вступать в игру защитную четвёрку, во-вторых, по воротам «Амкара» от безысходности очень часто бьют издали. Всё вытекает из грамотно построенного двойного защитного блока. Александр Селихов уже собрал хорошую прессу, а такая статистика помогает понять, что это не напрасно, но вы ещё присмотритесь к Николаю Зайцеву и Георгию Джикии – как минимум в системе «Амкара» оба впечатляют.

Беленов оправдывает «Анжи». Многообразие статистики в том, что хоть какие-то цифры оправдают логически невозможный подъём в таблице. Видеть «Анжи» не на дне таблицы заставляет Александр Беленов, перезагрузивший карьеру после вылета «Кубани» в ФНЛ, который не обошёлся без его привозов. Сейчас Беленов пропускает только с каждого 16-го удара, а с защитой «Анжи», позволяющей бить много и из удобных положений, это сродни подвигу. Лучше статистика лишь у Акинфеева и вышеупомянутого Селихова.

www.championat.com

Как xG захватывает мир футбольной статистики - Hello - Блоги

Блог Hello подробно рассказывает об одном из самых важных и недооцененных статистических показателей.

Эгил Ольсен – бывший тренер сборной Норвегии и автор одной из первых xG-моделей

Что такое xG?

xG («expected goals») – это модель ожидаемых голов. В основе такой модели лежит показатель (как правило, удары по воротам – это не всегда удары по воротам, но на данном этапе будем отталкиваться от того, что они и есть наш показатель), который помогает заглянуть дальше счета на табло и оценить, сколько голов при прочих равных должна была забить команда с ударами такой остроты.

Каждому удару каждой команды присваивается коэффициент опасности (в каждой xG-модели он присваивается по-разному, с конкретными примерами разберемся позже). Коэффициенты суммируются – мы получаем что-то вроде альтернативного счета матча, основанного на качестве созданных каждой из команд моментов. Следует оговориться, что в качестве базового показателя не всегда выступают удары по воротам (иногда это удары в створ, в одной из последних моделей и вовсе передачи в «убойной зоне»).

Еще не заснули? Тогда вот вам любопытный факт/полезный пример. Автором первой относительно известной xG-модели можно считать Эгила Ольсена, тренера сборной Норвегии на ЧМ-1994 и ЧМ-1998 (кстати, интересные рассказы о других его статистических опытах есть тут и тут). «Я не в состоянии доверять победе со счетом 1:0, если мы нанесли всего один удар, который стал голевым, а соперник бил по воротам 10 раз. Точно так же я никогда не стану зацикливаться на поражении со счетом 0:1, если у моей команды было 10 ударов, а у соперника – 1. В плане измерения того, насколько хорошо или плохо сыграла команда, удары по воротам даже более важный показатель, чем сами голы», – высказался однажды он.

Ольсен признавал, что не все удары равны, поэтому однажды он решил разделить удары по воротам на 3 категории: «очень большая перспектива гола», «средняя перспектива гола» и «гол практически исключен». Вооружившись этой простой моделью, Ольсен провел немало исследований и пришел к неожиданному для себя выводу – переход от простого подсчета ударов к модели с 3 категориями не оказал практически никакого влияния на его исследования. Как правило, на дистанции количество ударов разных категорий уравновешивалось.

Конечно, система и ключевой вывод Ольсена были далеки от идеала по банальной причине субъективности модели, которую, откровенно говоря, смешно сравнивать с современными аналогами, учитывающими в каждом ударе десятки объективных факторов. Но этот пример отлично олицетворяет простоту принципов, которые лежат в основе xG-моделей. Каждый из вас при желании может пройти путем Ольсена – хотя, используя только субъективные показатели, вы не получите ничего, кроме систематизированной версии вашего восприятия моментов каждой из команд (что тоже может быть полезно).

И действительно, несмотря на модную аббревиатуру и многочисленные попытки записать xG в «advanced stats», одно из главных достоинств показателя в его простоте. Сразу понимаешь, что перед тобой сумма остроты всех созданных командой моментов. Точно так же даже интуитивно без труда можно прийти к выводу, что, если команда выступает лучше, чем должна, исходя из xG-модели, то она… выберите определение, которое вам ближе – в отличной форме/дико эффективна/слишком удачлива.

Кто уже пользуется xG?

Мэттью Бенхэм (слева на фото) использует модель для управления «Брентфордом» и «Мидтьюлландом»

Однажды владельца «Брентфорда» Мэттью Бенхэма спросили, как он оценивает шансы клуба на промоушн. За несколько туров до финиша команда шла на 3-й позиции в Лиге 1, но вместо стандартной фразы аля-«Верю, что поборемся!» с предельно серьезным выражением лица Бэнхэм ответил: «На данный момент наши шансы на выход в чемпионшип – 42,3%».

История Бенхэма (по крайне мере, та ее версия, которую он сам предпочитает рассказывать) очень интересна и даже вдохновляюща. Мэттью сколотил многомиллионное состояние, регулярно обыгрывая футбольных букмекеров. Разумеется, свою систему он не думает раскрывать, но известно, что он исходил из тезиса, что «голы – очень ненадежный показатель истинного уровня игры команды в конкретном матче». Как следствие, используя другие показатели можно выявить недооцененные (в том числе букмекерами) команды. Среди показателей, которые он использовал, ключевую роль играла его собственная основанная на ударах по воротам xG-модель.

Теперь Бенхэм владеет не только «Брентфордом» (уже добравшимся до чемпионшипа), но и «Мидтьюлландом» (который, благодаря его аналитическим методам, стал чемпионом Дании и выбил «Саутгемптон» из Лиги Европы). Он также управляет компаниями SmartOdds (контора, предоставляющая данные профессиональным игрокам на ставках) и MatchBook (букмекерская контора).

***

«После каждого матча мы анализируем количество созданных командой моментов и количество ожидаемых голов, которые мы должны были забить с моментами такого качества. На данный момент существует дефицит между качеством наших шансов и количеством забитых нами голов», – сказал на одной из пресс-конференций этого сезона Арсен Венгер.

Цитата послужила не только подтверждением того, на каком уровне уже используется показатель, но и того, насколько хорошим индикатором качества игры он может быть. Вывод из модели, которую использует «Арсенал», вполне совпадал с данными общедоступных xG-моделей. Как и следовало ожидать, исходя из xG-данных, результаты команды резко улучшились. После той самой пресс-конференции «канониры» выиграли 7 из следующих 8 матчей АПЛ (до – 1 из 3).

Разумеется, каждому такому случаю нужен контекст, и причина такого контраста не только в регрессии к среднему, но это далеко не первый случай за последние годы, когда xG-данные успешно предсказывают ренессанс команды (несколько примеров из прошлого сезона – победная серия «Ньюкасла» при Пардью в первой половине сезона, «Арсенал» и «Барселона» во второй части сезона).  

***

В октябре этого года глава статистической компании 21st Club Омар Шадхури сообщил, что минимум один владелец клуба АПЛ на еженедельной основе изучает данные модели ожидаемых голов.

***

В недавнем интервью Дамьен Комолли рассказывал, как во время его работы в «Ливерпуле» принималось решение о потенциальной смене вратаря. Он не называет используемую методику xG-моделью, но описывает очень схожие принципы.

***

Люди из футбольного мира крайне неохотно делятся настолько глубокой информацией о своих методах. Практически уверен, что скоро мы узнаем о новых случаях применения xG-моделей, но и этих примеров должно быть достаточно, чтобы показать растущую значимость метода.

Что xG может показать?

Модели ожидаемых голов можно сравнить с моделями предсказание итогов выборов. Не существует 0,21 гола или голоса, но, присваивая им основанные на определенных факторах коэффициенты, можно получить массу дополнительной информации о выборах и футбольных матчах.

Модели ожидаемых голов никогда не станут инструментом предсказания отдельных матчей (просто-напросто потому что 20-40 ударов, которые наносятся за матч, никак не соответствуют нескольким миллионам голосов, и их недостаточно для полноценной регрессии к среднему), но они несут важную информацию о качестве моментов команды в матче, следовательно, и об общем качестве ее игры.

Футбол – спорт очень низкой результативности. Вместе со значимостью отдельных эпизодов (как правило, голов) неизбежно растет значимость удачи/фактора случайности. При прочих равных можно утверждать, что хорошая модель ожидаемых голов отражает качество игры команд намного лучше турнирной таблицы и меньше зависит от случайностей.

Как уже упоминалось ранее, существенные расхождения в xG-результатах и реальных результатах нередко сокращаются на более-менее продолжительной дистанции. У случаев, когда этого не происходит, могут быть разные причины, например: 1. тренер команды, которая показывала результаты, но плохо играла, не игнорировал слабое качество игры и внес изменения. 2. команда – интересный пример для изучения, а модель недооценивает какой-то из аспектов ее игры. 3. даже на дистанции всего сезона команды наносят около 600 ударов, что не так уж много для регрессии к среднему.

Подытоживая, хорошая xG-модель в правильных руках может служить: 1. индикатором удачи/неудачи команды в отдельном матче (разумеется, только при значительном расхождении с реальным результатом). 2. базисом для долгосрочных прогнозов (слово «базисом», а не самим прогнозом, тут ключевое и, разумеется, с любыми прогнозами нужно быть острожными, но, пожалуй, xG – лучшая из доступных для футбольных прогнозов альтернатив).

Какие xG есть в открытом доступе уже сейчас?

Модель Майкла Кэйли

Основана на: ударах по воротам

Краткое описание модели: каждому удару присваивается коэффициент от 0 до 1 в зависимости от типа удара (прямой со стандарта, головой после навеса, ногой после обводки вратаря и т.п.), позиции нанесения удара, типа паса, который привел к удару (вразрез, навес и т.п.) и позиции с которой он был отдан, типа атаки, приведшей к удару (контратака, позиционная, стандарт и т.п), типа момента перед ударом (обводка, удар в касание и т.д.), дистанции, которую бивший футболист пробежал с мячом, положения команды в матче (проигрывает, выигрывает, играет вничью).

Полное описание модели на английском

Мой комментарий: пожалуй, лучшая из общедоступных моделей ожидаемых голов. Хорошо продумана, значимость практически каждого из факторов основана на серьезных статистических исследованиях; также постоянно совершенствуется автором.

Пример xG-карты матча:

Как следить: твиттер автора, время от времени обновляемые страницы с данными по АПЛ и европейским лигам.

Модель tegen11

Основана на: ударах по воротам

Краткое описание модели: каждому удару присваивается коэффициент от 0 до 1 в зависимости от типа удара, позиции нанесения удара, места начала атаки, приведшей к удару, типа паса, который привел к удару, типа момента перед ударом, скорости атаки, положения команды в матче.

Полное описание модели на английском

Мой комментарий: альтернатива модели Кэйли. Тоже использует данные от Opta и учитывает практически всю возможную информацию об ударе.

Расхождения между двумя моделями не так уж велики. Например, tegen11 включает пенальти в модель с коэффициентом 0.76, Кэйли считает нецелесообразным сравнивать их с остальными эпизодами и просто отдельно помечает, что во встрече был пенальти, но не включает их в модель. Или: tegen11 учитывает скорости атаки, Кэйли отражает схожую информацию в типе атаки.

Пример xG-карты матча:

Как следить: твиттер автора.

Модель Пола Райли

Основана на: ударах в створ ворот

Краткое описание модели: каждому удару в створ присваивается коэффициент от 0 до 1 в зависимости от позиции нанесения удара.

Полное описание модели на английском

Мой комментарий: слишком упрощенная модель. Упомянул ее только из-за удобных и оперативно обновляемых таблиц (см. ниже) и архива данных за последние сезоны АПЛ.

Как следить: таблицы Tableau с удобными фильтрами.

Каковы основные недостатки xG?

Этот раздел будет скучным (прямо очень, даже скучнее того, что вы прочитали проскролили выше) с кучей технических моментов. Я не обижусь, если вы его пропустите. Для тех, кто пойдет этим путем, отмечу: xG вполне работоспособная и даже крутая вещь, а речь пойдет о мелких недостатках, среди них нет критических огрехов, которые перечеркнули бы изложенную выше пользу от моделей.

Разберемся в недостатках на примере модели Майкла Кэйли, которой я пользуюсь чаще, чем остальными.

1. Ситуации, которые не завершаются ударом

Нет удара – нет увеличения xG. Но отдельные эпизоды, которые не завершаются ударом, выглядят острее большинства ударов (особенно дальних, которые засчитываются, пускай и с небольшим коэффициентом). В идеале такие моменты хотелось бы отражать, но делать это объективно и автоматически на данном этапе невозможно. Недостаток некритический, так как едва ли в мире есть команды, умышленно не бьющие из выгодных позиций.

2. Дальние удары

Есть тот тип дальних ударов, которые наносят только в том случае, если игрок заметил серьезный изъян в позиции вратаря и верит в значительную вероятность гола. Например, xG-вероятность голов Чарли Адама, Микеля Сан Хосе и Алессандро Флоренци стремилась к 0, что логично исходя из позиции удара, но на деле она должна была быть выше, так как игроки в 99% случаев не бьют из таких позиций, если не видят ошибку в позиции вратаря.

3. Модели все равно, кто бьет

Разумеется каждый из нас предпочел бы видеть Лионеля Месси, а не Джонни Эванса, выходящего 1 на 1 с вратарем соперника в футболке любимой команды. И, пожалуй, наоборот Эванса, а не Месси, в ситуации с ударом головой в борьбе после углового. Модель на данный момент не в состоянии учесть разницу в мастерстве игроков завершать атаки.

Проблема не в последнюю очередь в том, что эдакий скилл завершения атаки в футболе практически невозможно измерить: 1. в футболе наносится слишком мало ударов для того, чтобы объективно оценить даже тех нападающих, которые бьют чаще остальных (например, часто бьющие хоккеисты наносят порядка 800 ударов за сезон, у часто бьющих футболистов уходит 5-6 лет на аналогичное количество ударов). 2. из-за такого малого количества ударов цифры реализации ударов сильно разнятся у одних и тех же игроков от сезона к сезону.

Можно привести массу отдельных вопиющих примеров, подчеркивающих значимость скилла завершения атаки у отдельных игроков, но два важных момента, позволяющих не считать недостаток критическим: 1. в последние годы поддерживать уровень реализации, который был бы стабильно выше показателя голов, которые они должны были забить, исходя из xG, удавалось только 2 игрокам (да-да, Месси и Роналду). 2. статистика показывает, что при сравнении большого количества игроков значимость этого фактора уменьшается:

4. Практически невозможно полностью учесть расположение защитников

xG-модели пытаются обойти этот момент. Например, учитывая скорость развития атаки, наличие явной индивидуальной ошибки защитника, обводки футболистом противника перед ударом и т.п. Но все это не одно и то же с реальным осознанием того, сколько давления со стороны оборонительной стороны оказывается на игрока в момент удара. К сожалению, в рамках показателей, которые считает Opta, пока нет объективного способа это отразить.

5. Слегка недооцениваются команды, которые умышленно медленно атакуют

Утверждение, что при прочих равных быстрые атаки опасней и с большей вероятностью могут завершиться голом, правдиво и подтверждается статистикой. Разумеется, проще атаковать соперника, чьи игроки еще не успели вернуться в оборонительную схему. Разумеется, в большинстве случаев затянувшееся владение мячом будет означать просто-напросто то, что команда ничего не может поделать с обороной противника.

Но в отдельных редких случаях (здравствуй, Луи) такие затянувшиеся владения – часть тренерского умысла (философии) и необязательно значат несостоятельность в атаке. Команды, играющие в такой футбол абсолютно в каждом матче, могут слегка недооцениваться системой. Слово «слегка» тут важно – тип атаки оказывает не такое уж большое влияние на итоговый коэффициент, удар из убойной позиции после очень медленной атаки получит очень высокий коэффициент (просто чуточку меньший, чем после быстрой атаки).

6. Трудности с ситуациями с несколькими ударами за одну атаку

Допустим, команда наносит 4 убойных удара за одну атаку. Сумма их xG-коэффициентов составляет, например – 1,44. Но мы же отлично понимаем, что даже теоретически команда не может забить больше 1 гола за одну атаку. Следовательно, засчитывать ей 1,44 в корне неверно. А что верно? Засчитать только самый опасный из 4 ударов (на данный момент применяется именно это решение)? Логично, но тоже не до конца верно так, как вероятность забить гол в атаке с 4 убойными ударами выше, чем вероятность забить одним, самым опасным, из этих ударов.

7. Автоголы, пенальти

На данный момент они просто-напросто не учитываются, а помечаются отдельной строкой.

Итого

xG-модели – полезнейший инструмент для глубокого и достаточно объективного анализа, а также неплохой для долгосрочных прогнозов. Более того, как показывает практика, система может быть полезна не только аутсайдерам футбольного мира (нам), но и самим клубам. Вполне возможно настанет день, когда владельцы будут широко ее применять для решений о тренерских отставках/назначениях, а сами тренеры – для выбора момента смены тактики. Что станет существенным шагом вперед от текущий ситуаций, в которой большинство решений принимаются на основе общественного мнения/давления и рэндомных факторов (конечно, при условии, что она будет не единственным ориентиром таких решений, а только одним из).

Если мне удалось заинтересовать вас, но у вас остались вопросы – велкам в комментарии. Если вы не согласны с ключевыми выводами по моделям – аналогично, буду рад обсудить с вами их критику.

Топовое фото: Global Look Press/Carmen Jaspersen/dpa

by.tribuna.com


Смотрите также