Уже далеко не секрет, что все виды спорта пытаются разложить на цифры и математические модели. Подобная мода пришла из США, где полно настоящих гиков в мире статистики и цифр, а потому вполне понятно, что наибольший успех обсчета спортсменов и их результатов достигнут именно в американских лигах. Больше половины команд бейсбольной лиги оперируют цифрами сабметрики, там это уже норма, продвинутая статистика успешно работает в НБА и НФЛ, некоторые успехи замечены в НХЛ. Понятно, что делом времени была и оцифровка футбола.
Оцифровать футбол пытались и раньше, можно вспомнить знаменитые ТТД Лобановского, а сейчас и Бубнова. Однако подсчет ТТД в чем-то устарел и не отражает всех реалий на поле, потому что содержит в себе достаточно отвлекающих статистических шумов, из-за чего велика погрешность. Вполне возможно, что сейчас Лобановский предложил бы адаптированный вариант оцифровки.Можно сказать, что на смену ТТД пришел xG. Аббревиатура xG от «expected goals» (ожидаемые цели) – это ничто иное, как статистическая модель ожидаемых голов. В основе ее лежит подсчет опасных моментов от производимых командой ударов. Нужно отметить, что каждый удар имеет свой коэффициент опасности и формировался эмпирическим путем.
Коэффициенты произведенных ударов суммируются, и получается альтернативный исход, который формирует представление о качестве игры команды. Если рассматривать эти цифры от тура к туру, то можно получить не только альтернативную таблицу, а и увидеть эффективность действий каждой команды, за счет чего был добыт успех, спрогнозировать возможный спад или подьем команды.
Считается, что первым подобную модель анализа использовал норвежский тренер Эгил Ольсен. Он считал, что количество ударов является ключевым показателем эффективности команды на поле, а потому и прибегал к альтернативному подсчету эффективности действия игроков. При этом, как человек здравомыслящий, он соглашался, что удар удару рознь, а потому применял градацию опасности ударов, чтобы получить более объективные средние числа.
На данный момент гуру системы подсчета xG принято считать Майкла Кэйли. Он учитывает не только сам удар, а и ситуацию, в результате которой возможность для удара получилась. Учитывается все, удар после дриблинга или кросса, после какого паса была получена возможность для удара и ряд других факторов, которые дополняются в его модели. Пенальти он выносит за скобки, указывая его отдельно.
Стоит отметить, что более упрощенные модели предлагают рассматривать пенальти в общей массе опасных моментов, присуждая статистически оправданный коэффициент опасности - 0.76. Например, такой принцип применяется у модели tegen11 или при подсчете РФПЛ NVasyukhin.Важно отметить, что у этой в целом объективной системы анализа и возможного моделирования будущих тенденций есть несколько недостатков.
Система пока никак не учитывает, кто наносит удар. Все-таки есть разница, когда бьет Месси или Кокорин. Достаточно сказать, что лишь Месси и Криштиано Роналду перевыполняют план потенциальных голов метода xG, их реализация выше. Немаловажно и то, кто стоит на воротах. Этого модель тоже не учитывает, что дает определенную погрешность в расчетах. Но эта погрешность, по мнению авторов расчетов, должна привести к средним цифрам после достаточного количества средних игр. И вот тут мы плавно подошли к еще одной проблеме, в футболе, в отличие от НБА, НХЛ, MLB количество игр сезона значительно меньше, если говорить про национальные чемпионаты, то даже втрое меньше. Из-за этого ряд статистических тенденций найдет свое подтверждение несколько позже, не вместившись в отрезок одного сезона, при условии, что команда не вносила кардинальных изменений в ростер, не меняла тренера. К примеру «Суонси» был хорош в сезоне-2014/15, его все хвалили, но не обращали внимание на показатели xG, которые говорили о том, что команда набирает больше очков, планируемого статистической моделью. В итоге менеджмент был доволен, реальных изменений ни в тренерский состав, ни в ростер не вносил, а в новом сезоне результаты команды пошли вниз. Ситуация с «Лестером» Раньери в этом смысле тоже показательна, «лисы» перевыполнили план набранных очков, относительно статистической модели и получили регресс в сезоне нынешнем. Понятно, что здесь важную роль сыграла психология, потеря Канте, однако цифры тоже играют немалую роль. Проблемы «Вест Хэма» тоже можно было просчитать, их показатели по системе xG проецировали значительно меньше набранных ими очков, откат к средним значениям мы и наблюдаем сейчас.
Стоит отметить, что чемпионом мира по xG считается лондонский «Арсенал» Венгера. Во многом это обусловлено тем, что «канониры» активно работают со статистическими данными этой системы и это позволяет, а потому они стараются наносить как можно больше ударов из статистически выгодных положений. Почему же им не удалось выиграть титут в таком случае? Можно говорить о психологии, качестве реализации своих опасных ударов, травматичности лидеров. Все это так, но цифры вещь упрямая, если суммировать очки двух последних сезонов и сезона нынешнего, то лучшая команда по набранным очка как раз «Арсенал» Венгера. Это говорит о том, что в системе НБА, где 82 игры в регулярке у них были бы куда лучшие шансы на итоговую победу, благодаря правильным действиям на поле с учетом расчетов модели xG. Пока для меня это самое слабое место попытки оцифровать футбол, так как выборки результатов не хватает на один сезон.
Потому на данный момент говорить о том, что показатели xG позволят с хорошей точностью прогнозировать каждый отдельный матч мне кажется преждевременным. Скорее это пока дополнительный инструмент при анализе, который в цифровом значении показывает качество игры команды и относительно набранных очков позволяет задавать вопросы, получать ответы и прогнозировать тенденцию относительно некоторых команд на сезон и, возможно, на будущие сезоны, при учете, что система построения игры и исполнители кардинально не менялись.
Разберем на примере РФПЛ.
Таблица РФПЛ после сыгранных 11 туров.
Сразу бросается в глаза, что питерский "Зенит" не зря в лидерах чемпионата, они просто таки доминируют и по качеству игры в системе xG. "Спартак" напротив кажется командой переоцененной, во многом из-за того, что смогли забить в полтора больше больше ожидаемых голов статистической модели. Эта интересная информация накануне московского дерби против "ЦСКА", так как команда Слуцкого лишь слегка перевыполняет план по набору очков относительно показанных статистических показателей, но пропустили даже больше чем позволили создавать, а это ведь лишь 6 голов в 11 играх, но и забили больше созданного. Если говорить языком цифр, то получается, что в предстоящем матче ЦСКА выглядит небольшим фаворитом, хотя букмекеры считают наоборот, отдавая предпочтение "красно-белым". Понятно, что модель не учитывает психологию, проблемы Слуцкого, а оттого будет любопытно проверить на деле, кто прав в отдельном матче. Но с форой (0) на армейцев я бы рассмотрел.
Больше других недобрали очков "Локомотив", "Рубин", "Оренбург", "Крылья Советов". Значительно выше статистических показателей идет Спартак, о котором я говорил выше, Анжи и "Ростов" с уникальной реализацией, которая двоекратно превышает показатели модели качества создаваемых моментов. Здесь будет уместно указать на особый стиль ростовчан, модель игры Бердыева не предполагает доминацию даже с середняками и аутсайдерами, а потому и статически цифры размываются, при этом хорошо видна реализация, что нужно учитывать при анализе возможностей команды.
Также предлагаю вам ознакомиться с рейтингом команд других чемпионатов, построенным на основе метода xG.
Рейтинг xG испанской Примеры.
Как можно увидеть из расчетов, "Алавес" несмотря на приличный старт забрал лишние очки, как и "Атлетик" с "Севильей". А вот недосчитались больше других "Гранада", "Осасуна" и "Барса".
Бундеслига.
Интересные данные можно было наблюдать в Германии после 6 тура, когда в топе-5 лучших команд по качеству игры относительно метода xG можно увидеть "Ингольштадт", которые показали рекордный дефицит очков во всех европейских чемпионатах. Эти данные пригодились бы всем, кто играл дортмундцев на выезде против "Ингольштадта" в 8 туре.
Эредивизия.
Метод xG позволяет планировать и делать долгосрочные прогнозы. К примеру, в Эредивизии, небольшим фаворитом можно считать ПСВ в борьбе за чемпионство, несмотря на их 6 очковое отставание от "Фейенорда" и "Аякса".
Завершить обзор предлагаю самым интересным европейским чемпионатом на данный момент, извини РФПЛ, но речь не от тебе.
АПЛ.
Рейтинг защиты АПЛ.
Общий рейтинг эффективности команд АПЛ.
Твиттеры, откуда брать xG-результаты:
1) Caley Graphics: https://twitter.com/Caley_graphics2) 11tegen11: https://twitter.com/11tegen113) РФПЛ: https://twitter.com/NVasyukhin
На этом все, мой лонгрид завершен. Интересно будет обсудить прочитанное в комментариях. Как вы относитесь к данной модели, насколько уместно ее использовать в ставках, давайте разговаривать.
Следите за обновлениями!
Всем профита!
legalbet.ru
Многие из вас, наши дорогие читатели, наверняка смотрели прекрасный фильм “Человек, который изменил все” с Брэдом Питтом в главной роли (если еще не успели сделать это - то обязательно посмотрите), а потому должны понимать, что спорт в наше время напрямую связан с математикой. Сегодня все ведущие клубы в мире имеют в своих штабах аналитиков, зацикленных на статистике, и “Футбологика” считает, что для повышения класса специалистов в нашей сфере стоит рассказать о том, к каким системам стоит прибегать.
Наиболее популярной и успешной сейчас является система xG, т.е. система expected goals - ожидаемых голов, которая позволяет проанализировать качество создаваемых командой моментов и заглянуть дальше счета на табло, предугадывая, каким он мог бы быть при прочих равных. Да, звучит немного утопично, но, как правило, на длинной дистанции результаты уравниваются и система проявляет себя.
Не верите? Давайте приведем пару примеров: тот же самый “Лестер”, который восхищал всех в сезоне 15/16, явно не обошелся без должного везения и перебрал очков в матчах, где явно уступал по xG, а потому вполне ожидаемо регрессировал в следующем сезоне (хотя Раньери с этим яро боролся и если бы ему дали шанс выровнять результаты, мы бы понаблюдали за Лестером в верхней половине таблице чуть подольше), ну или российская версия “Лестера” со своим “Раньери” - “Ростов”, который за счет невиданного настроя смог неплохо выступить на отдельно взятом отрезке (групповой этап ЛЧ, сезон 15/16), но в итоге вернулся на свое любимое место в середине таблицы и ниже. Что объединяет эти команды? Небольшой процент владения мячом, игра, поставленная на контратаках? Да, но это не те показатели, которые делают их “везучими” - условный Моуриньо ставит во всех своих коллективах такой футбол и его не назвать “везучим”. Вы можете делать все, что хотите до финальной трети, но если вы не добираетесь до зоны 17 и набираете очки - ждите беды.
Принцип xG основан на том, какие моменты вы создаете. Если вы забиваете из зоны 13/14/15 из матча в матч, при этом не имея конкретных шансов в зоне 17, то можно сделать вывод о том, что либо у вас есть потрясающий ударник, либо у вас есть проблемы с доставкой мяча дальше. Условный “Спартак” в сезоне 16/17 во многом взял свое чемпионство за счет матчей, выигранных лонгшотами Глушакова, которые в сумме не дадут и 1xG. Мастерство? Фарт? Известно одно: после этого у москвичей был вполне ожидаемый и болезненный спад, а сам Денис за полгода больше ни разу не забил из-за пределов штрафной, и от позорного провала “красно-белых” спасла только определенная смена тактики Каррерой.
Думаем, эти жизненные примеры смогли дать вам первые представление о работе системы xG: каждый удар, в зависимости от положения бьющего, получает свой коэффициент опасности. На словах все довольно просто, но как же это обсчитывают?
После статьи мы оставим вам те источники, в которых можно стабильно находить xG-результаты топ-чемпионатов, но если вы решитесь понять процесс того, как вывести эти самые циферки и делать это самим, то вам пригодится терпение и глубинное понимание теории вероятности: обсчитывание xG происходит на базе данных, полученных от аналитических платформ, таких, как Opta, в специальных программах, основанных на принципах теории вероятности, и дальнейший прогноз выявляется по формулам, выведенным из старых массивов данных (т.е. старых результатов команды), но на данном этапе нам понадобится лишь только примерное понимание об xG, как об индексе качества момента, который можно интерпретировать как вероятность забить гол.
Получив xG, по нему уже можно делать все, что угодно душе: предугадывать результаты команд на длинной дистанции, или разбирать определенных игроков на предмет потенциала, что очень и очень полезно для скаутов. Как же конвертировать эти цифры в успехи на поле? Давайте разберемся.
Один из главных промоутеров, если так можно выразиться, системы xG в массы - владелец английского “Брентфорда” (и также “Мидтьюлланда”) Мэттью Бэнхэм - прославился тем, что как-то, когда его клуб шел на третьем месте за несколько туров до конца чемпионата, на вопрос о перспективе выхода в Чемпионшип ответил довольно необычно, заявив, что их шансы равняются 42,3%. Откуда такая уверенность? Вполне можно предположить, что цифры взяты из xPoints - уже более материального показателя, основанного на xG. Ниже вы можете увидеть пример таблицы xPoints - АПЛ сезона 16/17. Довольно занятная табличка, кстати: если раньше мы говорили о примерах регресса из-за перебора относительно xG, то тут наоборот: в первый год своей работы в МанСити Пеп выстраивал свое “Juego de Posición” и, несмотря на многочисленную критику, показывал наиболее созидательную игру в чемпионате. В итоге он разрушил стереотип об АПЛ, как о чисто физическом чемпионате, и к Boxing Day сезона 17/18 его “Сити” занимало чистое первое место с двузначным отрывом от ближайшего преследователя.
Как вы уже наверняка догадались, xPoints легко высчитывают по кол-ву xG за игру, и на данный момент мы будем рассматривать только два этих показателя. Если эти цифры нужны вам, например, для того, чтобы проанализировать будущего соперника, то для вас есть целая куча интересных графиков еще помимо таких табличек: xG-карта матча, по которой вы можете проследить опасность каждого отдельного момента; xG-Plot матча, по которому можно отследить динамику изменений в игре команд, а также карты перепасовок, считающие пользу каждого игрока, по которым можно распределять персональные задачи на игру, а также, если вы занимаетесь скаутингом, определять стиль футболиста и его роль в команде.
пример с матча “Кристал Пэлас” - “Манчестер Сити”
Также, если вы занимаетесь скаутингом, то вам очень пригодятся индивидуальные таблички по xG и xA(то же самое, что с и xG, т.е. это - показатель того, сколько было бы у игрока ассистов, если бы его партнеры реализовывали созданные им шансы). Конечно, слепо полагаться на такую статистику нельзя, и всегда стоит отсмотреть несколько полных матчей, для того, чтобы хотя бы поверхностно оценить игрока, но подобные цифры могут пригодиться для отсеивания переоцененных игроков и длительного анализа тех, кто чем-то вас зацепил.
Вот, допустим, у нас есть пример выше - таблица лучших ассистентов РФПЛ по xA, в которой наверху расположен неизвестный бол-ву Арсен Хубулов, но, как мы видим, он сыграл меньше условного Промеса почти на тысячу минут меньше, что тоже надо учитывать, ибо с увеличением игрового времени цифры будут обратно пропорционально падать, но то, что он там оказался - уже повод записать фамилию "Хубулов" в свой блокнотик.
Подытоживая, хочется сказать, что xG - определенно musthave для каждого, кто хочет работать в сфере футбола: от игроков до скаутов и журналистов, нововведение, которое при правильном пользовании в меру дает большие возможности отсеивать некачественных футболистов и разглядывать потенциал в тех, в ком это было мало ожидаемо.
паблик Блокнот
твиттер 11tegen11
твиттер Майкла Кэйли
P.S. Основой для написания статьи послужили записи во все том же паблике Блокнот и в блоге Hello на Sports.ru, а также тексты на портале carrick.ru. Использованы картинки 11tegen11 и блога еженедельника “Футбол”.
www.futbologika.com
«Если сравнивать футбольную аналитику с традиционной медициной, мы сейчас находимся на уровне пиявок и кровопусканий», – говорит Марк Брункхарт, основатель статистической компании Match Analysis. Футбольной аналитике далеко до бейсбольной, она находится только в стадии зарождения, но уже сейчас открыты мощные возможности для оцифровки игры № 1. Всё чаще игру команды оценивают не по забитым голам, а по ожидаемым забитым голам, но чаще продвинутую статистику используют на дистанции. Оценить конкретный матч сложнее из-за суженных рамок оценки, небольшой выборки.
Матчем для оценки продвинутой статистики стала игра «Севильи» и «Реала», она во многом показательна. Результаты на дистанции отражаются на итоговом счёте конкретного матча, который при этом не вытекает из логики игры. Конкретных футболистов продвинутая статистика помогает оценить и по одному матчу, но тоже не без погрешностей.
Что это? Вам уже точно прожужжали уши xG, так что, наверное, вы уже знаете – это система вычислений, оценивающая отдельно каждый удар по воротам в зависимости от различных факторов: позиция, с которой нанесён удар, часть тела, точка, откуда сделана передача, и т. д. Недостатки системы хорошо известны, например, не оцениваются опасные атаки, не завершённые ударом по воротам. В настоящее время это самый близкий к реальности способ оценки игры команды на дистанции – xG-вычисления по одному конкретному матчу редко дают пищу для размышлений.
Существует уже достаточно xG-моделей, я выбрал для анализа модель 11tegen11 – чтобы не было цифровых расхождений с другими показателями. Сразу важно понять, что xG лучше и качественнее трактуют ход команды по сезону, чем один отдельно взятый матч. Например, «Севилья» по подсчётам xPoints SciSports была самой перебирающей очки командой испанской Примеры – на 6 очков больше, чем должно быть в реальности. Вариантов два: либо такова модель игры (чаще такая трактовка применима к командам, обожающим счёт 1:0, вроде «Ювентуса»), либо место в таблице обусловлено во многом везением.
Глядя на xG, можно понять, что «Севилья» именно перебирает очки и в дальнейшем такое везение должно закончиться. Андалусийцы нанесли за матч всего 5 ударов из штрафной площадки, ни один из них не оказался «жирным», хотя бы как у «Реала», а голевым стал самый неопасный удар «Севильи» за весь матч от Стевана Йоветича издалека – на карте вы легко найдёте этот удар. Проблема в том, что xG не учитывает некоторых теневых показателей, не зависящих от бьющего игрока. В случае с голом Йоветича налицо ошибка Кейлора Наваса, потерявшего ворота, но ни одна xG-модель не учитывает положения вратаря. Алессандро Флоренци забивал «Барселоне» от центральной линии, но разве этот удар действительно «весил» 0,01 xG, учитывая ошибочное положение тер Штегена в воротах?
Вероятно, в будущем модель будет отрегулирована, станет учитывать человеческий фактор, но пока можно оценивать только игру бьющих. И в контексте конкретного матча утверждать, что «Реал» не заслужил того, чтобы прервать свою 40-матчевую серию.
Что это? Графика, объясняющая динамику изменений xG по ходу матча – с поминутно расписанной статистикой «веса» ударов по воротам. Частично она развеивает недовольство людей, считающих, что xG-динамика команд зависит от многих факторов и один из ключевых – быстрый гол, позволяющий играть «от печки». В таких матчах общий коэффициент Expected Goals у команды, пропустившей на старте матча, часто будет больше, а итоговый счёт 0:3 не в её пользу будет соотноситься в первую очередь с везением. XG-Plot помогает понять природу таких матчей, конкретно одиночный случай он описывает лучше, чем xG.
Обычно xG-Plot оправдывает победившую команду с маленьким xG, но в данном случае графика показывает победу «Севильи» нелогичной и аномальной. Окей, матчи, когда команда с меньшим весом ударов, чем у соперника, не проигрывает, являются нормой – 11tegen11 обсчитал 43 матча на выходных, из них лишь в 22 побеждала команда, чьи удары были «увесистее» (51,2% побед, вытекающих из xG). Но, пропустив от Криштиану Роналду, «Севилья» нанесла всего 1 удар по воротам… и забила 2 мяча. Спасибо Серхио Рамосу.
Шансы «Севильи» на победу при таком xG равнялись 7%, и команда умудрилась её добиться – но в данном случае нельзя говорить, что «Севилья» прибавила или задавила «Реал». Скорее, это комплимент защите «сливочных», не позволивших сопернику ни разу за полчаса пробить из штрафной площадки, и очередное подтверждение слов Йохана Круиффа: «Случайность логична». Футбол – спорт низкой результативности, и везение здесь значит слишком много.
Что это? Packing – это сумма соперников, оказывающихся за линией мяча либо в результате передачи вперёд, либо после удачной обводки. По этому показателю можно считать как игроков, отдающих передачи (так проще понять влияние центральных полузащитников на атаку), так и тех, кто получает эти передачи, – это помогает понять игру форвардов в открываниях между линиями. Impect – это разновидность показателя Packing, учитывающая исключительно отрезанных защитников. Внимание: статистику Packing очень сложно встретить в открытом доступе – она высчитывается исключительно вручную и требует больших временных затрат.
9 главных тактических идей года
Главное, ради чего нужен Packing, – оценивать игру актёров второго плана, крайних защитников и опорных хавбеков: продвинутая статистика помогает понять их участие в атаке, хвалить Хаби Алонсо и Серхио Бускетса за вклад в игру, незаметный на первый взгляд. Packing не предсказывает будущего, это в первую очередь качественный инструмент для оценки игроков. Главный матч испанских выходных как раз идеально показывает, зачем нужна такая статистика.
Во-первых, Packing заставляет поговорить о Стивене Н’Зонзи. Роли в нынешней «Севилье» чётко разграничены, Packing тоже наглядно это показывает – если вклад Иборры, выходящего в составе от случая к случаю, в атакующую игру минимален и он отрезает своими передачами меньше соперников, чем центральный защитник Рами, то Н’Зонзи на втором месте среди игроков «Севильи» по количеству отрезанных соперников. Более того, по количеству отрезанных в момент приёма мяча (оценка уже принимающего, а не пасующего) Н’Зонзи тоже в тройке лучших среди андалусийцев, уступая только самым динамичным игрокам команды, Витоло и Насри.
Во-вторых, бросаются в глаза неприлично слабые цифры Тони Крооса. На Евро-2016 Кроос отрезал соперников своими передачами чаще, чем кто-либо другой, а против «Севильи» делал это реже, чем Модрич и Касемиро. Здесь дело не в слабости Крооса, а в осознанной тактике Хорхе Сампаоли – Тони стал главной целью «Севильи» в прессинге, к нему постоянно приклеивался кто-то из андалусийцев. Вездесущий Н’Зонзи был самым активным и здесь. Как результат — «Реалу» пришлось строить атаки по-другому, гораздо чаще обычного через Серхио Рамоса (его Packing – лучший в матче, четырежды его передачи отрезали семь или больше соперников).
В комплексе эта статистика говорит нам, почему Стивен Н’Зонзи оказался среди лучших игроков испанской Примеры. Унаи Эмери видел его опорником-лесорубом, Сампаоли дал больше свободы и ответственности за первый пас. Если суммировать цифры по отданным и принятым передачам, Н’Зонзи будет в тройке лучших, как и в цифрах по отдельности. Этим же может похвастать лишь ещё один человек, благодаря которому «Севилья» дышит и регулирует темп, – Самир Насри. Packing помогает понять, что интерес «Барселоны» к французу в качестве сменщика Бускетса логичен и оправдан.
Что это? Графика 2 в 1 – тепловая карта со средним положением каждого игрока на поле, снабжённая статистикой передач, в которой выделяются связи между игроками. Чем жирнее точка, тем чаще футболист получал мяч. Чем жирнее стрелка от одной точки к другой, тем чаще футболист играл конкретно на своего товарища по команде.
Карта передач здорово отражает тактический план каждого из наставников на игру. У «Севильи» наблюдался явный перекос на левый фланг, где активно нагнетал Серхио Эскудеро (лучший Packing в команде), куда регулярно смещался Самир Насри, где очень часто пространство между линиями находил Витоло. При этом правый край был выключен из игры, а Виссам Бен Йеддер, единственный форвард «Севильи», постоянно смещался на фланг – как за мячом, так и при действиях без мяча. Незадолго до первого гола Криштиану Роналду загубил выход 2 в 1, и как раз Бен Йеддер был одним из тех, кто судорожно возвращался назад – в момент перехвата передачи он забежал в свою штрафную.
«Реал» Зидана как минимум позиционно идеально соблюдал выбранную тактику на матч – 3-5-2 с латералями, играющими ближе именно к атаке, а не защите, и глубоко посаженным опорником Касемиро. Здесь нет таких мощных связей, как квадрат «Севильи», но по карте схема «Реала» и взаимодействие игроков выглядят вполне адекватно.
Корреляция Packing и карты передач очевидна – тремя самыми жирными точками обозначены игроки с лучшим общим показателем отрезанных соперников в момент передачи и в момент приёма: Насри, Н’Зонзи и Витоло.
Футбол нужно оцифровывать, в дальнейшем он будет ещё сильнее завязан на цифрах и продвинутой статистике. Но нужно не допускать заблуждений. Первое: оценивать игру команды/футболиста исключительно по одному параметру. Если единственным мерилом силы команды будет xG, анализ сведётся к единственной шкале – «повезло/не повезло», что в принципе неправильно. Футбольная статистика уже сейчас позволяет рассматривать игру с разных ракурсов, и лучше оценивать их все, а не замыкаться на чём-то одном.
Второе: не нужно забывать про обычную статистику, лежащую на поверхности, – часто и она бывает показательной. Прямо сейчас «Севилья» – чемпион Испании по количеству голов с 90-й минуты, гол Стевана Йоветича стал уже шестым за сезон, забитым в решающее время. Если вспомнить про такую статистику, даже подобная победа «Севильи», неубедительная по цифрам, имеет свою логику.
В материале приведены подсчёты 11tegen11, SciSports и паблика «Пыльный чердак».
www.championat.com
Как делать успешные ставки по xG-модели на футбол , инструменту анализа, которому доверяет Арсен Венгер. xG-модель — попытка оценить уровень игры команд безотносительно счета матчей и выявить долгосрочные тренды, применимые для прогнозирования.
Cтавки на футбол — лучшие и беспроигрышные стратегии
Счет далеко не всегда отражает происходящее на поле. Сколько раз приходилось видеть, что одна из команд наносит 20 ударов по воротам, всю игру осаждает штрафную площадь соперника, но уступает 0:1, пропустив после единственного удара. Так ли плохо сыграла проигравшая команда? И если да, то насколько? А если нет, то насколько сильно ей не везло у чужих ворот?
Модель xG старается ответить на все эти вопросы и дать максимально близкую к реальности оценку игры команды. xG (Expected Goals или ожидаемые голы) — модель расчета ожидаемых голов в футболе, в основе которой лежит анализ опасности ударов по воротам (в большинстве случаев) каждой из команд.
По xG-модели каждому удару по воротам присваивается коэффициент, сумма этих коэффициентов отражает опасность, которую команда создала у чужих ворот. Сравнение xG игравших команд формирует альтернативный счет матча.
Футбол — игра низкой результативности, где результат конкретного матча может зависеть от банального рикошета. К тому же в игре нет статичных положений, как в бейсболе, что осложняет статистический обсчет и выделение ключевых параметров для объяснения итогового результата. Победа по xG не всегда равна победе по счету, но всегда показывает, какая команда сделала для победы больше.
xG-модели — это не игрушка тактических гиков. Систему используют многие клубы из топ-чемпионатов. Главный тренер «Арсенала» Арсен Венгер обмолвился об использовании этого параметра на одной из пресс-конференции, экс-работник «Ливерпуля» Дамьен Комолли рассказывал об использовании схожей модели, на тренировочных полях «Байера» и дортмудской «Боруссии» отмечены зоны, из которых предпочтительно наносить удары. Продвинутые модели xG действительно эффективны и помогают оценить уровень игры команды, не основываясь на голом результате.
Две xG-модели есть в открытом доступе: Майкла Кэйли и 11tegen11. Оба оценивают каждый удар числом от 0 до 1. У них есть расхождения в вычислении коэффициента опасности удара, но количество используемых параметров впечатляет: тип удара, точка удара, тип и точка паса под удар, тип и точка начала атаки, скорость атаки, преодоленное игроком расстояние с мячом до удара, ситуация перед ударом (дриблинг, удар первым касанием), счет в матче. Все параметры обсчитывают по данным Opta. Результат вычислений xG-моделей представлен на картинках, которые авторы публикуют в твиттере.
xG-карта матча по модели Майкла Кэйли
xG-карта матча по модели 11tegen11
Обсчитывая все матчи лиги подобным образом, после каждого тура можно получать общую таблицу xG-достижений команд. При желании в нее можно добавить массу дополнительных параметров. Самые простые — xG (ожидаемые голы или суммарная созданная опасность у чужих ворот) и xGa (ожидаемые голы соперника или суммарная допущенная опасность у своих ворот). Их разница соответствует предполагаемой разнице забитых и пропущенных мячей.
Для высчитывания более сложных параметров нужны базовые знания теории вероятностей и математического анализа. Один из важнейших продвинутых параметров — xP или предполагаемые очки. Еще более сложный элемент, но применимый к ставкам — разница созданных и допущенных xG при равном счете. При попытке развернутого анализа с помощью xG рождаются вот такие таблицы, подробное описание каждого из параметров можно найти по ссылке (спасибо Никите Васюхину и паблику «Блокнот»).
Альтернативная таблица АПЛ по разнице xG
Альтернативная таблица АПЛ по xP
Чтобы эффективно использовать xG-модель в предматчевом анализе, придется разобраться и в методологии, и в тех параметрах, которые предлагаются в таблицах. Готового рецепта успеха в ставках xG-модель не предлагает, но является отличным подспорьем для поиска завышенных и заниженных коэффициентов в букмекерской линии. Модель постоянно развивается, убираются баги и добавляются новые значимые параметры. Это делает оценку игры команд все более и более точной.
xG-модель не может точно предсказать счет ближайшего матча, но может оценить, насколько команда будет выступать лучше/хуже на дистанции. Проблема в том, что даже целый сезон — недостаточная дистанция для полноценной регрессии к среднему, а наносимые командой в среднем за сезон 600 ударов — малая выборка. К тому же в клубе может поменяться игровая формация, игроки и тренер, что неизбежно окажет влияние на количество и качество ударов. Еще у команд есть свои особенности, например, игра на контратаках и повышенный процент владения мячом. Если данные анализа игры команды по xG-модели имеют сильное расхождение с реальными результатами команды, стоит поискать особенность игры, которая приводит к таким перегибам.
При использовании xG-моделей важно помнить о контексте и рассматривать предлагаемые данные не абстрактно, а в разрезе конкретной команды. xG может применяться как для оценки удачи/неудачи команды на короткой дистанции в пару матчей, так и служить основой для долгосрочных прогнозов. Рассмотрим два показательных примера.
Большинство букмекеров предлагает долгосрочные ставки, например, на попадание команд в первую четверку АПЛ по окончании сезона. Допустим, есть команда, которая после 20 туров идет на 7-8-м месте и отстает от четвертого места на 10 очков. Казалось бы, шансы добиться цели невелики, но таблица по xG показывает недобор порядка 15 очков, а значит, команде катастрофически не везет. Основными причинами расхождения реальных результатов и данных по xG обычно являются завышенная реализация оппонентов или заниженная собственная реализация. На дистанции эти параметры стремятся к средним значениям, и до конца сезона есть смысл ожидать всплеска по результатам при том же качестве игры.
Если до конца сезона команде вернется недобор в 15 очков, то весьма вероятно она окажется в желанной четверке. Фокус в том, что в рассматриваемый момент после 20-го тура коэффициент на попадание такой команды в первую четверку может достигать 10, а то и больше. Подобные ситуации не редкость, и это только грубый пример применения xG в долгосрочной перспективе.
Оценка вероятности вылета команд в Чемпионшип после 24-го тура АПЛ по xG-модели 11tegen11
1) Ставки на исходы по xP. Для каждой команды берем реальное количество набранных очков и отнимаем от него xP (ожидаемые голы). Если у одной команды недобор (xP больше реально набранного количества очков), а у другой перебор (xP меньше реально набранного количества очков), причем вторая по букмекерским коэффициентам является фаворитом, стоит задуматься о ставке на команду с недобором.
2) Ставки на тоталы по xG и xGa. Находим команды с солидными переборами или недоборами по xG и xGa (ожидаемые пропущенные голы), смотрим на те же параметры соперников, выделяем матчи с наибольшими расхождениями и рабочими коэффициентами. Например, команда, которая забивает значительно меньше, чем показывает xG, играет с командой, которая пропускает гораздо меньше, чем показывает xGa — есть смысл ставить на индивидуальный тотал больше первой команды.
3) Кто первый забьет по xG при равном счете. В развернутых таблицах есть параметр, показывающий xG команд при равном счете. Некоторые команды отлично играют при ничьей на табло, но начинают нервничать и допускать ошибки, как только соперник выходит вперед, или окапываются у своей штрафной, как только сами забивают. По этому параметру можно вычислять команды, которые с большей вероятностью откроют счет в матче.
20 сервисов, которые помогут стать успешным футбольным беттором
Важно понимать, что xG — не всеобъемлющий параметр, объясняющий все процессы, происходящие в командах. При предматчевом анализе нельзя забывать о кадровых потерях и текущей форме, которые в краткосрочной перспективе оказывают большее влияние на результат. xG — отличный инструмент для выявления трендов и поиска недооцененных/переоцененных команд, но он не может использоваться в отрыве от привычных способов оценки команд. Это просто дополнительный козырь в битве с огромным штатом аналитиков букмекерской конторы.
betonmobile.ru
А. Кузнецов, О. Железнов
Последнее время в комментариях просто в геометрической прогрессии множатся различные вариации вопроса «Что такое xG?». Постоянно ссылаться на авторов других ресурсов, рассматривавших эту тему, потихоньку становится стыдно, потому — держите разбор главного футбольного тренда 2016-го от Карриковедения.
Модель xG — метод оценки качества шансов, которые команда создаёт в атаке или позволяет создать сопернику у своих ворот. Сама аббревиатура xG (сокр. от expected goals) так и переводится — «ожидаемые голы». Позднее появилось ещё несколько показателей: xA — «ожидаемые голевые пасы», xW/xD/xL — «ожидаемые победы/ничьи/поражения», xPoints — «ожидаемые набранные очки» и xGa/xAa — «допущенные ожидаемые голы/ассисты» — то есть голы и голевые пасы, которые анализируемая команда позволила создать сопернику.
Освежим знания из теории вероятностей, чтобы понять, как считаются все эти показатели: допустим, у нас есть случайный эксперимент A — «игрок бьёт по воротам». Какой игрок, как бьёт — пока неважно. У этого эксперимента есть множество исходов Ω = {«игрок пробил мимо», «удар заблокирован одним из полевых игроков», «вратарь парировал удар», «игрок попал в каркас ворот», «игрок забил гол»}. Есть ещё некоторое количество возможных исходов, вроде «игрок промазал мимо мяча» или «прилетели инопланетяне и испепелили мяч на лету», но мы опустим их для простоты понимания. Каждый из этих исходов имеет определенную вероятность наступления, сумма которых даёт нам единицу, то есть 100%-ю вероятность того, что игрок ударил по мячу. И, собственно, вероятность наступления исхода «игрок забил гол» — это и есть значение искомого параметра xG для данного конкретного удара. После матча xG всех ударов суммируется и мы получаем те самые цифры, графики и схемы, которые вы в последнее время так часто встречаете. Тем не менее нужно помнить, что xG — не совсем классическая вероятность. Её можно интерпретировать как вероятность, но считается xG не как вероятность, а как значение функции, сглаженное логистической регрессией (чтобы попадать в диапазон от 0 до 1). То есть, грубо говоря, xG — это в первую очередь индекс качества момента, который можно интерпретировать как вероятность забить гол этим ударом. Это очень важный нюанс.
xG map for Manchester United - Burnley. This seems fine, right?
Also, people overrate Zlatan as a finisher. His greatness lies elsewhere. pic.twitter.com/OwUf5us0EE
— Caley Graphics (@Caley_graphics) October 29, 2016
Не будем подробно останавливаться на истории появления xG, потому что она всё ещё пишется, но отдельного упоминания заслуживают норвежский тренер Эгил Ольсен, ещё 20 лет назад заложивший основы этой модели во время своей работы с национальной сборной, и английский журналист Майкл Кэйли, год назад опубликовавший статью Premier League Projections and New Expected Goals и ставший одним из главных популяризаторов модели. Впрочем, употреблять слово «модель» в единственном числе здесь не совсем верно, на данный момент существует несколько методов подсчёта xG, которые отличаются подходом к расчету (некоторые модели используют лишь положение на поле, некоторые вообще основаны на количестве действий в штрафной соперника и так далее).
В данной статье мы остановимся на модели Майкла Кэйли. В попытке создать как можно меньше формул, но при этом сохранить нюансы различных видов шансов, Майкл остановился на 6 типах ударов по воротам:
Да, пенальти и автоголы в модели Кэйли не учитываются и просто записываются в карточку результата матча как дополнительный статистический параметр. Исключение пенальти можно понять, потому как от пробивающего игрока ждут 100% гола, приравнивая удар с точки к 1,0 xG, что не совсем верно — на самом деле такой удар весит 0,8±0,05 в зависимости от лиги и сезона. Автоголы же абсолютно случайны, оценить вероятность автогола в матче просто невозможно.
Удары были дифференцированы именно так, потому что множества ударов каждого типа имеют различные (но схожие для ударов одного типа) кривые зависимости вероятности забить гол от угла и расстояния до ворот. Кроме этих факторов, учитываются позиция пасующего и тип атаки (заслуживающая упоминания статья о качестве дальних ударов). Вопреки расхожему мнению, мастерство вратаря и так называемое «умение завершать атаки» (англ. «finishing») бьющего игрока влияют на вероятность гола гораздо меньше, чем перечисленные выше факторы. Это легко можно доказать с помощью коэффициента корреляции — статистической зависимости двух величин друг от друга (изменение одной величины влечёт за собой изменение другой): лишь для игроков, наносящих за сезон более 250 ударов, коэффициент корреляции «финишинга» принимает сколько-нибудь значимое значение. Чтобы это проверить, нужно взять игроков, разбить все их удары на две выборки одинакового размера и проверить, существует ли какая-то корреляция. Для убедительности стоит повторить это действие несколько раз. Коэффициент корреляции считается сильным, если принимает значение от 0,7 (или −0,7 если корреляция отрицательная) и больше.
Premier League Projections and New Expected Goals
То есть, как мы видим из графика выше, существует лишь некая очень слабая связь между качеством шансов и их конвертацией для игроков, нанесших более 250 ударов за последние 5 лет. Исходя из этого, можно сказать, что мастерство нападающего выражается в другом — в более качественных шансах. Умение открыться и найти мяч в штрафной соперника — тот самый пресловутый инстинкт хищника, который делает игрока нападающим топ-уровня. У вратарей же вообще нет никакой сколько-нибудь значимой корреляции, потому что если игрок наносит удар весом 0,6–0,8 xG — с одинаковой вероятностью его пропустят как Де Хеа с Акинфеевым, так и Гатальский. Но ведь мастерство топ-вратаря далеко не заканчивается на (не)умении отражать «мёртвые» удары.
В первую очередь, проблема отсутствия какой-либо зависимости кроется в объёме выборки — очень важном для статистического анализа понятии. Кэйли приводит отличный пример: в предпоследнем сезоне НХЛ Александр Овечкин совершил 795 бросков по воротам, Стефен Карри в том же сезоне 1341 раз бросил мяч в кольцо в НБА. В футболе же есть только два игрока, ударившие по воротам более 1000 раз за последние 6 лет (исключая пенальти). Догадываетесь, как их зовут?
Premier League Projections and New Expected Goals
«И, собственно, к чему всё это?» — можете спросить вы. «Всё это» — ещё одна попытка осознать и описать хотя бы часть игры в футбол с помощью статистического анализа, преследующая две цели: понять, насколько хорошо команда создаёт и реализует свои моменты и насколько реальные результаты команды (в которые частенько вмешивается его величество Случай) отличаются от «сферических в вакууме». С первым всё просто — в один гол конвертируется примерно 0,6–0,8 xG, значит если анализируемая команда наиграла хотя бы на это количество — забить минимум раз она точно заслужила. Со вторым всё гораздо интереснее: удача играет большую роль в футболе из-за пресловутого малого количества матчей и малой результативности, просто сравните его с баскетболом и бейсболом и поймёте, почему «просчитать» футбол гораздо сложнее.
Перейдём к xPoints. Допустим, играют команды А и B, и команда А создала 10 шансов по 0,2 xG каждый, а команда B — 10 шансов по 0,1 xG. Маловероятно, что матч завершится со счётом 10–10, так же маловероятно, что команда B выиграет 3–0... Хотя в таком фортунозависимом спорте, как футбол, всё возможно! В теории вероятностей есть формула полной вероятности, которая позволяет вычислить вероятность интересующего события через условные вероятности этого события. В случае матча, в котором было создано по 10 моментов с каждой стороны, нужно учесть вероятность наступления каждого потенциально возможного исхода: 0–0, 1–0, 0–1, 1–1, 2–1 и так далее до 10–10. Затем с помощью формулы полной вероятности необходимо вычислить вероятность победы команды А, вероятность ничьей и вероятность победы команды B. Эти величины нужны, чтобы получить математическое ожидание (или среднее значение случайной величины) набранных командой очков, которое считается по формуле «кол-во очков, получаемых за победу, умножить на вероятность победы + кол-во очков, получаемых за ничью, умножить на вероятность ничьей». Готово — мы получили примерное количество очков, которое команда должна была набрать за матч.
«Что за бред, как количество очков может быть дробным? Как команда может набрать 1,7 или 0,3 очка?» — спросите вы. Тут необходимо понять, что xPoints — это не реальное количество очков, на которое наиграла команда, а некий показатель качества игры. Да, обычные очки, присуждаемые за победу/ничью — это тоже показатель качества, но значение этого показателя распределяется дискретно, то есть принадлежит множеству [0, 1, 3]. Дискретное значение подразумевает собой конечное число вероятностей, тем не менее довольно часто случаются матчи, после которых сложно сказать однозначно, что одна команда была явно сильнее другой. Именно поэтому для моделей, оценивающих качество игры команды, необходимо брать математическое ожидание величины, а не конкретное значение из множества выше. Оценив разницу реальных очков и xPoints, можно сделать выводы об удаче, сопутствующей команде, и понять, какие команды явно прыгают выше головы, а какие, наоборот, не реализуют свои шансы должным образом.
Составив таблицы xPoints для нескольких предыдущих сезонов, можно сказать, что в целом они служат хорошим ориентиром. В сезоне 2013/14 много команд действительно показали хорошую результативность, особенно «Ливерпуль», «Арсенал», «Тоттенхэм» и «Эвертон».
Из прошлогодней таблицы очевидно, что «Лестер» и «Вест Хэм» прыгнули намного выше головы. Не менее очевидно, почему Луи Ван Гал был уволен, несмотря на победу в Кубке Англии — ситуация в чемпионате была просто ужасающей. «Юнайтед» не только мало создавал, но и допускал у своих ворот слишком много опасных моментов — это признак верного середняка и отсутствия прогресса как такового. При этом утверждение, что многие команды выступили ниже своих возможностей, более чем справедливо — только 5 команд вышли в плюс по разнице xPoints и очков по итогам сезона, из них лишь 3 — сколько-нибудь значимо.
Сезон 2016-2017 «Юнайтед», несмотря на мнимую «полосу неудач» в матчах с андердогами, завершил с практически нулевой разницей P-xP.
Конечно же, xG не может претендовать, да и не претендует, на звание «универсальной теории всего» в футболе. Но если не возводить модель в культ и не пытаться судить об игре команды, руководствуясь только xG и xPoints, она может стать интересным инструментом для оценки качества игры команды, подхода главного тренера к стратегии создания голевых моментов и конверсии шансов — или реализации бьющих игроков.
xG-карта матча «Ньюкасл» – «Юнайтед» и таблицы xPoints предоставлены xMetrics.
carrick.ru
Для сегодняшней темы нужно некоторое предисловие и достаточно подробное объяснение.
С каждым годом наш мир (в том числе и спортивный) всё более "оцифровывается". И с каждым годом появляется всё больше параметров, которыми можно описать происходящее на футбольном поле, помимо голов, ударов в створ и т.д. Один из таких параметров - это xG(сокращение от expected goals).
За последнее пару лет я прочитал достаточно статей на спортивных сайтах, а также пару на тематических ставочных сайтах. И я заметил, что на ставочных сайтах относятся с некоторым не пониманием, что такое xG-карта матча и как её использовать при анализе. С другой стороны есть пласт людей, который ну очень сильно погружаются во всю эту продвинутую статистику и начинают использовать её как основной инструмент. Хотя нюансов там предостаточно, но них поговорим ближе к концу статьи.
Сначала минимум терминологии на понятном языке. Разберёмся на одной картинки.
Что за циферки вверху?- счёт.- количество ударов.- xG.
С первыми двумя понятно, а что такое xG?
xG («expected goals») – это модель ожидаемых голов.
Как это считается?
Каждому удару присваивается коэффициент, который отражает его опасность.
Например, если удар произведён с близкого расстояния, то у него будет высокий коэффициент и будем считать этот удар опасным. Если же удар был произведён с дальней дистанции, то коэффициент будет низким.
Само значение коэффициента лежит в диапазоне от 0 до 1.
Кто решает какой удар считать опасным, а какой нет?
Создатель модели.
Как правило, это футбольный статист, который глубоко погружён в мир цифр. И, как правило, все свои заключения они делают на основании того, при каких обстоятельствах был нанесён удар. То есть, люди имеют статистику в каких случаях футболист чаще забивает гол, а в каких - реже. Грубо говоря, если футболист бьет из района 11 метров, то у него хорошие шансы забить гол. Если же футболист решил ударить с центра поля, то таких шанцев у него гораздо меньше (хотя такие голы в последнее время не редкость).
Короче говоря, за коэффициенты отвечают компетентные люди и им можно доверять.
Что мы получаем в итоге?
В итоге мы получаем параметр, который позволяет заглянуть за счёт и другую статистику матча. И по которому мы может понять, насколько та или иная команда была опасна, сколько моментов создала и какие из них были действительно хорошими, а какие - так себе.
То есть. этот показатель может многое рассказать о матче и о текущей форме команды.
Откуда у аналитиков нужная информация?
Вообще, есть такая компания, которая называется Opta. И она занимается максимально возможной "оцифровкой" футбольных матчей. Работать с ней напрямую - это дорогое удовольствие. Однако, есть популярные сайты, которые дают некоторую информацию в общий доступ. Например, сайт whoscored.
Эта картинка очень похожа на ту, что я кидал сверху. Это карта ударов по воротам. Посмотреть её можно щёлкнув на "Match center", а там выбрать "Chalkboard". По сути, эта та же карта, только без коэффициентов опасности удара.В реальности, я уверен, что большинство матчей смотрятся между делом в "лайф-скорах". Либо живую картинку, но здесь большинство увлечены самим матчем(или заходом ставки на матч), нежели анализом.
Короче говоря, проводить самостоятельный и глубокий анализ - это дорогое удовольствие в плане времени. Которое совсем не факт, что оно отобьётся на дистанции.
И здесь на помощь приходит xG-карта. Посмотреть картинку - это минутное дело. Вдумчиво посмотреть - это дело 3-4 минут. Зато вы круто экономите своё время и получаете достаточно полную информацию.
Предлагаю привести эксперимент. Возьмите любой понравившейся матч, посмотрите выдержку опасных моментов и оцените их по удобной для вас шкале. Дальше найдите для него xG-карту и сравните впечатления. Если матч был интересными, команды создавали много моментов, то и xG показатели у команд будут достаточно высокими. Если же матч был скучным, то и xG показатели будут низкими.
"Окей, если в матче было забито много голов, то и моментов было много...".
Не всегда. Именно для таких случаев и нужно "смотреть за статистику". Приведу пример с Лионом в этом году. Команда, несмотря на потерю многих игроков, продолжала забивать много голов. Было немного удивительно. Однако, после просмотра хайлайтов и просмотра xG-карт всё встало на свои места - команда реализует всё, что создаёт.
Вот, например, XG-карта матча Лион - Бордо.
Не поленитесь, посмотри обзор матча. Думаю, что вам станет понятно, что 3 - 3 был очень завышенным результатом.Во многих случаях xG-показатели команд и количество забитых голов совпадают. Но не всегда, и именно из-за таких моментов стоит анализировать показали xG.
xG-карта помогает определить насколько результат был заслуженным.
В футболе не так редко бывает, что одна из команд, что называется, "отскакивает". То есть, команда добивается победы или ничьи, но этот результат был достигнут за счёт везения.
Думаю, что долго объяснять, почему стоит отделять "чистые" результаты (которые исходили из логики игры), от "грязных" (которые были достигнуты за счёт стечения обстоятельств). И потом использовать данные знания.
xG-карта помогает при анализе своих ставок после матчей.
Вещь, которой игроки не уделяют должного внимания - это холодный анализ своих ставок. Никто не застрахован от ошибки. Однако, для правильно выстроенной дистанции необходимо не повторять плохие ставки и "гнуть свою линию" для других выборов, пусть они были "минусовыми" в этот день.
Если ваша ставка не зашла - проанализируй её. Возможно, ваш выбор был хорошим, просто "не докрутилось", команда не смогла реализовать свои моменты. Посмотреть xG-карту матча - это самый быстрый способ получить некоторую пищу для анализа.
Количество моментов может быть больше, чем количества ударов.
Считается, что, если игрок в удобной позиции, то он пробьёт. Однако, не всегда так происходит. Например, не такая редкость, когда игрок промахивается по мячу, либо игрока прерывают фолом. Такие моменты не обсчитывает xG. Некоторые модели также не считают автоголы, что не совсем корректно.
Модели не всегда могут точно рассчитать опасность момента.
Вообще, многие модели стараются учитывать и другие факторы, помимо позиции для удара. Также на whoscored, есть такой параметр, который называется "Big chance". Это усиливает оценку, но всё равно позиция для удара влияет на коэффициент.
Недавно смотрел карту матча Ливерпуль - Арсенал. Ливерпуль создал много моментов и победил. Я бы заострил внимание на 3-тьем голе, который забил Салах. Там был выход 1 на 1, при этом Салах мог отдать пас соседнему игроку. По мне - это практически 100 момент. tegen11 оценил его достаточно высоко, однако не максимальной оценкой.
Качество реализованных моментов зависит от чемпионата и скилла игроков.Всё просто. Нельзя одинаково оценивать xG Барселоны и xG Леванте. Скилл игроков Барселоны гораздо больше, чем у игроков Леванте. Тому же Месси не нужны однозначно хорошие моменты, чтобы забивать голы. Сильные игроки могут реализовывать не явные моменты, а также топовые игроки обладают хорошей реализацией моментов - им не нужно их много.
Поэтому, меня очень забавляет, когда в одном чемпионате сравнивают все команды одинаково. И, например, могут говорить о том про везение одних и не везение других.
Создавать хорошие момент не достаточно, нужно иметь игроков, которые могут и реализовывать, а также игроков, которые могут забивать не явные момент. Также, сильно влияет вратарский "скилл". Уверен, что сравнивать Де Хеа, который может много тащить, с, допустим, вратарём Борнмута бессмыслено.
Количество моментов не даёт полной картины матча.
Если более слабая команда приезжает к более сильной и, если слабой команде повезёт забить мяч, то ожидать от "андердога" продолжения банкет будет очень сложно. Большинство команд сядут в оборону и будут защищаться. Естественно, количество созданных моментов может сильно отличаться, хотя это будет вытекать из логики игры.
Ну и узнать, насколько команда хороша в командной игре, насколько она смотрится хорошо в целом, посмотреть как "ходит мяч" не получится.
Также xG-карты помогают "материализовать" такие понятия, как "повезло/не повезло", "хорошая/плохая форма". Впечатления могут быть обманчивыми, а цифры не обманешь.
Однако, использовать только xG-карты для прогнозов я бы не стал. Есть куча нюансов, нужно знать "матчасть", смотреть насколько логичные результаты в том или ином чемпионате. Если во всём этот разобраться, тогда все дополнительные средства анализа вам будут только в помощь.
Я использую активно xG-карты для анализа где-то с начала года, сначала пришлось немного по разбираться, а также последить насколько хорошо они дополняют анализ. И мой опыт говорит мне, что они помогают. Однако, стоит их использовать как дополнительное средство анализа, не более того.
tegen11 - у данного аналитика своя модель. По моим наблюдениям она достаточно неплохая. Матчей разбирается гораздо больше, однако, сам автор использует ручной способ создания картинок из-за этого поступление информации не регулярное, по мере занятости аналитика.
Блокнот - достаточно интересное сообщество, эдакое "лукошко российской спортивной аналитики". Здесь автор выкладывает xG-карты по всем популярным и не очень чемпионатам(в новом сезоне, есть, например, Бундеслига 2 или чемпионат Турции). Также бывают разборы некоторых интересных матчей.
Спасибо за внимание! Ставьте лайк, если вам понравилась статья. Подписывайтесь, чтобы следить за обновлениями.
legalbet.kz
Стремление человечества взять все, до чего оно может дотянуться, засунуть в компьютер и получить столбики цифр, которые все объясняют, добралось до футбола. В футбольной статистике появились новые термины: xG, xPoints, xG—Plot… Еженедельник «Футбол» рассказывает, как и где вычислить все эти иксы.
Где справедливость?
Представьте на минуту, что вы опаздываете на матч любимой команды. Например, застряли в пробке далеко и надолго. Если вы живете в Москве или Краснодаре, то, скорее всего, с такой проблемой сталкивались уже не раз. И вот наконец вы вырываетесь из этой «черной дыры», летите сломя голову домой, поднимаетесь на свой этаж, открываете дверь квартиры и… застаете финальный свисток. Игроки и тренеры в телевизоре уже обмениваются рукопожатиями, а вы не можете поверить в случившееся: ваша команда проиграла аутсайдеру турнира. Переиграв его при этом по всем статистическим параметрам, приведенным в трансляции. «Их вратарь – гений, а наши кривоногие раздолбаи не могут в пустые ворота закатить. Все как всегда», — думаете вы.
Така-тика. Во что играл «Ростов» в прошлом сезоне
Но можно ли полагаться на эту статистику? Вы же не смотрели матч, а значит, и утверждать что-то пока преждевременно. Количество ударов и угловых – дело, конечно, хорошее. Но одновременно и какое-то упрощенное, не всегда отражающее реальное положение дел на поле. Взгляните, например, на Курбана Бердыева. Его «Ростов» в «серебряном» для себя сезоне-2015/16 был лучше соперника по сумме этих показателей лишь в 11 матчах из 30. Тем не менее это не помешало ростовчанам стать одной из самых интересных команд РФПЛ, а уже в следующем сезоне на равных бодаться с «МЮ», «Баварией» и «Атлетико».
xG – что это?
Найти и выразить в цифрах что-то, что сможет объяснить причины победы нашего аутсайдера, — одна из главных целей аналитики в футболе. Решение этой проблемы привело к появлению метода expected goals (xG – ожидаемые голы). Давайте попытаемся понять, что это такое. Основная идея xG-моделей заключается в придании каждому удару своего коэффициента опасности. Этот коэффициент выводится при помощи формул, содержащих в себе объективные футбольные факторы. Простыми словами, xG определяет колеблющуюся от 0 до 1 вероятность забить гол после какого-либо удара.
Одна из первых продвинутых xG-моделей была разработана аналитиком Opta Майклом Кейли чуть меньше пяти лет назад. Однако Кейли далеко не пионер. Подобными исследованиями занимались уже достаточно давно. Так, например, Эгил Ольсен – тренер, поднявший сборную Норвегии на второе место в рейтинге FIFA, – еще в 90-х задавался вопросом о неравнозначности ударов. Ольсен делил все удары по воротам на три категории: особо опасные, средней опасности и неопасные. Но в какую-то четкую модель у норвежского Сверла (такое прозвище ему дали еще в бытность игроком за стиль ведения мяча) это так и не вылилось: данных было маловато.
Зачем это нужно?
С понятием xG мы немного разобрались. Но откуда берутся эти цифры? На самом деле все не так уж и сложно. Конечно, у большинства моделей свои собственные формулы. Но все они одновременно схожи, потому что учитывают одни и те же ключевые факторы: часть тела, которой был нанесен удар, точку, откуда был нанесен удар, тип предшествующего паса и тип атаки. Майкл Кейли, например, в своей модели разделяет все удары на шесть основных групп, различающихся по типу подачи (после навеса/не после навеса) и типу удара (головой или не головой). Сюда еще входят штрафные удары и удары после обыгрыша вратаря. Для каждой из групп существует своя формула подсчета вероятности.
Моторный отсек. На кого из центральных полузащитников может рассчитывать сборная России в 2018 году
Определив вероятность гола после каждого удара, мы можем сложить эти показатели. Полученная цифра – это сумма остроты всех созданных моментов в матче. Проделав такой трюк и для второй команды, мы можем определить ожидаемый результат матча. И именно этот показатель сможет дать нам ответ на вопрос, заслуженно ли проиграл ваш любимый клуб, ради которого вы так старались успеть домой. А если подсчитать таким образом не только один матч, а весь чемпионат, то мы получим таблицу, основанную не на реальных очках, а на ожидаемых (xPoints). То есть на очках, которые команда заслуживала получить исходя из остроты моментов, созданных в каждом матче.
Формула подсчета xPoints еще проще, чем в случае с xG. Имея xG-данные по всем моментам, нам будет уже нетрудно подсчитать вероятность каждого возможного исхода матча (0:0, 1:0, 1:1 и т.д.) и разделить их на три категории: победные, ничейные и проигрышные. После этого мы складываем вероятности исходов в каждой категории и умножаем результаты на 3, 1 и 0, соответственно (как настоящие очки). Так мы с вами получаем вероятности ожидаемых побед, ничьих и поражений. Остается лишь сложить эти результаты, и – вуаля – ожидаемое количество очков для нашего матча определено. Не стоит пугаться, что число получилось нецелым. Так и должно быть, ведь мы имеем дело с вероятностями, а не с реальными результатами.
Почему этому нельзя доверять до конца?
Давайте подытожим. Что дает нам xG? Во-первых, мы можем узнать, насколько реальный счет матча отличается от альтернативного, основанного на качестве моментов. Разумеется, разговоры о везении будут справедливы только при больших расхождениях. Во-вторых, в рамках целого сезона мы увидим, какие команды недобирают очков, а каким сопутствует удача. Помимо этого, можно сделать вывод о качестве нападающих, регулярно реализующих, например, моменты с низким показателем xG.
Конечно, у xG-моделей есть и недостатки. Вы, наверное, уже успели заметить, что описанная выше система не в состоянии учитывать мастерство бьющего игрока. Так же, как и определять, насколько сильное давление испытывает футболист со стороны игроков обороны. Различные модели пытаются обойти эти проблемы, вставляя в формулы переменные, описывающие эти ситуации. Но в xG-моделях человеческий фактор все равно имеет громадное значение. Еще один существенный недостаток заключается в том, что при подсчете альтернативного счета матча не учитываются моменты, не завершившиеся ударом.
И напоследок. До сих пор нет единого мнения, как считать автоголы и пенальти. Каждый решает эту проблему по-своему: кто-то присваивает автоголам и пенальти значения 0.3 и 0.7, соответственно, а кто-то, как Майкл Кейли, не считает их вообще.
Угловой кодекс. Что надо знать, когда ваша команда идет подавать корнер
***
Все знают, что Арсен Венгер с его экономическим образованием обожает играть с цифрами. Но даже он, бессменный генерал лондонских «пушкарей», предупреждает: «Вы должны быть очень осторожны, работая со статистикой. Она может повести вас по неправильному пути». Так и есть. На данном этапе своего развития xG-модели еще слишком неустойчивы, чтобы завоевать полное доверие у профессионалов. Но потенциал огромный. Конечно, сложно представить, что даже при идеальных xG-моделях тренеры будут выстраивать план на игру исходя из xG-данных. Но то, что они помогут выявлять определенные игровые проблемы, – несомненно. Тем не менее у футбольных любителей (читай – у нас) уже и сейчас есть возможность побаловать себя продвинутой статистикой такого рода. И почувствовать себя профессионалами.
Что еще можно подсчитать
Кратко о других нововведениях в мире статистики
xG—Plot
Графики xG-Plot показывают динамику изменения xG на протяжении матча. Если вам кажется, что ваша команда отыграла вторую половину значительно лучше соперника, просто взгляните на xG-Plot. Вполне возможно, что вы обманываетесь. Или же футболисты просто не смогли конвертировать свое преимущество в опасные моменты. xG-Plot поможет разобраться в этом вопросе.
xA
xA (expected assists) – ожидаемые голевые пасы. По сути, xA ничем не отличаются от xG. Только подсчитываются здесь не удары, а пасы, которые приводят к этим ударам. Это помогает определить, насколько игрок действительно эффективен при выводе партнеров на ударную позицию. Важное замечание: xA являются более надежным показателем, чем xG. Отличный пас им и останется, даже если самим ударом собьют пару голубей.
Packing
Packing отражает сумму соперников, оказавшихся за линией мяча в результате игрового действия. Таким действием может быть или передача вперед, или дриблинг. В первую очередь этот показатель помогает оценить эффективность пасующего игрока. Как определить влияние футболиста на переход команды из обороны в атаку? Packing вам в помощь. Он выделяет тех игроков, чей вклад в игру остается незаметным. Как правило, самые высокие показатели по packing набирают опорные полузащитники, крайние и центральные защитники.
Текст: Никита ПоляковФото: Еженедельник «Футбол», Global Look Press
www.ftbl.ru