• Россиянин будет работать с клубами немецкой бундеслиги. Кирилл Серых рассказал, как стать аналитиком в футболе

    ...и зачем аналитика нужна футболу

    29.12.20 10:00

    Россиянин будет работать с клубами немецкой бундеслиги. Кирилл Серых рассказал, как стать аналитиком в футболе - фото

    Фото: личный архив Кирилла Серых

    Источник:Спорт день за днём

    Автор:

    Российский аналитик привлек к себе внимание выигранным хакатоном в Германии. Кирилл Серых уехал из России в 2013 году. В 15 лет он закончил школу, в 19 лет – университет. Хотя и не сразу, но со временем Кирилл стал пробиваться в футбол. И теперь он будет работать непосредственно с клубами первой и второй бундеслиги.

    Подробнее о хакатоне можно прочитать у него в блоге на Sports.ru. Но если коротко, то вместе с коллегой он придумал новую метрику, как xG, только для вратарей – xS. Она помогает определять, насколько правильно действовал голкипер в той или иной ситуации – в теории это может превратиться в шикарную инфографику для телезрителей.

    Не каждый год мы узнаем о достижениях российских представителей на мировой арене, так что мы были рады узнать о победе Кирилла Серых. Специально для «Спорта День за Днем» он рассказал о своем становлении в Германии, европейском уровне аналитики, современных тенденциях и развитии направления в России.

    Где узнать самые актуальные вещи

    -  Идея что-то делать в футболе у меня возникла еще когда я заканчивал университет в Новосибирске. Но так как футбол все же закрытая среда, да и вдобавок я находился в Академгородке – на тот момент достаточно изолированном от информации месте, то банально не знал, откуда можно было бы брать какую-либо информацию. Поэтому футбол для меня оставался закрытым до 2017 года.

    В 2017-м я окончил вторую магистратуру, и приехав летом в Москву, встретился с бывшим одноклассником, только что прошедшим отбор в школу журналистики «Матч ТВ». Это дало толчок и осознание того, что можно и нужно любым способом пытаться хоть как-то заходить в эту индустрию, потому что футбол намного интереснее, чем финансы. 

    Начал читать все подряд. Первое, что находят в русскоязычном сегменте – это, конечно, канал Никиты Васюхина (блог о футболе «Блокнот», сейчас он аналитик «Зенита». – «Спорт День за Днем»). Затем погружался глубже – стал читать многие англоязычные сайты, подписывался в твиттере на различных аналитиков и просто энтузиастов. Но полтора года просто читал, был молчаливым наблюдателем.

    В этот момент по своей основной работе я переходил из финансов в Data Science. У меня была такая цель – сделаю себе безопасную работу, закрою одну сертификацию, чтобы если вдруг моя жизнь пойдет куда-то не туда, то всегда можно было бы вернуться в тот же банк на достаточно высокую позицию. До конца 2018-го у меня уходило почти все время на это, но зато я закрыл все дела, которые меня обезопасили. Это, кстати, сильно помогло, когда в 2020-м переехал в Берлин и остался без работы – прошлый опыт помог устроиться в финтех-стартап, где сейчас дорабатываю перед уходом в футбол. 

     

    В 2019-м я полностью перешел на удаленку. График работы стал гибким. Я работал в KPMG, голландский филиал которого как раз и проводил конференцию в Амстердаме о технологиях в футболе. Я туда поехал, увидел, что ничего очень сложного технически там не показывают. Сейчас уже понимаю, что это все-таки была не самая топовая конференция, ведь тогда еще не знал, что делает Barca Innovation Hub или те же аналитики «Ливерпуля». Чтобы из первых рук узнавать про самые актуальные вещи, нужно ездить на конференции уровня MIT SLOAN или Opta Pro Analytics Forum.

    Без аналитики скоро нельзя будет двигаться вперед

    Но на той конференции я поговорил с разными людьми, и даже выиграл небольшой скаутинговый челлендж, используя event-данные Wyscout’a. Немногим ранее мы с другом на пару съездили на игру Витесса в Арнем, и увидели, что после игры можно спокойно дождаться Леонида Викторовича, как минимум, чтобы сфотографироваться. После конференции я решил поехать еще на один матч Витесса с «де Граафсхапом», так же немного подождал после игры и стал уговаривать его на встречу со мной хотя бы на кофе, чтобы можно было поговорить и узнать из первых рук, как он использует данные в своей работе. Слуцкий же позвал меня на предсезонку. Мы с ним не очень много общались, но это для меня это было очень продуктивным и чем-то невообразимым.


    Он рассказал, что много работает с Инстатом. В «Витессе» у них был видеоаналитик, который все снимал, плюс клуб использовал GPS-систему, отслеживающую данные футболистов во время тренировок. В «Халле» у него тоже был большой штат аналитиков, правда, находившихся не в Халле, а работавших по удаленке. 

    Слуцкий приводил пример, что в ЦСКА статистику с тренировок считал отдельный человек. Эти отчеты прилетали ему вечером. В «Витессе» эти данные тренер получает через несколько минут после тренировки прямо на IPad в приложение GPS-системы. Каждая из метрик в отчете окрашивается в зеленое, желтое и красное, в зависимости от нагрузки и показателей футболиста. Конечно, для любого тренера это намного удобнее.

    Несмотря на то, что в России многие клубы используют GPS-датчики для подсчета физической статистики, мне сложно сказать, почему в России медленно приходят к анализу игровых данных в сравнении с той же Англией или США. Возможно, это отсутствие открытости к чему-то новому. Но такое не только в России происходит. У меня сложилось впечатление, что даже в Берлине, когда я мониторил LinkedIn, в том же «Унионе» не нашел прямо-таки аналитиков данных, не то, что аналитических отделов. Может, конечно, плохо искал: про ту же «Герту» знаю, что они в начале года заключили соглашение со Statsbomb, и там есть минимум два аналитика моего возраста. Но в клубах побольше –  «Штутгарте», «Хоффенхайме», «Дортмунде», «Баварии» и «Лейпциге» это развито шире. Мне лично очень нравится то, как это устроено в «Барселоне» – там в Barca Innovation Hub, под руководством Хавьера Фернандеса (один из самых известных профессионалов индустрии), анализом данных занимается отдел из 17 человек: 6 Data Scientist’ов – технарей и квантов, занимающихся именно математическим моделированием, 9 Game Analyst’ов – люди, понимающие как и в математике, так и с футбольным бэкграундом, являющихся своего рода мостом между математиками и людьми футбола и 1 IT-специалист, ответственный за техническую инфраструктуру. Такая структура напоминает то, как устроены схожие отделы в большинстве нефутбольных компаний, и мне кажется, что именно так должно быть и в футболе.

    Но я вижу, что все это все равно постепенно появляется. Последний яркий пример – это переход Евгения Шевелева из «Сочи» в ЦСКА. Казалось бы, это большой клуб, который давно может иметь полноценный аналитический департамент, но, судя по всему, там это все только-только зарождается. Я не знаком с Евгением лично (слежу только за его твиттером и телеграм-каналом), но мне кажется, что именно с человека с таким профилем (и конечно же, опытом) – аналитик данных / игровой / видеоаналитик и нужно начинать строить аналитический отдел, потому что именно он будет связующим звеном между миром данных и людьми из футбола как минимум в начале пути. И только затем стоит наращивать мясо – добавлять еще аналитиков и data scientist’ов, формировать техническую инфраструктуру и так далее. 

    В будущем это придет ко всем. Уже сейчас стоимость всех данных постепенно уменьшается, а предложений на рынке становится все больше и больше. Глупо игнорировать то, что может быть полезным, потому что это дает тебе competitive advantage (конкурентное преимущество). Если оно у тебя есть и ты можешь правильно его использовать, то рано или поздно ты получаешь профит от этого. Первый в этом направлении «Ливерпуль» – и это явно отражается на результатах. В клубе чуть ли не 10 лет назад сообразили, что это играет роль. Быстро удалось собрать подходящих людей с разным опытом. Вот эта комбинация в итоге с вовлеченностью главного тренера выстрелила. Без этого скоро вообще нельзя будет двигаться вперед.

    Понятно, что за аналитикой в российском футболе я слежу со стороны. Кого-то знаю лично, например, знаком со Стасом Гончаренко из «Ахмата». Летом он помог мне с монтажом видео, а я помогал ему и еще нескольким ребятам из Киева со стороны Data Science. К сожалению, из-за трех параллельных работ не удалось сделать чего-то большего, но даже такое небольшое знакомство показало, что русскоговорящее сообщество аналитиков очень открыто, и это круто. Конечно, знаю про Сергея Титова (сейчас аналитик «Динамо». – «Спорт День за Днем») и его известный портал Контрпресс, Шевелева и Васюхина уже упомянул. У Стаса есть блог «Тактический Борщ» на Sports.ru, знаю также про академию PASS, которую организует Глеб Платов в Киеве. В общем, стараюсь следить за людьми, которые так или иначе освещают свою активность в медиаполе. Но честно говоря, из-за того, что пока не перешел на фуллтайм в футбол, часто даже не успеваю следить за немецким футболом и его коммьюнити аналитиков, поэтому знания про российский футбол все-таки не такие глубокие.


    За рубежом я знаю только двух русскоговорящих людей, работающих в этой сфере – с Владом Андерсеном я знаком лично: мы познакомились на конференции Statsbomb Innovation in Football в прошлом году в Лондоне. Было достаточно забавно, потому что на той конференции выяснилось, что я покупаю у его отдела в Wyscout’e данные по Голландии, и он даже видел мое имя в каких-то внутренних отчетах – не так часто кто-либо с русским именем и фамилией не из клуба покупает event-данные для своих целей. Влад живет в Италии, работал в Инстате и WyScout.

    Второй человек – Михаил Жилкин, выпускник МФТИ, работающий в лондонском Арсенале с 2018 года. Лично с ним не знаком, но конечно, было бы интересно с ним познакомиться.

    Зайти в футбол со стороны данных и развиваться дальше

    Главное, что посоветовал Леонид Слуцкий – пойти на тренерские курсы, чтобы понимать игру не только со стороны чисел, но еще и разбираться в тактике и психологии. Теперь у меня самая первая лицензия – категория C.

    Конечно, это было очень полезно. Я ведь пришел вообще с нуля и мое знание футбола ограничивалось игрой во дворе и тремя месяцами секции в Бийске, пока ее не закрыли. Я проходил детско-юношеский курс, и это было здорово, потому что там давали именно азы. Это дало хорошее базовое понимание того, как происходит подготовка игроков. Сейчас думаю о том, как и где делать следующую лицензию, ведь, скорее всего, в Германии это не получится сделать из-за отсутствия игровых навыков – лицензия B требует прохождения игрового теста, который я, скорее всего, не сдам.


    Я зашел в футбол со стороны работы с данными и программирования, хотя по образованию я не программист – изучал экономику и финансы. Конечно же, мы работали с данными, но у меня нет классического образования в области Computer Science, всем навыкам программирования я обучался сам. В работе с данными использую достаточно простой функционал (Python, R, JS) который может изучить каждый. Сейчас много людей осваивают профессии Data Analyst и Data Scientist, потому что это действительно несложно.

    У меня была простая логика: я могу и умею работать с данными и люблю футбол, почему бы это не совместить? Потом стал смотреть, как зайти с этой стороны, и развивать другие свои стороны – начал тренировать, заниматься видеоаналитикой и читать про спортивную науку и медицину. С июня этого года я ассистент тренера в команде U17 в берлинской «Тасмании», хотя у нас нет четких ролей в команде.

    Клуб сейчас немного на слуху из-за «Шальке», который приближается к рекорду – самой длинной безвыигрышной серии. Сейчас у «Шальке» 29 матчей без побед, а у «Тасмании» было 31 в сезоне-1965/66 – первом и последнем сезоне команды в Бундеслиге. Сейчас это небольшой клуб в Берлине, играющий в Оберлиге (пятая в стране).

    Конечно же, для моей команды руководство ставит цели подняться наверх (сейчас мы играем в 4-ом из 7 дивизионов – Ландеслиге), но если при этом удастся подготовить хотя бы три футболиста в команду следующего возраста, то это однозначно перекроет эффект от повышения в классе. Понятно, что все хотят выиграть. Но в некоторых играх мы можем попробовать игрока на новой позиции, если видим на тренировках, что у него есть склонность к игре в этом амплуа. Где-то это идет в ущерб результату, но если мы видим, что на тренировках парень классно отыгрывает левого опорника, хотя до этого в играх мы ставили его на позицию левого защитника, то почему не попробовать его в другом амплуа? Наша главная задача – выцепить из ребят несколько игроков, которые пойдут выше, а результаты – это все же сопутствующая задача. Никто не ставит цель выигрывать любой ценой, как об этом говорят на детско-юношеском уровне в России.

    Данных у нас никаких нет. Но я снимаю на камеру игры. Есть такая камера Veo, которая выполняет функцию оператора и автоматически определяет положение мяча на поле. То есть мне надо всего лишь зафиксировать штатив в 5 метрах от лицевой и идти смотреть игру. Потом уже дома я могу нарезать и смонтировать видео, а потом показать ребятам перед тренировкой. В этот интерфейс можно добавлять и отмечать игроков, поэтому уже через день после игры ребята получают отдельные моменты с их участием и моим комментарием. 

    Кирилл – крайний слева

    Разумеется, тренировать – это абсолютно другой опыт. К тому же у меня не идеальный немецкий – лишь в этом году доучил его до C1, и только из-за футбола. В обычной жизни можно обойтись с уровнем ниже (до прошлого года у меня был B1), но в футболе он очень нужен. На первых порах у меня были проблемы с адаптацией, потому что команда не особо поняла, кто к ним пришел. Когда стало понятно, что я даю команде, и что это и есть то конкурентное преимущество, которого у других команд в лиге нет, то все стало проще. Все-таки на этом уровне только одна команда из нашей лиги (всего их 28), помимо нас, снимает видео, причем только на одну GoPro и только на домашних играх. 

    Сейчас работаю с ребятами 15-16 лет, которые уже думают, чем им заниматься дальше по жизни. Во многом наша задача как тренеров в этом возрасте – не только научить играть в футбол, но и заложить некую дисциплину, может, даже какие-то ценности. В этом плане у нас очень дополняющий тандем – мой коллега работает в Бундесвере, он более вспыльчивый и жесткий в некоторых моментах, а также более требующий, в том числе и лояльность. Я же более мягок и более охотно иду на компромисс, поэтому каждый из игроков может открываться тому тренеру, с кем ему комфортнее. В любом случае, важные решения мы всегда принимаем только вместе и до текущего момента у нас не было никаких проблем.  Еще один важный аспект – менторство. Ребята знают, что я работаю с данными и их это тоже интересует, с некоторыми из них я часто говорю в общих словах о том, что я делаю, чтобы показать, чем можно заниматься в будущем. В нашей команде есть два брата и оба хотели пойти в полицию после школы, но теперь один из них захотел подтянуть математику и пойти в университет. Это очень приятно, чувствуешь, что сделал что-то полезное, и добавляешь себе плюс к карме.

    Работа с клубами бундеслиги

    Как изменилась моя жизнь после выигранного хакатона? Да в общем-то, никак, я ничего особенного не сделал, только наконец-таки перешел в сферу, которая мне действительно интересна. Жду не дождусь, когда начну работать в Sportec Solutions, правда, сначала нужно доработать до конца февраля на прежней работе.

    Sportec Solutions – это компания, принадлежащая deltatre и DFL (немецкая футбольная лига), которая собирает данные. Грубо говоря, как Opta, только работает конкретно для первой и второй бундеслиги. Клубы обязуются поставить на свои стадионы надлежащее оборудование, чтобы мы могли собирать трекинговые данные с их матчей. Помимо этого, Sportec собирает event-данные – каждое событие, произошедшее в матче, правда делают это специально обученные люди и вручную. Это загружается в единую базу данных, с которыми работает моя команда.

    Мы будем заниматься двумя направлениями с этими данными. Одно из них подразумевает работу с аналитиками клубов, чтобы понимать, как улучшать данные, которые Sportec им предоставляет просто за то, что они играют в первой или второй бундеслиге. Какие-то свои внутренние вещи они могут считать сами, а мы даем им базовый пакет данных и метрики / статистику, рассчитанные на них – мы можем считать метрики, оценивающие как эффективно используется пространство и принимаются решения (Pitch Control или EPV), определять изменения в структуре игры команд и так далее.

    Второе направление ориентировано на зрителей. Вся инфографика со статистикой, которую видит зритель, строится на наших данных, получаемых и обрабатываемых в режиме реального времени. Статистика может быть как достаточно простой (количество ударов, фолов, карточек), так и более продвинутой (цифры по xG, средние позиции игроков на текущий момент матча, максимально развитая скорость). Тот же наш xS, который мы придумали для хакатона, тоже наверняка удастся внедрить для трансляций, чтобы показывать болельщикам, хорошо или плохо сыграл вратарь. На видео можно будет показать, какую позицию мог бы занять вратарь, чтобы лучше сыграть в моменте.

    Я буду седьмым человеком в команде, которая над этим работает.

    Рандом всегда останется, но нужно упрощать игру

    Вот сейчас активно обсуждают вопрос интенсивности в футболе. Я выкладывал у себя на канале пост о презентации французской компании SkillCorner на эту тему с конференции Training Ground Guru по Big Data: их вывод был в том, что интенсивность в России ниже, чем во многих европейских лигах. Часть той же презентации выкладывал и критиковал Никита Васюхин у себя на канале. Я понимаю и во многом соглашаюсь с его позицией. Но несмотря на неточности в данных все равно видно, что цифры в России ниже.

    У SkillCorner далеко не самая точная методика измерения: действительно сложно делать однозначные выводы только по ТВ-картинке, так как она не покрывает большую часть поля и игроков. К тому же, скорее всего, они собрали не такое большое количество данных, чтобы хорошо откалибровать свои модели экстраполяции данных (Никита отметил, что для защитников и нападающих такая экстраполяция вряд ли сработает, но я думаю, что при достаточно большом количестве валидационных данных можно собрать такую нейросеть, которая будет давать схожую точность), но даже имея такое измерение, можно увидеть некие тенденции. Разброс в интенсивности такой большой, что как минимум направление вывода у меня не вызывает сомнений.

    Тем не менее, чтобы быть уверенным в таких широких выводах, нужно уметь собирать качественные данные, и индустрия еще далека от оптимального решения. Сложностей несколько: во-первых, очень сложно собрать однообразные трекинговые данные по всем лигам в принципе, начиная от чисто юридических причин – в той же Германии только Sportec Solutions имеет право на установку своего оборудования, заканчивая разными методами сбора данных (GPS, алгоритмы распознавания изображений, микроволновые датчики). Потому и возникают некие «промежуточные» решения типа алгоритмов SkillCorner, основанные на общедоступных данных.  Во-вторых, еще сложнее быть уверенным в их качестве – все методы сбора данных часто дают шум, который приходится чистить руками.

    Сейчас мы только говорим про две координаты, но игрок все-таки не точка на плоскости, а объемный субъект, поэтому очень важна третья координата, задающая положение тела. Но честно говоря, сейчас даже качество первых двух координат сильно страдает, а там, где она доступна, третья координата страдает еще сильнее.

    Тогда возникает вопрос, а все ли можно подсчитать в футболе? Я думаю, на данный момент есть огромное поле для того, что можно было бы объяснить с помощью данных.

    Яркий пример, над чем бьются сейчас статистические компании: аналитику при подготовке команды нужно нарезать моменты соперника, и вот он отсматривает все матчи, чтобы найти похожие моменты. Лет 20 назад выходило интервью, где специалист рассказывал, что посмотрел 29 часов футбола, чтобы найти два похожих момента. Сейчас данные помогут сделать это за несколько секунд. Такое уже возможно. И аналитик сэкономит время, чтобы изучить что-то менее изученное. Таких плоскостей очень много.

    Конечно же, в скором времени не будет такого, что аналитики пересчитают вообще все и футбол превратится в автоматизированную игру,  где любые действия можно будет предсказать и просчитать. Можно привести очень грубый и преувеличенный пример – мы не можем пока что объяснить, что именно послужило причиной принятия игроком того или иного решения, потому что мы не можем полностью понять, как сработал в этот момент его мозг. Конечно, можно проводить эксперименты, исследовать реакции на разные раздражители, моделировать ситуации, но нужно огромное количество времени, чтобы получить нужные данные и сделать выводы. А над этим вопросом люди бьются годами. И все же футбол очень стохастическая игра с низкой результативностью, поэтому еще очень долго будет оставаться элемент какого-то рандома. Но использовать данные, чтобы многие вещи более детально понимать, упростить или улучшить – необходимо.

    Фото: личный архив Кирилла Серых, Sports.ru

    Читайте также

    Большое интервью аналитика Дмитрия Столбикова


    Читайте «Спорт день за днём» в
    Подпишитесь на рассылку лучших материалов «Спорт день за днём»