Yandex for Analytics




Yandex for Analytics

🧑‍💻 Data Driven в Яндексе: приходите и посмотрите сами, как у нас всё устроено

Привет! Это важный пост для аналитиков: мы зафиналили список выступлений и спикеров на Data Driven 2025. Это большая конференция от бизнес-группы Поиск и Рекламные технологии: обсудим, как аналитику влиять на бизнес, искать новые точки роста и определять цифровое будущее нашего мира.

Собираемся 20 сентября в Москве и онлайн. Будут доклады наших экспертов, игры, нетворкинг и воркшоп. Для самых активных участников мы уже приготовили подарки: станции с Алисой и радиоуправляемых роботов.

🔢 А вот программа конференции

Доклады для продуктовых, data-аналитиков и Data Scientists:

🔵 Мария Акопян, руководитель команды end-to-end-качества AI-ассистента Алисы. Расскажет про end-to-end-оценку качества Алисы как универсального AI-ассистента

🔵 Владислав Немиро, руководитель группы аналитики рободоставки. Заглянет под капот рободоставки и покажет, как аналитика и метрики помогают достичь общей цели

🔵 Тимофей Струнков, руководитель группы аналитики Справочника в Яндекс Картах. Объяснит, как в Яндекс Картах построили интегральные метрики качества и эффективности

🔵 Роман Васильев, руководитель аналитики международного Поиска. Расскажет про аналитику для Яндекс Поиска на рынках Казахстана и Турции, а также про подходы к масштабированию

Доклады для data-инженеров, системных и BI-аналитиков:

🔵 Марина Нестерук, руководитель команды Датакаталога и Meta DWH. Расскажет, как ребята делают из Датакаталога полноценный продукт, не ограничиваясь его инфраструктурной составляющей

🔵 Владимир Дмитриев, BI-аналитик из команды визуализации данных и дашбордов. Рассмотрит дашборд как средство коммуникации разработчика с пользователем

🔵 Лера Терова, руководитель команды аналитической инфраструктуры. Объяснит, что такое дата-контракты и как они помогают навести порядок даже в самой запутанной экосистеме

🔵 Марат Сацкевич, разработчик в отделе подготовки и анализа больших данных. Расскажет про РитмМастер — реалтайм-процессинг для нового сервиса

💎 А офлайн-воркшоп проведёт Максим Стаценко, руководитель службы подготовки и анализа больших данных. Он покажет, как создать собственного агента для работы с данными. Важно: для участия в воркшопе вам понадобится ноутбук 💻

⏬ Зарегистрироваться на Data Driven 2025: events.yandex.ru/events/data-driven-2025?utm_sourc…

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

2 days ago | [YT] | 3

Yandex for Analytics

🚕 Как мы увеличили число межгородских поездок в Яндекс Go в два раза

Такси из одного города в другой можно было заказать всегда, но вот цены на это дело больно кусались. Проблема была не только в длине маршрута, но и в том, что в стоимость закладывался обратный путь водителя уже без клиента.

Перед нами как аналитиками встала нетривиальная продуктовая задача: увеличить количество межгородских заказов. И сделать так, чтобы водитель возвращался в свой город не пустым, а с новым пассажиром. Вот как мы к этому пришли:

🥤 Изменили алгоритмы и снизили цены

Мы ввели ступенчатый поиск с увеличенным радиусом подачи. При заказе межгорода сервис в первую очередь ищет тех водителей, которые хотят попасть обратно в свой город — тот, который вы указали как пункт назначения. И только если их нет, мы возвращаемся к обычному поиску.

Снижение цен привело к росту числа поездок и, следовательно, повысило количество возвратных водителей. В итоге их плотность увеличилась, а из-за этого вырос шанс того, что мы назначим такого водителя и быстрее вернём его обратно.

👍 Переосмыслили возврат

Раньше межгородские водители пользовались режимом «домой». Но это сужало поиск заказов до конкретного района в их городе — ждать таких заказов можно очень долго.

Поэтому мы ввели режим «обратно» — его предлагают сразу после завершения межгородской поездки, а маршруты в нём идут в зону всего родного города.

♾ Первые A/B-эксперименты показали:

🔵 Предложений с обратными заказами стало больше на 25%
🔵 Доля водителей, которые возвращаются, увеличилась почти на треть

📆 Ввели предзаказ

Теперь и пользователи, и водители могут планировать поездки по межгороду заранее. Цены на такие заказы ещё ниже, а более долгий поиск позволяет делать долю возвратных водителей выше. Чего мы и хотели достичь 🙌

♾ Сейчас межгород — это:

🔵 188 маршрутов
🔵 38% предзаказов
🔵 1,4 миллиона поездок в месяц

💠 Мы уже запустили совместные поездки по предзаказам, чтобы ещё больше снизить цены для пользователей. Если вы хотите узнать подробности про эту фичу — ставьте 🔥 в реакциях!

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

3 weeks ago | [YT] | 1

Yandex for Analytics

☁ Ловушка конфаундинга: ищем взаимосвязи, которых на самом деле нет

Представим, что вас попросили посчитать влияние обучения на эффективность сотрудников. Вы построили простую линейную регрессию и получили +0,53% к эффективности сотрудника за каждый балл экзамена. Уже готовы нести выводы заказчику? Погодите, вы могли попасть в ловушку конфаундинга!

Конфаундинг — это неприятная ситуация, когда третьи переменные искажают оценку причинной связи. Последствия этого могут быть самыми драматичными. Особенно в больших компаниях, где каждый процент на счету.

Саша Ботвин, руководитель команды HR-аналитики в Яндексе, рассказывает о современном каузальном анализе и конфаундинге. Всё это с опорой на исследования антрополога Ричарда Макэлрита. А ещё Саша показывает:

🔵 Какие бывают типы конфаундинга

🔵 Как с помощью DAG найти ловушку и успешно её обезвредить

🔵 Сколько будет стоить игнор конфаундинга

⏬ Подробная практическая часть с таблицами, схемами, кодом и обширным списком литературы — в полной статье на Хабре: habr.com/ru/articles/927222/

👀 Будьте осторожны и глядите в оба!

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

1 month ago | [YT] | 2

Yandex for Analytics

🧑‍💻 Нейроаналитик: наш специалист по графикам и инсайтам

Хорошие новости! Yandex B2B Tech совсем скоро запустит AI-агента. С ним можно делать всякое полезное: например, создавать сложные графики и дашборды на JavaScript. Ещё он может искать инсайты, делать выводы из таблиц, а также консультировать по документации.

♾ Агент будет встроен в Yandex DataLens: datalens.yandex.cloud/promo#neuroanalytic
В форме чата. Чтобы перестроить график или изменить источник, не нужно вручную исправлять код на JavaScript. Достаточно сделать запрос на естественном языке — модель всё поймёт и скорректирует визуализацию.

💎 Новая версия сервиса Yandex DataLens с AI-агентом будет доступна как в облаке, так и локально — по модели on-premise.

💎 Более 4 тысяч сотрудников уже протестировали сервис в течение первых двух недель.

В сентябре Нейроаналитик станет доступен и другим компаниям — в лист ожидания можно записаться уже сейчас: datalens.yandex.cloud/promo#neuroanalytic

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

1 month ago | [YT] | 3

Yandex for Analytics

🚀 Как батчинг вырастил эффективность доставки в 2,5 раза за полтора года

В Яндекс Доставке мы возим очень разные вещи: от горячих бургеров до новых айфонов. Задача сервиса в том, чтобы быстро найти на каждую посылку подходящего курьера. Но если мы хотим доставлять эффективно, заказы приходится объединять, чтобы можно было отвезти несколько товаров за один присест. А для этого нужна сложная система, которая не допустит, чтобы бургер остыл, пока курьер ездил за айфоном.

♾ Лилия Царёва, руководитель группы развития технологий батчинга в Яндекс Доставке, рассказывает, как устроена технология. Внутри:

🔵 Как ребята перешли от предварительного расчёта маршрутов к решению в реальном времени
🔵 Что делать, если заказы слишком быстро разбирают и они не успевают сбатчиться
🔵 Как метрика MASDI ограничивает замедление доставки
🔵 И самое интересное: как неплохой и быстрый внутренний движок подружился с мощным, но медленным алгоритмом из RouteQ

⏬ Прочитать статью можно здесь: dev.go.yandex/blog/kak-my-rastim-effektivnost-v-do…

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

1 month ago | [YT] | 6

Yandex for Analytics

⏬A/B Week — новый онлайн-интенсив ШАД

Соскучились по интенсивам? Мы — да. Поэтому предлагаем вам с головой погрузиться в А/В-тестирование вместе с экспертом Школы анализа данных. Здесь вы отточите свои знания статистики, поймёте, как проводят А/В-тесты в Яндексе, и получите набор инструментов на Python, которые сразу сможете применить в работе.

Аналитик-разработчик и эксперт Яндекса Диля Хакимова расскажет:

🔵 Что такое Bootstrap, CUPED, линеаризация и другие техники
🔵 Как симуляции и математические методы позволяют анализировать результаты тестов и помогают формулировать решения для бизнес-задач

Внимание: спойлеры к интенсиву 🤫

CUPED, Bootstrap и линеаризация — это продвинутые статистические инструменты для повышения эффективности A/B-тестов. Например, CUPED снижает «шум» в данных и использует информацию о поведении пользователей до эксперимента. Bootstrap незаменим для анализа нестандартных, но важных показателей, таких как медианный доход или квантили метрик времени. Линеаризация и дельта-метод — стандарт индустрии для анализа сложных метрик-отношений (например, конверсии или среднего чека).

Математические расчёты можно применять уже на этапе планирования для оценки длительности эксперимента. Симуляции же подбирают тот статистический критерий, который подходит именно под вашу бизнес-задачу. В итоге благодаря грамотным статистическим методам банальное «стало лучше/хуже» превращается в глубокий бизнес-анализ и подробную оценку рисков.

Кому пригодится интенсив?

🔵 Аналитикам данных
🔵 ML-инженерам
🔵 Студентам технических специальностей

Чему научатся участники?

🔵 Проводить А/В-тесты и анализировать их результаты
🔵 Разбираться в новейших методах А/В-тестирования
🔵 Повышать чувствительность метрик, ускорять эксперименты и экономить ресурсы
🔵 Строить доверительные интервалы и контролировать бизнес-риски
🔵 Валидировать любой аналитический подход через симуляции

⏬ Доступ к лекциям будет открыт для всех, кто успеет зарегистрироваться по ссылке до 25 июля: clck.ru/3N4yPJ
А чтобы похвастаться сертификатом интенсива, нужно будет выполнить отборочные задания и итоговую работу.

💠 Ждём заявок от вас и ваших друзей!

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

1 month ago | [YT] | 4

Yandex for Analytics

🧑‍💻 Сможете сформулировать теорему Байеса?

Она понадобится для решения сегодняшней задачи — продолжаем вспоминать базовую теорию на простых примерах. Предыдущую задачу разбирали вот тут: t.me/yandexforanalytics/171
А вот и новая.

В одной компании захотели проверить, знают ли стажёры SQL. 30% стажёров оказались готовы к тесту, остальные — нет. С тестом справились 90% подготовленных стажёров и только 20% неподготовленных.

Если стажёр успешно прошёл тест, какова вероятность, что он был готов к нему?

🐚 Предлагаем размяться и проверить свои навыки! Скоро опубликуем правильный ответ с разбором. А пока делитесь своими решениями в комментариях

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

2 months ago | [YT] | 2

Yandex for Analytics

📕 Что заботать от ШАД

Делимся списком годных открытых ресурсов от ребят из Школы анализа данных. Подборка пригодится тем, кто только вкатывается в ML или хочет самостоятельно прокачаться в соседней области. Скидывайте пост вашим знакомым джунам — пусть учатся!

Вот ссылки:

♾ Открытый учебник по машинному обучению: education.yandex.ru/handbook/ml

А ещё интенсивы:

🔵 CV week: shad.yandex.ru/cvweek — полный упор на диффузионные генеративные модельки. Лекции читают ребята, которые создают YandexART. Перед изучением диффузионок рекомендуем вкатиться в классический CV, хотя это интенсив, а не курс, так что можете залететь и просто так (но предупреждаем: скорее всего, будет больно).

🔵 GPT week: shad.yandex.ru/gptweek — базовая база про LLM’ки. Сначала претрейн, потом оценка качества и бенчи, а после алайменты и инференсы моделей. Есть подготовительная лекция с введением в LLM, поэтому можно залетать без особой подготовки: достаточно понимать, что вообще происходит в NLP.

🔵 SRE week: shad.yandex.ru/sreweek — хороший интенсив про высоконагруженные системы и то, как ими заниматься. На практике такое потыкать почти нереально, поэтому очень любопытно хоть что-то узнать от практикующих разработчиков и инженеров. Помимо базы, там расскажут, почему важно погружаться в языки программирования, зачем нужны дежурства и как процессно проводить работу SRE.

🔵 Big DWH week: shad.yandex.ru/bigdwhweek — плотная база про распределённые БД (в том числе YT), потоковую обработку и логирование. Есть даже лекция про построение своей первой модели MapReduce и немного полезного про графовое DWH!

Из курсов на GitHub посоветуем один про алгоритмы, потому что они вечные и никогда не устареют:

♾ Алгоритмы с Максимом Бабенко: https://www.youtube.com/watch?v=qSnBX...

И интересную подборку не от ШАД:

♾ Это База знаний от Яндекс Образования: education.yandex.ru/knowledge

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

2 months ago | [YT] | 8

Yandex for Analytics

🧑‍💻 10 мифов об A/B-тестировании

Привет! На связи Диля Хакимова и Наталья Тоганова. Мы из команды экспериментальной платформы Laba в Яндекс Go: помогаем руководителям и аналитикам быстро получать нужную им информацию с помощью A/B-тестирования.

В статистическом анализе легко запутаться. Мифы о нëм регулярно всплывают в разговорах с руководителями, на собеседованиях и даже среди коллег-аналитиков. Иногда заблуждения кажутся безобидными, но на деле могут привести к серьёзным ошибкам, неверным решениям и упущенным возможностям.

⏬ В статье на Хабре разобрали самые популярные мифы: решение каждой из проблем сопроводили примером на GitHub: habr.com/ru/companies/yandex/articles/919966/
А ещё собрали 10 советов, как не попасть в самые популярные ловушки: telegra.ph/10-mifov-ob-AB-testirovanii-06-26

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

2 months ago | [YT] | 5

Yandex for Analytics

🛎 Митап для аналитиков от команды R&D уже через 2 дня

21 июня на Welcome Time ребята из R&D Яндекса расскажут, чем их работа отличается от «обычной» аналитики. Все доклады — про флагманские проекты: YandexGPT, YandexART, YandexVLM и голосовые технологии Алисы: events.yandex.ru/events/welcome-time-r-and-d

🔵 А после выступлений можно будет пройти диагностику навыков.
Всем, кто покажет классные знания аналитики и матстатистики, зачтём результат как техническую секцию — он будет действовать два года.

⏬ Мест осталось немного. Регистрируйтесь: events.yandex.ru/events/welcome-time-r-and-d/index…

Подписывайтесь на нас в Telegram: t.me/yandexforanalytics

2 months ago | [YT] | 3