🧑💻 Data Driven в Яндексе: приходите и посмотрите сами, как у нас всё устроено
Привет! Это важный пост для аналитиков: мы зафиналили список выступлений и спикеров на Data Driven 2025. Это большая конференция от бизнес-группы Поиск и Рекламные технологии: обсудим, как аналитику влиять на бизнес, искать новые точки роста и определять цифровое будущее нашего мира.
Собираемся 20 сентября в Москве и онлайн. Будут доклады наших экспертов, игры, нетворкинг и воркшоп. Для самых активных участников мы уже приготовили подарки: станции с Алисой и радиоуправляемых роботов.
🔢 А вот программа конференции
Доклады для продуктовых, data-аналитиков и Data Scientists:
🔵 Мария Акопян, руководитель команды end-to-end-качества AI-ассистента Алисы. Расскажет про end-to-end-оценку качества Алисы как универсального AI-ассистента
🔵 Владислав Немиро, руководитель группы аналитики рободоставки. Заглянет под капот рободоставки и покажет, как аналитика и метрики помогают достичь общей цели
🔵 Тимофей Струнков, руководитель группы аналитики Справочника в Яндекс Картах. Объяснит, как в Яндекс Картах построили интегральные метрики качества и эффективности
🔵 Роман Васильев, руководитель аналитики международного Поиска. Расскажет про аналитику для Яндекс Поиска на рынках Казахстана и Турции, а также про подходы к масштабированию
Доклады для data-инженеров, системных и BI-аналитиков:
🔵 Марина Нестерук, руководитель команды Датакаталога и Meta DWH. Расскажет, как ребята делают из Датакаталога полноценный продукт, не ограничиваясь его инфраструктурной составляющей
🔵 Владимир Дмитриев, BI-аналитик из команды визуализации данных и дашбордов. Рассмотрит дашборд как средство коммуникации разработчика с пользователем
🔵 Лера Терова, руководитель команды аналитической инфраструктуры. Объяснит, что такое дата-контракты и как они помогают навести порядок даже в самой запутанной экосистеме
🔵 Марат Сацкевич, разработчик в отделе подготовки и анализа больших данных. Расскажет про РитмМастер — реалтайм-процессинг для нового сервиса
💎 А офлайн-воркшоп проведёт Максим Стаценко, руководитель службы подготовки и анализа больших данных. Он покажет, как создать собственного агента для работы с данными. Важно: для участия в воркшопе вам понадобится ноутбук 💻
🚕 Как мы увеличили число межгородских поездок в Яндекс Go в два раза
Такси из одного города в другой можно было заказать всегда, но вот цены на это дело больно кусались. Проблема была не только в длине маршрута, но и в том, что в стоимость закладывался обратный путь водителя уже без клиента.
Перед нами как аналитиками встала нетривиальная продуктовая задача: увеличить количество межгородских заказов. И сделать так, чтобы водитель возвращался в свой город не пустым, а с новым пассажиром. Вот как мы к этому пришли:
🥤 Изменили алгоритмы и снизили цены
Мы ввели ступенчатый поиск с увеличенным радиусом подачи. При заказе межгорода сервис в первую очередь ищет тех водителей, которые хотят попасть обратно в свой город — тот, который вы указали как пункт назначения. И только если их нет, мы возвращаемся к обычному поиску.
Снижение цен привело к росту числа поездок и, следовательно, повысило количество возвратных водителей. В итоге их плотность увеличилась, а из-за этого вырос шанс того, что мы назначим такого водителя и быстрее вернём его обратно.
👍 Переосмыслили возврат
Раньше межгородские водители пользовались режимом «домой». Но это сужало поиск заказов до конкретного района в их городе — ждать таких заказов можно очень долго.
Поэтому мы ввели режим «обратно» — его предлагают сразу после завершения межгородской поездки, а маршруты в нём идут в зону всего родного города.
♾ Первые A/B-эксперименты показали:
🔵 Предложений с обратными заказами стало больше на 25% 🔵 Доля водителей, которые возвращаются, увеличилась почти на треть
📆 Ввели предзаказ
Теперь и пользователи, и водители могут планировать поездки по межгороду заранее. Цены на такие заказы ещё ниже, а более долгий поиск позволяет делать долю возвратных водителей выше. Чего мы и хотели достичь 🙌
♾ Сейчас межгород — это:
🔵 188 маршрутов 🔵 38% предзаказов 🔵 1,4 миллиона поездок в месяц
💠 Мы уже запустили совместные поездки по предзаказам, чтобы ещё больше снизить цены для пользователей. Если вы хотите узнать подробности про эту фичу — ставьте 🔥 в реакциях!
☁ Ловушка конфаундинга: ищем взаимосвязи, которых на самом деле нет
Представим, что вас попросили посчитать влияние обучения на эффективность сотрудников. Вы построили простую линейную регрессию и получили +0,53% к эффективности сотрудника за каждый балл экзамена. Уже готовы нести выводы заказчику? Погодите, вы могли попасть в ловушку конфаундинга!
Конфаундинг — это неприятная ситуация, когда третьи переменные искажают оценку причинной связи. Последствия этого могут быть самыми драматичными. Особенно в больших компаниях, где каждый процент на счету.
Саша Ботвин, руководитель команды HR-аналитики в Яндексе, рассказывает о современном каузальном анализе и конфаундинге. Всё это с опорой на исследования антрополога Ричарда Макэлрита. А ещё Саша показывает:
🔵 Какие бывают типы конфаундинга
🔵 Как с помощью DAG найти ловушку и успешно её обезвредить
🔵 Сколько будет стоить игнор конфаундинга
⏬ Подробная практическая часть с таблицами, схемами, кодом и обширным списком литературы — в полной статье на Хабре: habr.com/ru/articles/927222/
🧑💻 Нейроаналитик: наш специалист по графикам и инсайтам
Хорошие новости! Yandex B2B Tech совсем скоро запустит AI-агента. С ним можно делать всякое полезное: например, создавать сложные графики и дашборды на JavaScript. Ещё он может искать инсайты, делать выводы из таблиц, а также консультировать по документации.
♾ Агент будет встроен в Yandex DataLens: datalens.yandex.cloud/promo#neuroanalytic В форме чата. Чтобы перестроить график или изменить источник, не нужно вручную исправлять код на JavaScript. Достаточно сделать запрос на естественном языке — модель всё поймёт и скорректирует визуализацию.
💎 Новая версия сервиса Yandex DataLens с AI-агентом будет доступна как в облаке, так и локально — по модели on-premise.
💎 Более 4 тысяч сотрудников уже протестировали сервис в течение первых двух недель.
🚀 Как батчинг вырастил эффективность доставки в 2,5 раза за полтора года
В Яндекс Доставке мы возим очень разные вещи: от горячих бургеров до новых айфонов. Задача сервиса в том, чтобы быстро найти на каждую посылку подходящего курьера. Но если мы хотим доставлять эффективно, заказы приходится объединять, чтобы можно было отвезти несколько товаров за один присест. А для этого нужна сложная система, которая не допустит, чтобы бургер остыл, пока курьер ездил за айфоном.
♾ Лилия Царёва, руководитель группы развития технологий батчинга в Яндекс Доставке, рассказывает, как устроена технология. Внутри:
🔵 Как ребята перешли от предварительного расчёта маршрутов к решению в реальном времени 🔵 Что делать, если заказы слишком быстро разбирают и они не успевают сбатчиться 🔵 Как метрика MASDI ограничивает замедление доставки 🔵 И самое интересное: как неплохой и быстрый внутренний движок подружился с мощным, но медленным алгоритмом из RouteQ
Соскучились по интенсивам? Мы — да. Поэтому предлагаем вам с головой погрузиться в А/В-тестирование вместе с экспертом Школы анализа данных. Здесь вы отточите свои знания статистики, поймёте, как проводят А/В-тесты в Яндексе, и получите набор инструментов на Python, которые сразу сможете применить в работе.
Аналитик-разработчик и эксперт Яндекса Диля Хакимова расскажет:
🔵 Что такое Bootstrap, CUPED, линеаризация и другие техники 🔵 Как симуляции и математические методы позволяют анализировать результаты тестов и помогают формулировать решения для бизнес-задач
Внимание: спойлеры к интенсиву 🤫
CUPED, Bootstrap и линеаризация — это продвинутые статистические инструменты для повышения эффективности A/B-тестов. Например, CUPED снижает «шум» в данных и использует информацию о поведении пользователей до эксперимента. Bootstrap незаменим для анализа нестандартных, но важных показателей, таких как медианный доход или квантили метрик времени. Линеаризация и дельта-метод — стандарт индустрии для анализа сложных метрик-отношений (например, конверсии или среднего чека).
Математические расчёты можно применять уже на этапе планирования для оценки длительности эксперимента. Симуляции же подбирают тот статистический критерий, который подходит именно под вашу бизнес-задачу. В итоге благодаря грамотным статистическим методам банальное «стало лучше/хуже» превращается в глубокий бизнес-анализ и подробную оценку рисков.
Кому пригодится интенсив?
🔵 Аналитикам данных 🔵 ML-инженерам 🔵 Студентам технических специальностей
Чему научатся участники?
🔵 Проводить А/В-тесты и анализировать их результаты 🔵 Разбираться в новейших методах А/В-тестирования 🔵 Повышать чувствительность метрик, ускорять эксперименты и экономить ресурсы 🔵 Строить доверительные интервалы и контролировать бизнес-риски 🔵 Валидировать любой аналитический подход через симуляции
⏬ Доступ к лекциям будет открыт для всех, кто успеет зарегистрироваться по ссылке до 25 июля: clck.ru/3N4yPJ А чтобы похвастаться сертификатом интенсива, нужно будет выполнить отборочные задания и итоговую работу.
Она понадобится для решения сегодняшней задачи — продолжаем вспоминать базовую теорию на простых примерах. Предыдущую задачу разбирали вот тут: t.me/yandexforanalytics/171 А вот и новая.
В одной компании захотели проверить, знают ли стажёры SQL. 30% стажёров оказались готовы к тесту, остальные — нет. С тестом справились 90% подготовленных стажёров и только 20% неподготовленных.
Если стажёр успешно прошёл тест, какова вероятность, что он был готов к нему?
🐚 Предлагаем размяться и проверить свои навыки! Скоро опубликуем правильный ответ с разбором. А пока делитесь своими решениями в комментариях
Делимся списком годных открытых ресурсов от ребят из Школы анализа данных. Подборка пригодится тем, кто только вкатывается в ML или хочет самостоятельно прокачаться в соседней области. Скидывайте пост вашим знакомым джунам — пусть учатся!
🔵 CV week: shad.yandex.ru/cvweek — полный упор на диффузионные генеративные модельки. Лекции читают ребята, которые создают YandexART. Перед изучением диффузионок рекомендуем вкатиться в классический CV, хотя это интенсив, а не курс, так что можете залететь и просто так (но предупреждаем: скорее всего, будет больно).
🔵 GPT week: shad.yandex.ru/gptweek — базовая база про LLM’ки. Сначала претрейн, потом оценка качества и бенчи, а после алайменты и инференсы моделей. Есть подготовительная лекция с введением в LLM, поэтому можно залетать без особой подготовки: достаточно понимать, что вообще происходит в NLP.
🔵 SRE week: shad.yandex.ru/sreweek — хороший интенсив про высоконагруженные системы и то, как ими заниматься. На практике такое потыкать почти нереально, поэтому очень любопытно хоть что-то узнать от практикующих разработчиков и инженеров. Помимо базы, там расскажут, почему важно погружаться в языки программирования, зачем нужны дежурства и как процессно проводить работу SRE.
🔵 Big DWH week: shad.yandex.ru/bigdwhweek — плотная база про распределённые БД (в том числе YT), потоковую обработку и логирование. Есть даже лекция про построение своей первой модели MapReduce и немного полезного про графовое DWH!
Из курсов на GitHub посоветуем один про алгоритмы, потому что они вечные и никогда не устареют:
Привет! На связи Диля Хакимова и Наталья Тоганова. Мы из команды экспериментальной платформы Laba в Яндекс Go: помогаем руководителям и аналитикам быстро получать нужную им информацию с помощью A/B-тестирования.
В статистическом анализе легко запутаться. Мифы о нëм регулярно всплывают в разговорах с руководителями, на собеседованиях и даже среди коллег-аналитиков. Иногда заблуждения кажутся безобидными, но на деле могут привести к серьёзным ошибкам, неверным решениям и упущенным возможностям.
🛎 Митап для аналитиков от команды R&D уже через 2 дня
21 июня на Welcome Time ребята из R&D Яндекса расскажут, чем их работа отличается от «обычной» аналитики. Все доклады — про флагманские проекты: YandexGPT, YandexART, YandexVLM и голосовые технологии Алисы: events.yandex.ru/events/welcome-time-r-and-d
🔵 А после выступлений можно будет пройти диагностику навыков. Всем, кто покажет классные знания аналитики и матстатистики, зачтём результат как техническую секцию — он будет действовать два года.
Yandex for Analytics
🧑💻 Data Driven в Яндексе: приходите и посмотрите сами, как у нас всё устроено
Привет! Это важный пост для аналитиков: мы зафиналили список выступлений и спикеров на Data Driven 2025. Это большая конференция от бизнес-группы Поиск и Рекламные технологии: обсудим, как аналитику влиять на бизнес, искать новые точки роста и определять цифровое будущее нашего мира.
Собираемся 20 сентября в Москве и онлайн. Будут доклады наших экспертов, игры, нетворкинг и воркшоп. Для самых активных участников мы уже приготовили подарки: станции с Алисой и радиоуправляемых роботов.
🔢 А вот программа конференции
Доклады для продуктовых, data-аналитиков и Data Scientists:
🔵 Мария Акопян, руководитель команды end-to-end-качества AI-ассистента Алисы. Расскажет про end-to-end-оценку качества Алисы как универсального AI-ассистента
🔵 Владислав Немиро, руководитель группы аналитики рободоставки. Заглянет под капот рободоставки и покажет, как аналитика и метрики помогают достичь общей цели
🔵 Тимофей Струнков, руководитель группы аналитики Справочника в Яндекс Картах. Объяснит, как в Яндекс Картах построили интегральные метрики качества и эффективности
🔵 Роман Васильев, руководитель аналитики международного Поиска. Расскажет про аналитику для Яндекс Поиска на рынках Казахстана и Турции, а также про подходы к масштабированию
Доклады для data-инженеров, системных и BI-аналитиков:
🔵 Марина Нестерук, руководитель команды Датакаталога и Meta DWH. Расскажет, как ребята делают из Датакаталога полноценный продукт, не ограничиваясь его инфраструктурной составляющей
🔵 Владимир Дмитриев, BI-аналитик из команды визуализации данных и дашбордов. Рассмотрит дашборд как средство коммуникации разработчика с пользователем
🔵 Лера Терова, руководитель команды аналитической инфраструктуры. Объяснит, что такое дата-контракты и как они помогают навести порядок даже в самой запутанной экосистеме
🔵 Марат Сацкевич, разработчик в отделе подготовки и анализа больших данных. Расскажет про РитмМастер — реалтайм-процессинг для нового сервиса
💎 А офлайн-воркшоп проведёт Максим Стаценко, руководитель службы подготовки и анализа больших данных. Он покажет, как создать собственного агента для работы с данными. Важно: для участия в воркшопе вам понадобится ноутбук 💻
⏬ Зарегистрироваться на Data Driven 2025: events.yandex.ru/events/data-driven-2025?utm_sourc…
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
2 days ago | [YT] | 3
View 0 replies
Yandex for Analytics
🚕 Как мы увеличили число межгородских поездок в Яндекс Go в два раза
Такси из одного города в другой можно было заказать всегда, но вот цены на это дело больно кусались. Проблема была не только в длине маршрута, но и в том, что в стоимость закладывался обратный путь водителя уже без клиента.
Перед нами как аналитиками встала нетривиальная продуктовая задача: увеличить количество межгородских заказов. И сделать так, чтобы водитель возвращался в свой город не пустым, а с новым пассажиром. Вот как мы к этому пришли:
🥤 Изменили алгоритмы и снизили цены
Мы ввели ступенчатый поиск с увеличенным радиусом подачи. При заказе межгорода сервис в первую очередь ищет тех водителей, которые хотят попасть обратно в свой город — тот, который вы указали как пункт назначения. И только если их нет, мы возвращаемся к обычному поиску.
Снижение цен привело к росту числа поездок и, следовательно, повысило количество возвратных водителей. В итоге их плотность увеличилась, а из-за этого вырос шанс того, что мы назначим такого водителя и быстрее вернём его обратно.
👍 Переосмыслили возврат
Раньше межгородские водители пользовались режимом «домой». Но это сужало поиск заказов до конкретного района в их городе — ждать таких заказов можно очень долго.
Поэтому мы ввели режим «обратно» — его предлагают сразу после завершения межгородской поездки, а маршруты в нём идут в зону всего родного города.
♾ Первые A/B-эксперименты показали:
🔵 Предложений с обратными заказами стало больше на 25%
🔵 Доля водителей, которые возвращаются, увеличилась почти на треть
📆 Ввели предзаказ
Теперь и пользователи, и водители могут планировать поездки по межгороду заранее. Цены на такие заказы ещё ниже, а более долгий поиск позволяет делать долю возвратных водителей выше. Чего мы и хотели достичь 🙌
♾ Сейчас межгород — это:
🔵 188 маршрутов
🔵 38% предзаказов
🔵 1,4 миллиона поездок в месяц
💠 Мы уже запустили совместные поездки по предзаказам, чтобы ещё больше снизить цены для пользователей. Если вы хотите узнать подробности про эту фичу — ставьте 🔥 в реакциях!
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
3 weeks ago | [YT] | 1
View 0 replies
Yandex for Analytics
☁ Ловушка конфаундинга: ищем взаимосвязи, которых на самом деле нет
Представим, что вас попросили посчитать влияние обучения на эффективность сотрудников. Вы построили простую линейную регрессию и получили +0,53% к эффективности сотрудника за каждый балл экзамена. Уже готовы нести выводы заказчику? Погодите, вы могли попасть в ловушку конфаундинга!
Конфаундинг — это неприятная ситуация, когда третьи переменные искажают оценку причинной связи. Последствия этого могут быть самыми драматичными. Особенно в больших компаниях, где каждый процент на счету.
Саша Ботвин, руководитель команды HR-аналитики в Яндексе, рассказывает о современном каузальном анализе и конфаундинге. Всё это с опорой на исследования антрополога Ричарда Макэлрита. А ещё Саша показывает:
🔵 Какие бывают типы конфаундинга
🔵 Как с помощью DAG найти ловушку и успешно её обезвредить
🔵 Сколько будет стоить игнор конфаундинга
⏬ Подробная практическая часть с таблицами, схемами, кодом и обширным списком литературы — в полной статье на Хабре: habr.com/ru/articles/927222/
👀 Будьте осторожны и глядите в оба!
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
1 month ago | [YT] | 2
View 0 replies
Yandex for Analytics
🧑💻 Нейроаналитик: наш специалист по графикам и инсайтам
Хорошие новости! Yandex B2B Tech совсем скоро запустит AI-агента. С ним можно делать всякое полезное: например, создавать сложные графики и дашборды на JavaScript. Ещё он может искать инсайты, делать выводы из таблиц, а также консультировать по документации.
♾ Агент будет встроен в Yandex DataLens: datalens.yandex.cloud/promo#neuroanalytic
В форме чата. Чтобы перестроить график или изменить источник, не нужно вручную исправлять код на JavaScript. Достаточно сделать запрос на естественном языке — модель всё поймёт и скорректирует визуализацию.
💎 Новая версия сервиса Yandex DataLens с AI-агентом будет доступна как в облаке, так и локально — по модели on-premise.
💎 Более 4 тысяч сотрудников уже протестировали сервис в течение первых двух недель.
В сентябре Нейроаналитик станет доступен и другим компаниям — в лист ожидания можно записаться уже сейчас: datalens.yandex.cloud/promo#neuroanalytic
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
1 month ago | [YT] | 3
View 0 replies
Yandex for Analytics
🚀 Как батчинг вырастил эффективность доставки в 2,5 раза за полтора года
В Яндекс Доставке мы возим очень разные вещи: от горячих бургеров до новых айфонов. Задача сервиса в том, чтобы быстро найти на каждую посылку подходящего курьера. Но если мы хотим доставлять эффективно, заказы приходится объединять, чтобы можно было отвезти несколько товаров за один присест. А для этого нужна сложная система, которая не допустит, чтобы бургер остыл, пока курьер ездил за айфоном.
♾ Лилия Царёва, руководитель группы развития технологий батчинга в Яндекс Доставке, рассказывает, как устроена технология. Внутри:
🔵 Как ребята перешли от предварительного расчёта маршрутов к решению в реальном времени
🔵 Что делать, если заказы слишком быстро разбирают и они не успевают сбатчиться
🔵 Как метрика MASDI ограничивает замедление доставки
🔵 И самое интересное: как неплохой и быстрый внутренний движок подружился с мощным, но медленным алгоритмом из RouteQ
⏬ Прочитать статью можно здесь: dev.go.yandex/blog/kak-my-rastim-effektivnost-v-do…
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
1 month ago | [YT] | 6
View 0 replies
Yandex for Analytics
⏬A/B Week — новый онлайн-интенсив ШАД
Соскучились по интенсивам? Мы — да. Поэтому предлагаем вам с головой погрузиться в А/В-тестирование вместе с экспертом Школы анализа данных. Здесь вы отточите свои знания статистики, поймёте, как проводят А/В-тесты в Яндексе, и получите набор инструментов на Python, которые сразу сможете применить в работе.
Аналитик-разработчик и эксперт Яндекса Диля Хакимова расскажет:
🔵 Что такое Bootstrap, CUPED, линеаризация и другие техники
🔵 Как симуляции и математические методы позволяют анализировать результаты тестов и помогают формулировать решения для бизнес-задач
Внимание: спойлеры к интенсиву 🤫
CUPED, Bootstrap и линеаризация — это продвинутые статистические инструменты для повышения эффективности A/B-тестов. Например, CUPED снижает «шум» в данных и использует информацию о поведении пользователей до эксперимента. Bootstrap незаменим для анализа нестандартных, но важных показателей, таких как медианный доход или квантили метрик времени. Линеаризация и дельта-метод — стандарт индустрии для анализа сложных метрик-отношений (например, конверсии или среднего чека).
Математические расчёты можно применять уже на этапе планирования для оценки длительности эксперимента. Симуляции же подбирают тот статистический критерий, который подходит именно под вашу бизнес-задачу. В итоге благодаря грамотным статистическим методам банальное «стало лучше/хуже» превращается в глубокий бизнес-анализ и подробную оценку рисков.
Кому пригодится интенсив?
🔵 Аналитикам данных
🔵 ML-инженерам
🔵 Студентам технических специальностей
Чему научатся участники?
🔵 Проводить А/В-тесты и анализировать их результаты
🔵 Разбираться в новейших методах А/В-тестирования
🔵 Повышать чувствительность метрик, ускорять эксперименты и экономить ресурсы
🔵 Строить доверительные интервалы и контролировать бизнес-риски
🔵 Валидировать любой аналитический подход через симуляции
⏬ Доступ к лекциям будет открыт для всех, кто успеет зарегистрироваться по ссылке до 25 июля: clck.ru/3N4yPJ
А чтобы похвастаться сертификатом интенсива, нужно будет выполнить отборочные задания и итоговую работу.
💠 Ждём заявок от вас и ваших друзей!
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
1 month ago | [YT] | 4
View 0 replies
Yandex for Analytics
🧑💻 Сможете сформулировать теорему Байеса?
Она понадобится для решения сегодняшней задачи — продолжаем вспоминать базовую теорию на простых примерах. Предыдущую задачу разбирали вот тут: t.me/yandexforanalytics/171
А вот и новая.
В одной компании захотели проверить, знают ли стажёры SQL. 30% стажёров оказались готовы к тесту, остальные — нет. С тестом справились 90% подготовленных стажёров и только 20% неподготовленных.
Если стажёр успешно прошёл тест, какова вероятность, что он был готов к нему?
🐚 Предлагаем размяться и проверить свои навыки! Скоро опубликуем правильный ответ с разбором. А пока делитесь своими решениями в комментариях
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
2 months ago | [YT] | 2
View 0 replies
Yandex for Analytics
📕 Что заботать от ШАД
Делимся списком годных открытых ресурсов от ребят из Школы анализа данных. Подборка пригодится тем, кто только вкатывается в ML или хочет самостоятельно прокачаться в соседней области. Скидывайте пост вашим знакомым джунам — пусть учатся!
Вот ссылки:
♾ Открытый учебник по машинному обучению: education.yandex.ru/handbook/ml
А ещё интенсивы:
🔵 CV week: shad.yandex.ru/cvweek — полный упор на диффузионные генеративные модельки. Лекции читают ребята, которые создают YandexART. Перед изучением диффузионок рекомендуем вкатиться в классический CV, хотя это интенсив, а не курс, так что можете залететь и просто так (но предупреждаем: скорее всего, будет больно).
🔵 GPT week: shad.yandex.ru/gptweek — базовая база про LLM’ки. Сначала претрейн, потом оценка качества и бенчи, а после алайменты и инференсы моделей. Есть подготовительная лекция с введением в LLM, поэтому можно залетать без особой подготовки: достаточно понимать, что вообще происходит в NLP.
🔵 SRE week: shad.yandex.ru/sreweek — хороший интенсив про высоконагруженные системы и то, как ими заниматься. На практике такое потыкать почти нереально, поэтому очень любопытно хоть что-то узнать от практикующих разработчиков и инженеров. Помимо базы, там расскажут, почему важно погружаться в языки программирования, зачем нужны дежурства и как процессно проводить работу SRE.
🔵 Big DWH week: shad.yandex.ru/bigdwhweek — плотная база про распределённые БД (в том числе YT), потоковую обработку и логирование. Есть даже лекция про построение своей первой модели MapReduce и немного полезного про графовое DWH!
Из курсов на GitHub посоветуем один про алгоритмы, потому что они вечные и никогда не устареют:
♾ Алгоритмы с Максимом Бабенко: https://www.youtube.com/watch?v=qSnBX...
И интересную подборку не от ШАД:
♾ Это База знаний от Яндекс Образования: education.yandex.ru/knowledge
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
2 months ago | [YT] | 8
View 0 replies
Yandex for Analytics
🧑💻 10 мифов об A/B-тестировании
Привет! На связи Диля Хакимова и Наталья Тоганова. Мы из команды экспериментальной платформы Laba в Яндекс Go: помогаем руководителям и аналитикам быстро получать нужную им информацию с помощью A/B-тестирования.
В статистическом анализе легко запутаться. Мифы о нëм регулярно всплывают в разговорах с руководителями, на собеседованиях и даже среди коллег-аналитиков. Иногда заблуждения кажутся безобидными, но на деле могут привести к серьёзным ошибкам, неверным решениям и упущенным возможностям.
⏬ В статье на Хабре разобрали самые популярные мифы: решение каждой из проблем сопроводили примером на GitHub: habr.com/ru/companies/yandex/articles/919966/
А ещё собрали 10 советов, как не попасть в самые популярные ловушки: telegra.ph/10-mifov-ob-AB-testirovanii-06-26
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
2 months ago | [YT] | 5
View 0 replies
Yandex for Analytics
🛎 Митап для аналитиков от команды R&D уже через 2 дня
21 июня на Welcome Time ребята из R&D Яндекса расскажут, чем их работа отличается от «обычной» аналитики. Все доклады — про флагманские проекты: YandexGPT, YandexART, YandexVLM и голосовые технологии Алисы: events.yandex.ru/events/welcome-time-r-and-d
🔵 А после выступлений можно будет пройти диагностику навыков.
Всем, кто покажет классные знания аналитики и матстатистики, зачтём результат как техническую секцию — он будет действовать два года.
⏬ Мест осталось немного. Регистрируйтесь: events.yandex.ru/events/welcome-time-r-and-d/index…
Подписывайтесь на нас в Telegram: t.me/yandexforanalytics
2 months ago | [YT] | 3
View 0 replies
Load more