Как нас нейросеть и табуны лошадей научили управляться с дедлайнами
Лошади и нейросети, или как мы почти похоронили дедлайн, но в итоге собрали датасет мечты.
Если вы думаете, что работа с искуственным интеллектом — это всегда только про код, серверы и алгоритмы, то… частично вы правы. Но в этот раз наша команда работала в таких условиях, о которых мы даже думать не могли: скачки, фермы, табуны и дедлайны. Запасайтесь чаем, будет история с неожиданными поворотами.
Лошадиный вопрос, или как нас втянули в проект
Все началось пару лет назад. Один заказчик пришел к нам с заманчивым проектом. Задача была экзотическая, как прогулка на единороге: создать нейросеть, которая сможет различать лошадей по их фотографиям, чтобы понять, не смешались ли табуны.
Зачем? Ну, у лошадей в табунах есть жесткая иерархия. Обычно одним табуном "рулит" самый главный самец. Если табуны смешиваются, начинаются разборки между жеребцами, и вся эта "лошадиная иерархия" летит к чертям. Это стресс для всех, и заказчик хотел придумать способ предотвратить катастрофу.
Помочь могла только биометрия, но не человеческая. Распознавание лошади по её, что называется, морде. А теперь к главному: где вообще взять 10 000 уникальных лошадей?
Как мы искали цифровой табун
Для начала клиент попросил собрать 10 000 уникальных фотографий лошадей, по 10 на каждую. Звучит просто? В теории!
Мы ринулись искать изображения на YouTube, TikTok, ВКонтакте, конных форумах и всевозможных уголках Интернета.
Условие: на каждой морде лошади должны были быть видны пять ключевых точек (вроде глаз, ноздрей и рта). Ещё красивый прямоугольник морды в минимум 224 пикселя.
Через два месяца стало ясно: темп был черепашьим. Собрали 30 000 изображений с разных ресурсов, но уникальных лошадей среди них оказалось лишь 3 000. Мы были в шаге от провала, а на горизонте уже маячил дедлайн.
Итак, пора дружить с нейросетями!
"Когда сам не справляешься — позови помощника", — подумали мы. Сделали короткий перерыв, пересмотрели свой подход и решили автоматизировать процесс. Что мы придумали:
Обучили нейросеть. Она распознавала морду лошади в кадре и проверяла, есть ли там необходимые точки (глаза, ноздри, рот).
Для сбора фотографий придумали Telegram-бота, который принимал изображения, определял уникальных лошадей и складывал подходящие кадры в папочки.
А теперь главное: мы стали собирать больше данных за меньшее время. Если раньше наша скорость была 500 изображений в день, то после внедрения автоматизации она выросла до 5 384 изображений в день!
Результат: Новый подход спас дедлайн
Используя обновленный метод, мы собрали 70 000 изображений всего за 13 дней. В базе оказалось 7 000 уникальных лошадей — минимум по 10 снимков на каждую. И самое главное: все данные были идеального качества для обучения нейросети.
Что мы вынесли из этого проекта:
Иногда решение проблемы лежит прямо перед вами. Нужно просто использовать уже известные инструменты с неожиданной стороны.
Технологии реально спасают нервы, репутацию и даже жизни (в случае с табунами).
Дальше — только интереснее. Если у вас есть необычные задачки для нейронок, мы готовы всё обсудить. Оставляйте заявку на нашем сайте!
Многофункциональные маркеры с длинным стержнем 45 мм для сверления отверстий
Если кому надо, вот на Али и аналог дешевле на Яндекс Маркет
Делитесь своими поделками в нашем сообществе
В Москве появятся 32 перекрёстка с «вафельной» разметкой
💥 Это нужно, чтобы уменьшить пробки и предотвратить заторы, когда машины перекрывают проезд.
Разметку нанесут, например, в таких местах:
- Пятницкое шоссе и 1-й Митинский переулок;
- Алтуфьевское шоссе и улица Хачатуряна;
- Улица Маршала Полубоярова и Привольная улица;
- Георгиевский проспект, Кутузовское шоссе и улица Радио.
Если стоять на такой разметке дольше 5 секунд — это нарушение правил. Рядом с этими перекрёстками установлены камеры, которые фиксируют нарушения.
Информация от Департамента транспорта Москвы.
Приглашаю всех кому интересна автомобильная тематика в свой канал "Гараж 2.0". Буду рад каждому!
Ответ на пост «Что это за ответ???!!!»6
Я требую пояснительную бригаду. Мне абсолютно не понятны две вещи в современном мире. Ответ должен лежать где-то на поверхности, и я знаю, что мог бы загуглить, но мне нужен ответ от живых людей, а не от нейросети.
Итак, по существу:
В чём смысл писать каждое предложение с новой строки? Есть смысл писать, когда вы закончили какую-то мысль, то есть вы её таким образом формируете, ограничивая одним абзацем, делая удобочитаемой, и обозначая новым обзацем начало следующей. Для обозначения конца предложений у нас есть точки, чрезмерное обилие новых абзацев только делают текст более размытым и сложным для восприятия. Или я один такой?
Откуда берутся эти огромные межстрочные интервалы, и как от них по-быстрому избавляться? На работе я для этого использую пустой текстовый файл, копирую сперва туда, удаляю лишние абзацы, и только потом копирую адресату. Или в ворде тыкаюсь, убирая "интервал перед новым абзацем", кнопки три для это нажать надо. Должен признаться это раздражает и создаёт регулярные дополнительные трудозатраты. Очень неудобно. И здесь на пикабу я никуда не могу деться от этой убогой автоматической разметки. Как будто пользователь сам не может два раза Enter нажать, если ему надо.
В общем объясните человеческим языком, что это за новая фича, какой нехороший человек её повсевместно внедрил, и как от неё эффективно избавляться. Спасибо.
Все плиточники гоняются за этим шаблоном для сверления отверстий
Есть на Яндекс Маркет
Реклама. ООО «Яндекс Маркет», ИНН 9704254424, erid: 5jtCeReNx12oajt64P4PCEL
Секрет идеальной разметки
Есть на Яндекс Маркете
Реклама. ООО «Яндекс Маркет», ИНН 9704254424, erid: 5jtCeReNx12oajt64GVPiac