pecimfetr

pecimfetr

Пикабушник
29К рейтинг 35 подписчиков 18 подписок 68 постов 15 в горячем
Награды:
5 лет на ПикабуЗа борьбу с тегохаосомБагХантер редактирование тегов в 1000 и более постах объединение 1000 и более тегов

Робота обучили передвигаться, как четвероногое животное

Робота обучили передвигаться, как четвероногое животное Калифорнийский университет, Neurohive, Робототехника, Животные, Движение, Машинное обучение, Научная работа, Гифка, Видео, Длиннопост

Исследователи из UC Berkeley обучили робота имитировать поведение собаки с помощью обучения с подкреплением. Предложенный фреймворк масштабируется на другие виды животных. Модель получает на вход видеоролик с записью движения животного. На основе входного ролика RL-агент выучивает политику контроля движений, которая позволяет ему имитировать движение. Поддержка других видов движения добавляется аналогично. Исследователи обучили RL-агента выполнять такие действия, как поворот, быстрая ходьба и прыжок. Политики агент выучивает в симуляции. Затем модель переносится в реальный мир с помощью метода адаптации скрытого пространства, который позволяет адаптировать политику к реальной среде на основе коротки видеозаписей реального робота.


Ниже - описание самой научной работы в формате видео

Архитектура фреймворка


Предложенный фреймворк состоит из трех этапа:


1. Переоценка движения, во время которой движения животного на входной видеозаписи соотносятся с движениями робота;


2. Имитация движения, когда выход из первого этапа используется для обучения политики имитации движения агента;


3. Адаптация к реальной среде, когда обученная модель из симуляции переносится на реальную среду

Робота обучили передвигаться, как четвероногое животное Калифорнийский университет, Neurohive, Робототехника, Животные, Движение, Машинное обучение, Научная работа, Гифка, Видео, Длиннопост

В качестве робота использовали модель четвероногого робота от Laikago.


Проверка работы алгоритма


RL-агент способен выучивать различные типы движений собаки. Среди типов движений — разные виды ходьбы, включая бег рысью или неспешный шаг, и быстрые повороты. Если обучать агента на видеозаписях с ходьбой, отмотанных в обратную сторону, то робот научается ходить назад.

Робота обучили передвигаться, как четвероногое животное Калифорнийский университет, Neurohive, Робототехника, Животные, Движение, Машинное обучение, Научная работа, Гифка, Видео, Длиннопост
Робота обучили передвигаться, как четвероногое животное Калифорнийский университет, Neurohive, Робототехника, Животные, Движение, Машинное обучение, Научная работа, Гифка, Видео, Длиннопост

Сравнение поведения до и после обучения робота: до адаптации робот склонен к падению в ходе выполнения задачи; после же тот готов последовательно исполнять предлагаемые команды.


Источник

Источник (на англ.)

Научная работа

Показать полностью 3 1

Google AI опубликовали датасет для восстановления 3D формы зданий

Google AI опубликовали датасет для восстановления 3D формы зданий Google, Neurohive, Здание, 3D моделирование, Данные, Научная статья, Гифка, Достопримечательности, Фонтан Треви

Исследователи опубликовали датасет с неструктурированными изображениями культурных объектов. Он включает в себя 25 тысяч изображений, каждое из которых содержит информацию о местоположении и наклоне. Данные собирали из открытых источников в интернете. Датасет создавали в сотрудничестве с UVIC, CTU и EPFL.


Восстановление 3D структуры зданий


Реконструкция 3D объектов и зданий из последовательности изображений (Structure-from-Motion) — это одна из открытых проблем компьютерного зрения. Одним из применений таких моделей является возможность изучения культурных объектов в браузере.

Google Maps уже использует изображения пользователей для обновления списка популярных мест или рабочих часов места. Однако использование такого типа данных для построения 3D моделей является более сложной задачей. Это связано с тем, что поступающие изображения имеют большую вариативность в том, с какой позиции снимали кадр, перекрывали ли люди объект на кадре и какие были погодные условия и освещение.


Что внутри датасета


Опубликованный датасет включает в себя 25 тысяч изображений из датасета YFCC100m. Каждое изображение имеет данные о позе (локация и направление). Исследовали сгенерировали тестовые 3D модели с помощью крупномасштабной SfM модели, которая использовала от сотен до тысяч фотографий здания для восстановления формы объекта. Такой подход не потребовал использования сенсоров или человеческой разметки для сбора данных.

Google AI опубликовали датасет для восстановления 3D формы зданий Google, Neurohive, Здание, 3D моделирование, Данные, Научная статья, Гифка, Достопримечательности, Фонтан Треви

3D форма объекта (Фонтан Треви), которую восстановили из 3 тысяч фотографий


Источник

Основной источник (на англ.)

Научная статья

Github-репозиторий

Показать полностью 1

Сбор тегов, пострадавших от нехватки символов

Всем добрый вечер!


Объявляется сбор тегов, пострадавших от нехватки символов. То есть, название какой-либо сущности оказалось обрезанным вследствие тегового ограничения в 30 символов.

За помощь @editors в этом нелегком деле полагается наш личный респект. И, к сожалению, ничего боле.

Сделаем навигацию по Пикабу красивенькой и удобненькой :з


Нерелевантные комментарии = флуд.


Пример:


Иван Васильевич меняет професс

Гарри Поттер и философский кам

Гарри Поттер и Принц-полукровк

Ответ на пост «Этого человека не существует»1

StyleGAN2: улучшенная нейросеть для генерации лиц людей


Встречаем StyleGAN2 — вторую версию нейронной сети, которая создает реалистичные изображения людей и предметов. Пока мы стебались над тем, кто она не умеет воспроизводить человеческие уши и волосы, нейросеть качалась.


После просмотра результатов обучения как-то уже несмешно.


Протестировать работу нейронной сети - thispersondoesnotexist.com

Ответ на пост «Этого человека не существует» Нейронные сети, Фотография, Наука, Neurohive, Машинное обучение, Лицо, Генератор, Видео, Длиннопост, Ответ на пост

В StyleGAN2 обновили архитектуру модели и методы обучения, чтобы минимизировать количество артефактов на генерируемых изображениях. Артефакты — это части изображения, которые снижают его реалистичность. Примером артефакта является размытость части изображения.


В частности, исследователи добавили измененные нормализацию генератора, регуляризацию генератора и прогрессивное повышение (progressive growing). Добавление регуляризатора в генератор решает проблему качества изображений и позволяет распознать изображения, которые были сгенерированы определенной нейросетью.


StyleGAN


Предыдущей state-of-the-art архитектурой для генерации изображений являлась StyleGAN модель. Отличительной чертой модели является архитектура генератора. Генератор принимает на вход промежуточное представление входного объекта. Слои генератора проходят через адаптивную instance нормализацию (AdaIN). Несмотря на высокие результаты по сравнению с конкурирующими подходами, оригинальная StyleGAN генерирует изображения с заметными артефактами.


StyleGAN2


В генераторе StyleGAN2 были убраны излишние операции в начале, вынесли суммирование bias термов за пределы блока стиля. Обновленная архитектура позволяет заменить instance нормализацию (AdaIN) на “демодуляцию”. Операция демодуляции применяется к весам каждого сверточного слоя.

Ответ на пост «Этого человека не существует» Нейронные сети, Фотография, Наука, Neurohive, Машинное обучение, Лицо, Генератор, Видео, Длиннопост, Ответ на пост

Сравнение составных частей StyleGAN (a-b) и StyleGAN2 (c-d)


Оценка работы модели


Для сравнения качества сгенерированных изображений исследователи использовали стандартные метрики: Frechet inception distance (FID) и Precision and Recall (P&R). Ниже видно, что внесенные в архитектуру StyleGAN изменения (B-F) улучшают качество изображений.

Ответ на пост «Этого человека не существует» Нейронные сети, Фотография, Наука, Neurohive, Машинное обучение, Лицо, Генератор, Видео, Длиннопост, Ответ на пост

Сравнение результатов базовой StyleGAN и ее модификаций на датасетах FFHQ и LSUN Car


Источник

Научная работа

Github

Показать полностью 3 1
Отличная работа, все прочитано!