Автоматический кодер для уменьшения размера входных данных

python tensorflow neural-network keras autoencoder

670 просмотра

1 ответ

В настоящее время я хочу использовать autoencoder для уменьшения размера входных данных, чтобы использовать уменьшенные данные для других нейронных сетей. Моя задача - взять видео, а затем передать изображения видео в автокодер. Когда я использую только несколько изображений в качестве входных данных, автокодирование работает хорошо, но когда я хочу иметь последовательности изображений, это не так.

Представьте, что вы снимаете видео с шара. У нас есть, например, 200 изображений. Если я использую autoencoder для 200 изображений, ошибка большая, но если я использую только 5 изображений, ошибка восстановления является небольшой и приемлемой. Кажется, что autoencoder не изучает последовательность или временное перемещение шара, циркулирующего. Я также пытаюсь обозначить сложный автокодер, но результаты не очень хорошие.

Кто-нибудь знает, в чем проблема, или можно использовать автокодер для этой задачи?

Автор: user2873565 Источник Размещён: 17.05.2019 03:51

Ответы (1)


0 плюса

Autoencoders / Variational Autoencoders не узнает о последовательностях, он учится «отображать» входные данные в скрытое пространство, которое имеет меньше размеров. Например, если это изображение, 64x64x3вы можете сопоставить это с 32 dimтензором / массивом.

Для изучения последовательности изображений вам нужно будет подключить вывод части кодера автокодера к RNN (LSTM / GRU), который мог бы узнать о последовательности закодированных кадров (последовательные кадры в скрытом пространстве). После этого вывод RNN может подключиться к декодерной части автокодера, чтобы вы могли видеть восстановленные кадры.

Здесь вы можете найти проект GitHub, который пытается кодировать видеокадры, а затем прогнозировать последовательности

Автор: Gabe Размещён: 08.11.2018 09:27
Вопросы из категории :
32x32