Dissertação

Compression of activation signals from partitioned deep neural networks exploring temporal correlation

The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge...

ver descrição completa

Autor principal: SILVA, Lucas Damasceno
Grau: Dissertação
Idioma: eng
Publicado em: Universidade Federal do Pará 2025
Assuntos:
Acesso em linha: https://repositorio.ufpa.br/jspui/handle/2011/16859
id ir-2011-16859
recordtype dspace
spelling ir-2011-168592025-03-25T11:02:58Z Compression of activation signals from partitioned deep neural networks exploring temporal correlation Compressão de sinais de ativação de redes neurais profundas particionadas explorando a correlação temporal SILVA, Lucas Damasceno KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha http://lattes.cnpq.br/1596629769697284 Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CONTROLE E AUTOMAÇÃO SISTEMAS DE ENERGIA ELÉTRICA The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge in implementing these networks on such hardware is the need to economize computational resources. Despite substantial advances in computational capacity, implementing devices with ample resources remains challenging. As a solution, techniques for partitioning and compressing neural networks, as well as compressing activation signals (or feature maps), have been developed. This work proposes a system that partitions neural network models for object detection in videos, allocating part of the network to an end device and the remainder to a cloud server. The system also compresses the feature maps generated by the last layers on the end device by exploiting temporal correlation, enabling a predictive compression scheme. This approach allows neural networks to be embedded in low-power devices while respecting the computational limits of the device, the transmission rate constraints of the communication channel between the device and server, and the network’s accuracy requirements. Experiments conducted on pre-trained neural network models show that the proposed system can significantly reduce the amount of data to be stored or transmitted by leveraging temporal correlation, facilitating the deployment of these networks on devices with limited computational power CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior O uso de redes neurais artificiais para detecção de objetos, juntamente com avanços na pesquisa de 6G e IoT, desempenha um papel importante em aplicações como monitoramento de estruturas por drones, operações de busca e resgate, e implantação em plataformas de hardware como FPGAs. No entanto, um desafio fundamental na implementação dessas redes em tais hardwares é a necessidade de economizar recursos computacionais. Apesar dos avanços substanciais na capacidade computacional, implementar dispositivos com recursos amplos continua sendo um desafio. Como solução, técnicas de particionamento e compressão de redes neurais, bem como compressão de sinais de ativação (ou feature maps), foram desenvolvidas. Este trabalho propõe um sistema que particiona modelos de redes neurais para detecção de objetos em vídeos, alocando parte da rede em um end device e o restante em um servidor na nuvem. O sistema também comprime os mapas de características gerados pelas últimas camadas no dispositivo final, explorando a correlação temporal, o que possibilita um esquema de compressão preditiva. Essa abordagem permite que redes neurais sejam incorporadas em dispositivos de baixo consumo de energia, respeitando os limites computacionais do dispositivo, as restrições de taxa de transmissão do canal de comunicação entre o dispositivo e o servidor, e os requisitos de precisão da rede. Experimentos conduzidos em modelos de redes neurais pré-treinadas mostram que o sistema proposto pode reduzir significativamente a quantidade de dados a serem armazenados ou transmitidos ao explorar a correlação temporal, facilitando a implantação dessas redes em dispositivos com poder computacional limitado. INESC P&D Brasil - Instituto de Engenharia de Sistemas 2025-02-06T19:54:10Z 2025-02-06T19:54:10Z 2024-11-27 Dissertação SILVA, Lucas Damasceno. Compression of activation signals from partitioned deep neural networks exploring temporal correlation. . Orientador: Aldebaro Barreto da Rocha Klautau Junior. 2024. 82 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2024. Disponível em: https://repositorio.ufpa.br/jspui/handle/2011/16859. Acesso em:. https://repositorio.ufpa.br/jspui/handle/2011/16859 eng Acesso Aberto http://creativecommons.org/licenses/by-nc-nd/3.0/br/ application/pdf Universidade Federal do Pará Brasil Instituto de Tecnologia UFPA Programa de Pós-Graduação em Engenharia Elétrica Disponível na internet via correio eletrônico:bibliotecaitec@ufpa.br
institution Repositório Institucional - Universidade Federal do Pará
collection RI-UFPA
language eng
topic Compressão
Sinais de ativação
correlação temporal
Predição
Compression
Activation signals
Prediction
Temporal correlation
Redes Neurais Profundas
DNN (Deep Neural Networks)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
CONTROLE E AUTOMAÇÃO
SISTEMAS DE ENERGIA ELÉTRICA
spellingShingle Compressão
Sinais de ativação
correlação temporal
Predição
Compression
Activation signals
Prediction
Temporal correlation
Redes Neurais Profundas
DNN (Deep Neural Networks)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
CONTROLE E AUTOMAÇÃO
SISTEMAS DE ENERGIA ELÉTRICA
SILVA, Lucas Damasceno
Compression of activation signals from partitioned deep neural networks exploring temporal correlation
topic_facet Compressão
Sinais de ativação
correlação temporal
Predição
Compression
Activation signals
Prediction
Temporal correlation
Redes Neurais Profundas
DNN (Deep Neural Networks)
CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES
CONTROLE E AUTOMAÇÃO
SISTEMAS DE ENERGIA ELÉTRICA
description The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge in implementing these networks on such hardware is the need to economize computational resources. Despite substantial advances in computational capacity, implementing devices with ample resources remains challenging. As a solution, techniques for partitioning and compressing neural networks, as well as compressing activation signals (or feature maps), have been developed. This work proposes a system that partitions neural network models for object detection in videos, allocating part of the network to an end device and the remainder to a cloud server. The system also compresses the feature maps generated by the last layers on the end device by exploiting temporal correlation, enabling a predictive compression scheme. This approach allows neural networks to be embedded in low-power devices while respecting the computational limits of the device, the transmission rate constraints of the communication channel between the device and server, and the network’s accuracy requirements. Experiments conducted on pre-trained neural network models show that the proposed system can significantly reduce the amount of data to be stored or transmitted by leveraging temporal correlation, facilitating the deployment of these networks on devices with limited computational power
author_additional KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
author_additionalStr KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha
format Dissertação
author SILVA, Lucas Damasceno
title Compression of activation signals from partitioned deep neural networks exploring temporal correlation
title_short Compression of activation signals from partitioned deep neural networks exploring temporal correlation
title_full Compression of activation signals from partitioned deep neural networks exploring temporal correlation
title_fullStr Compression of activation signals from partitioned deep neural networks exploring temporal correlation
title_full_unstemmed Compression of activation signals from partitioned deep neural networks exploring temporal correlation
title_sort compression of activation signals from partitioned deep neural networks exploring temporal correlation
publisher Universidade Federal do Pará
publishDate 2025
url https://repositorio.ufpa.br/jspui/handle/2011/16859
_version_ 1832603628467126272
score 11.755432