/img alt="Imagem da capa" class="recordcover" src="""/>
Dissertação
Compression of activation signals from partitioned deep neural networks exploring temporal correlation
The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge...
Autor principal: | SILVA, Lucas Damasceno |
---|---|
Grau: | Dissertação |
Idioma: | eng |
Publicado em: |
Universidade Federal do Pará
2025
|
Assuntos: | |
Acesso em linha: |
https://repositorio.ufpa.br/jspui/handle/2011/16859 |
id |
ir-2011-16859 |
---|---|
recordtype |
dspace |
spelling |
ir-2011-168592025-03-25T11:02:58Z Compression of activation signals from partitioned deep neural networks exploring temporal correlation Compressão de sinais de ativação de redes neurais profundas particionadas explorando a correlação temporal SILVA, Lucas Damasceno KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha http://lattes.cnpq.br/1596629769697284 Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CONTROLE E AUTOMAÇÃO SISTEMAS DE ENERGIA ELÉTRICA The use of artificial neural networks for object detection, along with advancements in 6G and IoT research, plays an important role in applications such as drone-based monitoring of structures, search and rescue operations, and deployment on hardware platforms like FPGAs. However, a key challenge in implementing these networks on such hardware is the need to economize computational resources. Despite substantial advances in computational capacity, implementing devices with ample resources remains challenging. As a solution, techniques for partitioning and compressing neural networks, as well as compressing activation signals (or feature maps), have been developed. This work proposes a system that partitions neural network models for object detection in videos, allocating part of the network to an end device and the remainder to a cloud server. The system also compresses the feature maps generated by the last layers on the end device by exploiting temporal correlation, enabling a predictive compression scheme. This approach allows neural networks to be embedded in low-power devices while respecting the computational limits of the device, the transmission rate constraints of the communication channel between the device and server, and the network’s accuracy requirements. Experiments conducted on pre-trained neural network models show that the proposed system can significantly reduce the amount of data to be stored or transmitted by leveraging temporal correlation, facilitating the deployment of these networks on devices with limited computational power CAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superior O uso de redes neurais artificiais para detecção de objetos, juntamente com avanços na pesquisa de 6G e IoT, desempenha um papel importante em aplicações como monitoramento de estruturas por drones, operações de busca e resgate, e implantação em plataformas de hardware como FPGAs. No entanto, um desafio fundamental na implementação dessas redes em tais hardwares é a necessidade de economizar recursos computacionais. Apesar dos avanços substanciais na capacidade computacional, implementar dispositivos com recursos amplos continua sendo um desafio. Como solução, técnicas de particionamento e compressão de redes neurais, bem como compressão de sinais de ativação (ou feature maps), foram desenvolvidas. Este trabalho propõe um sistema que particiona modelos de redes neurais para detecção de objetos em vídeos, alocando parte da rede em um end device e o restante em um servidor na nuvem. O sistema também comprime os mapas de características gerados pelas últimas camadas no dispositivo final, explorando a correlação temporal, o que possibilita um esquema de compressão preditiva. Essa abordagem permite que redes neurais sejam incorporadas em dispositivos de baixo consumo de energia, respeitando os limites computacionais do dispositivo, as restrições de taxa de transmissão do canal de comunicação entre o dispositivo e o servidor, e os requisitos de precisão da rede. Experimentos conduzidos em modelos de redes neurais pré-treinadas mostram que o sistema proposto pode reduzir significativamente a quantidade de dados a serem armazenados ou transmitidos ao explorar a correlação temporal, facilitando a implantação dessas redes em dispositivos com poder computacional limitado. INESC P&D Brasil - Instituto de Engenharia de Sistemas 2025-02-06T19:54:10Z 2025-02-06T19:54:10Z 2024-11-27 Dissertação SILVA, Lucas Damasceno. Compression of activation signals from partitioned deep neural networks exploring temporal correlation. . Orientador: Aldebaro Barreto da Rocha Klautau Junior. 2024. 82 f. Dissertação (Mestrado em Engenharia Elétrica) - Instituto de Tecnologia, Universidade Federal do Pará, Belém, 2024. Disponível em: https://repositorio.ufpa.br/jspui/handle/2011/16859. Acesso em:. https://repositorio.ufpa.br/jspui/handle/2011/16859 eng Acesso Aberto http://creativecommons.org/licenses/by-nc-nd/3.0/br/ application/pdf Universidade Federal do Pará Brasil Instituto de Tecnologia UFPA Programa de Pós-Graduação em Engenharia Elétrica Disponível na internet via correio eletrônico:bibliotecaitec@ufpa.br |
institution |
Repositório Institucional - Universidade Federal do Pará |
collection |
RI-UFPA |
language |
eng |
topic |
Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CONTROLE E AUTOMAÇÃO SISTEMAS DE ENERGIA ELÉTRICA |
spellingShingle |
Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CONTROLE E AUTOMAÇÃO SISTEMAS DE ENERGIA ELÉTRICA SILVA, Lucas Damasceno Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
topic_facet |
Compressão Sinais de ativação correlação temporal Predição Compression Activation signals Prediction Temporal correlation Redes Neurais Profundas DNN (Deep Neural Networks) CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA::TELECOMUNICACOES::SISTEMAS DE TELECOMUNICACOES CONTROLE E AUTOMAÇÃO SISTEMAS DE ENERGIA ELÉTRICA |
description |
The use of artificial neural networks for object detection, along with advancements in 6G and
IoT research, plays an important role in applications such as drone-based monitoring of
structures, search and rescue operations, and deployment on hardware platforms like
FPGAs. However, a key challenge in implementing these networks on such hardware is the
need to economize computational resources. Despite substantial advances in computational
capacity, implementing devices with ample resources remains challenging. As a solution,
techniques for partitioning and compressing neural networks, as well as compressing
activation signals (or feature maps), have been developed. This work proposes a system
that partitions neural network models for object detection in videos, allocating part of the
network to an end device and the remainder to a cloud server. The system also compresses
the feature maps generated by the last layers on the end device by exploiting temporal
correlation, enabling a predictive compression scheme. This approach allows neural
networks to be embedded in low-power devices while respecting the computational limits of
the device, the transmission rate constraints of the communication channel between the
device and server, and the network’s accuracy requirements. Experiments conducted on
pre-trained neural network models show that the proposed system can significantly reduce
the amount of data to be stored or transmitted by leveraging temporal correlation, facilitating
the deployment of these networks on devices with limited computational power |
author_additional |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
author_additionalStr |
KLAUTAU JÚNIOR, Aldebaro Barreto da Rocha |
format |
Dissertação |
author |
SILVA, Lucas Damasceno |
title |
Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
title_short |
Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
title_full |
Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
title_fullStr |
Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
title_full_unstemmed |
Compression of activation signals from partitioned deep neural networks exploring temporal correlation |
title_sort |
compression of activation signals from partitioned deep neural networks exploring temporal correlation |
publisher |
Universidade Federal do Pará |
publishDate |
2025 |
url |
https://repositorio.ufpa.br/jspui/handle/2011/16859 |
_version_ |
1832603628467126272 |
score |
11.755432 |