Artigo

Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina

This paper presents a predictive analysis for detecting malware on Android devices using Machine Learning and explainability methods to interpret the results. After preprocessing, the dataset was reduced to 34,076 samples and 179 features of system calls and permissions. Among the 13 classifiers eva...

ver descrição completa

Autor principal: AMARAL, Geovani da Silva do
Grau: Artigo
Publicado em: 2024
Assuntos:
Acesso em linha: https://bdm.ufpa.br/jspui/handle/prefix/7448
id oai:https:--bdm.ufpa.br:8443:prefix-7448
recordtype dspace
spelling oai:https:--bdm.ufpa.br:8443:prefix-74482025-01-21T18:24:41Z Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina AMARAL, Geovani da Silva do MOREIRA, Caio Carvalho http://lattes.cnpq.br/1370619943470585 Aprendizado de máquina Malwares Android CNPQ::ENGENHARIAS CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO This paper presents a predictive analysis for detecting malware on Android devices using Machine Learning and explainability methods to interpret the results. After preprocessing, the dataset was reduced to 34,076 samples and 179 features of system calls and permissions. Among the 13 classifiers evaluated, eXtreme Gradient Boosting (XGBoost) proved to be the most efficient, with accuracy, precision, recall, and F1-Score metrics of approximately 94% and a training time of 1.48s. The SHapley Additive exPlanations (SHAP) method was used to explain the model’s decisions, which revealed system calls and sensitive permissions, such as READ PHONE STATE, SYSTEM ALERT WINDOW, SEND SMS, ACCESS WIFI STATE, getpriority, and getrlimit strongly associated with malwares. Este trabalho apresenta uma análise preditiva para a detecção de malwares em dispositivos Android usando Aprendizado de Máquina e métodos de explicabilidade para interpretar os resultados. Apos os pre-processamento, o conjunto de dados foi reduzido para 34.076 amostras e 179 características de chamadas de sistema e permissões. Entre 13 classificadores avaliados, o eXtreme Gradient Boosting (XGBoost) mostrou-se o mais eficiente, com métricas de acurácia, precisão, recall e F1-Score de aproximadamente 94%, e Tempo de Treinamento de 1,48s. O método SHapley Additive exPlanations (SHAP) foi utilizado para explicar as decisões do modelo, o que revelou chamadas de sistema e permissões sensíveis, como READ PHONE STATE, SYSTEM ALERT WINDOW, SEND SMS, ACCESS WIFI STATE, getpriority e getrlimit, fortemente associados a malwares. 2024-11-21T17:02:32Z 2024-11-21T17:02:32Z 2024-10-15 Trabalho de Curso - Graduação - Artigo AMARAL, Geovani da Silva do. Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina. Orientador: Caio Carvalho Moreira. 2024. [7] f. Trabalho de Curso (Bacharelado em Engenharia da Computação) – Faculdade de Engenharia da Computação, Campus Universitário de Tucuruí, Universidade Federal do Pará, Tucuruí, 2024. Disponível em:. Acesso em: https://bdm.ufpa.br/jspui/handle/prefix/7448 Acesso Aberto Disponível na internet via Sagitta
institution Biblioteca Digital de Monografias - UFPA
collection MonografiaUFPA
topic Aprendizado de máquina
Malwares
Android
CNPQ::ENGENHARIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
spellingShingle Aprendizado de máquina
Malwares
Android
CNPQ::ENGENHARIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
AMARAL, Geovani da Silva do
Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
topic_facet Aprendizado de máquina
Malwares
Android
CNPQ::ENGENHARIAS
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
description This paper presents a predictive analysis for detecting malware on Android devices using Machine Learning and explainability methods to interpret the results. After preprocessing, the dataset was reduced to 34,076 samples and 179 features of system calls and permissions. Among the 13 classifiers evaluated, eXtreme Gradient Boosting (XGBoost) proved to be the most efficient, with accuracy, precision, recall, and F1-Score metrics of approximately 94% and a training time of 1.48s. The SHapley Additive exPlanations (SHAP) method was used to explain the model’s decisions, which revealed system calls and sensitive permissions, such as READ PHONE STATE, SYSTEM ALERT WINDOW, SEND SMS, ACCESS WIFI STATE, getpriority, and getrlimit strongly associated with malwares.
author_additional MOREIRA, Caio Carvalho
author_additionalStr MOREIRA, Caio Carvalho
format Artigo
author AMARAL, Geovani da Silva do
title Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
title_short Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
title_full Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
title_fullStr Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
title_full_unstemmed Análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
title_sort análise preditiva e interpretação da classificação de malwares em sistemas android usando aprendizado de máquina
publishDate 2024
url https://bdm.ufpa.br/jspui/handle/prefix/7448
_version_ 1829093163878318080
score 11.753735