Aplicação da Visualização de Dados e Análise Preditiva na Malformação Congênita

Tipo de documento:Projeto de Pesquisa

Área de estudo:Tecnologia da informação

Documento 1

Dr. Rodrigo Bonacin (Orientador) Resumo. Aqui o aluno deve escrever um breve resumo do trabalho que pretende executar, apresentando claramente o problema e sua contribuição. analise comparativa dos métodos de visualizações, design protótipo implementado, resultado empírico da avalição. Abstract: Aqui o aluno deve escrever um breve resumo do trabalho em inglês que pretende executar, apresentando claramente o problema e sua contribuição. Trabalhos Relacionados 4. Proposta de Dissertação e Resultados Esperados 4. Metodologia de Pesquisa 4. Proposta de Solução 4. Resultados Preliminares 5. Fluxo para os nascimentos hospitalares 4. Rede de difusão para 3 assuntos diferentes 5. Demonstração dos dados no formato de agrupamento 6. Exemplo de como se apresentavam os indicadores antigos 7. Indicadores implementados 8. Dessa forma, as empresas vem buscando nos últimos anos alternativas de visualização de dados que lhes permitam uma melhor análise das informações, podemos citar algumas dessas metodologias como sendo: ERP, CRM’s, mineração de dados, data warehouse, análise preditiva, entre outros.

Uma das aplicações das técnicas de visualização é a área da saúde, onde podemos, por exemplo, realizar uma análise preditiva sobre a malformação congênita, tema desse trabalho. A área da saúde oferece uma boa aplicação dos métodos devido a quantidade de dados disponíveis e também por, de acordo com Caroll et al. existir pouca literatura disponível, pois a principal forma de representação gráfica ainda são os gráficos. Dessa forma uma maior quantidade de pesquisas sobre como desenvolver visualizações específicas do domínio, avaliação da experiência do usuário e técnicas de visualização para dados de saúde heterogêneos são necessárias. Segundo os autores entre 40 a 60% dos fatores causais ainda possuem origem desconhecida.

As malformações congênitas também contribuem em muito à mortalidade infantil, sendo que se acordo com Bastos e de Macedo (2008) afetam uma em cada dez ou vinte crianças que nascem e, não obstante a sua frequência, 50% destas poderiam ser prevenidas através de simples medida. Os autores citam que apesar de extremamente variáveis em tipos e mecanismo causal, todas surgem de um transtorno no desenvolvimento ontogenético. Dessa forma, através da análise preditiva, podemos, em um estágio inicial, procurar agir com o objetivo de proteger as gestações. Temos então que a ciência de dados, um campo de estudo com destaque para a capacidade de auxiliar a descoberta de informações úteis a partir de um grande repositório de dados, como uma ferramenta que pode auxiliar na predição de casos de malformação congênita, através da análise de diversos fatores.

• E por fim, no capítulo 5 apresentamos o cronograma das atividades a serem desenvolvidas. Referencial Teórico e Metodológico A metodologia de um trabalho de pesquisa constitui-se em um conjunto de etapas e técnicas para alcançar um determinado fim. É verificar se a utilização de visualização de dados que permite o estabelecimento de relações interdisciplinares, favorecendo a aprendizagem e a construção de conhecimento. Dessa forma, nesse capítulo apresentamos a fundamentação teórica em que esse trabalho está baseado, apresentando conceitos referentes a malformação congênita, ciência de dados, técnicas de visualização de dados, entre outros. Visualização de Informação e Mineração de Dados Segundo Pino (2012) a visualização de dados, ou data visualization, é a representação dos dados em formato gráfico, sendo que segundo o autor, seu maior objetivo é a promoção de uma comunicação mais clara, simples e eficientes dos resultados obtidos no processo de análise de dados.

Podemos então observar que no nível 1 temos o dado bruto, e conforme ele vai sendo tratado é possível obter conhecimento a partir dele. Nesse ponto faz-se importante ressaltar que a qualidade da informação adquirida depende da qualidade dos dados coletados. O primeiro nível aborda o gerenciamento dos dados, ou seja, a aquisição dos mesmos, que podem ser obtidos através de sistemas externos, formulários, métricas, entre outros. Um exemplo de aquisição de dados é o SINASC (Sistema de Informação sobre Nascidos Vivos), cujo objetivo é coletar, produzir, analisar e divulgar dados sobre os nascidos vivos em território nacional. Esse documento foi instituído pelo Ministério da Saúde em 1990, e tem obrigatoriedade de emissão para todos os nascidos vivos, independente de como o parto tenha ocorrido.

As tarefas de aprendizado descritivo, ou não supervisionado, se referem a identificação de informações relevantes nos dados sem a presença de um elemento externo para guiar o aprendizado. Essas tarefas podem ser divididas em sumarização e associação. A sumarização tem por objetivo encontrar uma descrição simples e compacta dos dados e a associação faz a busca por padrões de associações entre os atributos, de acordo com sua similaridade ou ocorrência. A base da técnica de associação é a busca por itens que se correlacionam na base de dados, sejam por ocorrerem de forma frequente e conjunta ou não. Dessa forma forma o foco é encontrar produtos com uma relação já consolidada ou uma tendência do tipo X (antecedente) → Y (consequente).

O registro dessas informações muitas vezes é dificultado pela quantidade de pessoas trabalhando no hospital, bem como por fluxos inadequados, dessa forma é recomendado que somente uma pessoa faça o preenchimento do formulário, e próximo da data de alta da genitora. Essa informação posteriormente é acrescentada no banco de dados da SINASC. Figura 3: Fluxo para os nascimentos hospitalares (REFERENCIA, ANO). O CID-10 trata a respeito das “Malformações congênitas, deformidades e anomalias cromossômicas” e possui os seguintes agrupamentos, apresentados de acordo com o grau de extensão, frequência e complexidade com que ocorrem: Q00-Q07 Malformações congênitas do sistema nervoso Q10-Q18 Malformações congênitas do olho, do ouvido, da face e do pescoço Q20-Q28 Malformações congênitas do aparelho circulatório Q30-Q34 Malformações congênitas do aparelho respiratório Q35-Q37 Fenda labial e fenda palatina Q38-Q45 Outras malformações congênitas do aparelho digestivo Q50-Q56 Malformações congênitas dos órgãos genitais Q60-Q64 Malformações congênitas do aparelho urinário Q65-Q79 Malformações e deformidades congênitas do sistema osteomuscular Q80-Q89 Outras malformações congênitas Q90-Q99 Anomalias cromossômicas não classificadas em outra parte Relacionado a malformação, abaixo apresentamos as principais definições a respeito, sendo que os defeitos podem ocorrer de forma isolada ou em conjunto: • Malformação - Defeito morfológico de um órgão, parte de um órgão ou região maior do corpo resultante de um processo de desenvolvimento intrinsecamente anormal.

• Disrupção - É um defeito morfológico de um órgão, parte de um órgão, ou uma região maior do corpo resultante do desarranjo de um processo de desenvolvimento originalmente normal ou de uma interferência sobre ele. Quanto as formas de visualização desses dados, podemos citar principalmente a forma de grafos e agrupamento. A forma de grafo nos permite o acompanhamento e comportamento de uma determinada informação, tal como demonstrado na Figura 4, onde são apresentados grafos de evolução de 3 assuntos diferentes, sendo da esquerda para a direita: difusão a respeito do tema de terremotos, tornado e do lançamento de um novo jogo para videogame. Figura 4: Rede de difusão para 3 assuntos diferentes (Sakaki et al. A visualização em forma de agrupamento pode ser visualizada na Figura 5, esse tipo de demonstração tem por objetivo a separação dos dados em conjuntos similares e também pode demonstrar a similaridade entre os conjuntos de acordo com sua proximidade.

Figura 5: Demonstração dos dados no formato de agrupamento (Shamma et al. Segundo os autores a ferramenta utilizada antigamente para a extração de dados pela empresa encontrava-se descentralizada e apresentava um grau de detalhamento limitado, visto que a mesma não possuía uma tecnologia de associação de dados, dessa forma muitos dos relatórios eram simples e feitos em planilhas dinâmicas apenas para atender necessidades pontuais. Como muitas vezes os dados vinham de locais distintos não havia grande confiança nos mesmos. Apesar do banco de dados ser bem completo, as informações eram dispersas e muitas vezes, para cruzar os dados era necessário que as atualizações fossem feitas manualmente, dessa forma, existia uma grande dificuldade na emissão dos indicadores mensais e semanais, pois a atualização demandava um grande tempo e esforço, sendo uma tarefa lenta que precisava ser repetida a cada emissão de novo relatório.

Na Figura 6 temos um exemplo de como se apresentavam os indicadores antigos. Figura 6: Exemplo de como se apresentavam os indicadores antigos (Melo e Pelissari, 2016). Um exemplo da complexidade da junção das informações relacionadas a saúde pode ser, por exemplo: informações de farmácias quanto as vendas de remédios, informações de acidentes de trânsito, informações de hospitais e UTI’s, informações de bombeiros e atendimentos de primeiros socorros, informações vindas de planos de saúde, informações de atendimentos particulares (médicos, dentistas, fisioterapeutas, entre outros), informações de postos de saúde, informações referentes a vacinas, entre outros. E quanto mais serviços disponibilizam informações em tempo real, ou utilizam sistemas integrados, maior o poder de decisão, como por exemplo: prever uma epidemia de acordo com remédios que estão sendo consumidos na farmácia, prever a falta de algum medicamento, monitoramento da eficiência dos serviços, análise preditiva, entre outros.

Nogueira et al. também relata o elevado custo para manutenção da saúde pública e o uso dos dashboards podem auxiliar na contenção dos custos, no envio da quantidade correta de profissionais para cada posto e no desenvolvimento de novos produtos, tais como vacinas e outros remédios. Nas figuras 8 e 9 são apresentados 2 dashboards da área da saúde, o primeiro o UK NHS, que une informações sobre monitoramento e episódios de urgência tal como a quantidade de pacientes e infecções, e também o tempo para apresentar os dados. O trabalho de Paul e Dredze (2011) tem por objetivo avaliar a saúde pública de uma população ou comunidade de acordo com suas postagens na rede social Twitter. Um exemplo dessa metologia seria a avaliação de tweets de usuários reclamando de problemas de saúde como dor de cabeça, gripes, alergias, entre outros.

Para realizar o experimento os autores coletaram 2 bilhões de tweets entre Maio de 2009 e Outubro de 2010, o qual submeteram ao processo de pré-processamento com objetivo de eliminar mensagens com links, pontuação e hashtags. O experimento foi então realizado com o classificador SVM, utilizando 5. mensagens catalogadas para treinamento, e como resultado final, obtiveram que é possível ter uma ideia de como está a saúde da população de acordo com a obtenção de dados de uma rede social. Shouman et al. utilizaram o KNN para classificar e analisar paciente que sofrem de doenças do coração. Desenvolvimento de Framework McGregor et al. com o desenvolvimento do framework CRISP-DM para cuidados clínicos de pacientes Weka com análise de classificadores que utilizam o método de validação cruzada.

Potter (2007) utilizou o Weka para fazer experimentos de performance com uma base de dados de tratamento de câncer. Patil et al. é utilizar o método de associação juntamente com o algoritmo Apriori para criar regras de classificação para pacientes que sofrem de diabetes do tipo 2. Tabela 1: Resumo de algumas pesquisas na área da saúde com o método utilizado (do Autor). Por fim, o trabalho de Tomar e Agarwal (2013) resume diversas publicações de acordo com o ano, o método utilizado e a acurácia no resultado obtida com o uso do método. O resumo de sua pesquisa pode ser visualizado no Quadro 4. A base de dados contém 65. dados, de 1996 até 2016, com mais de 100 atributos. O primeiro passo a ser realizado com a base de dados consiste na procura de ruídos e padronização de dados, dessa forma registros duplicados serão removidos, bem como registros com muitas informações incompletas.

Os dados restantes serão submetidos a ferramenta Weka com o método de associação com o uso do algoritmo Apriori, de forma a se criar regras de associação. Vários testes serão realizados de forma a se encontrar as regras com maior acurácia. A Evolução do Processo Decisório. Encontro Nacional de Engenharia de Produção. CARROL LN, Au AP, Detwiler LT, Fu T, Painter IS, et al.  Ferramentas de visualização e análise para epidemiologia de doenças infecciosas: uma revisão sistemática.  J Biomed Inform . Saúde Pública, Rio de Janeiro , v. n. p. May 2006. FEI, S.   e3080. Disponível em <http://www. scielo. br/scielo. php?script=sci_arttext&pid=S0104-11692018000100380&lng=en&nrm=iso>. A Diagnostic Software tool for Skin Diseases with Basic and Weighted K-NN, Innovations in Intelligent Systems and Applications (INISTA).

HUANG, C. L. LIAO, H. C. br/ci%C3%Aancia-de-dados-aplicada-%C3%A0-sa%C3%Bade>. Acessado em 10 de abril de 2020. LIU, H. G. Mining social media: A brief introduction. CHRISTINA, C. ANDREW, J. A process mining driven framework for clinical guideline improvement in critical care. Learning from Medical Data Streams 13th Conference on Artificial Intelligence in Medicine (LEMEDS). org, vol. MOON, S. S. KANG, S. Y. JIPITAKLERT, W. CHEN Y. P. Association rule mining to detect factors which contribute to heart disease in males and females. Expert Systems with Applications, vol. pp. Association rule for classification of type -2 diabetic patients. Second International Conference on Machine Learning and Computing. PAUL, Michael J & DREDZE, Mark. You Are What You Tweet: Analyzing Twitter for Public Health. Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media, 2011.

PORTAL IBC. Disponivel em <https://www. ibccoaching. com. br/portal/entenda-como-funciona-piramide-do-conhecimento-e-seus-quatro-componentes/>. RODRIGUES FILHO, José e GOMES, Natanael Pereira. Tecnologia da Informação no Governo Federal. RAP. SAKAKI, Takeshi & OKAZAKI, Makoto & MATSUO, Yutaka. Earthquake Shakes Twitter Users: Real-Time Event Detection By Social Sensors. WSM '09 Proceedings of the first SIGMM workshop on Social media. SHOUMAN, M. TURNER, T. R. Stocker. com. br/data-visualization-analytics/>. Acessado em 09 de abril de 2020. TOMAR, Divya e AGARWAL, Sonali. A survey on Data Mining approaches for Healthcare. WENER, W. Werner, I. A. Gestão do conhecimento: Ferramentas tecnológicas e portais do Conhecimento para empresas Desenvolvedoras de tecnologias de médio e pequeno portes. Revista Terra Viva.

499 R$ para obter acesso e baixar trabalho pronto

Apenas no StudyBank

Modelo original

Para download