APLICAÇÃO DA MINERAÇÃO DE DADOS NA GERAÇÃO DE CONHECIMENTO EM AUDITORIA IMOBILIÁRIA

Tipo de documento:TCC

Área de estudo:Tecnologia da informação

Documento 1

Sc. Patricia Mariotto Mozzaquatro Chicon Cruz Alta – RS, novembro de 2019 Universidade de Cruz Alta – UNICRUZ Centro de Ciências Humanas e Sociais – CCHS Curso de Ciência da Computação APLICAÇÃO DA MINERAÇÃO DE DADOS NA GERAÇÃO DE CONHECIMENTO EM AUDITORIA IMOBILIÁRIA Elaborado por Thiago Pasetto Febras Como requisito parcial para obtenção do Título de Bacharel em Ciência da Computação. Comissão examinadora: Prof. M. Sc. Palavras-chave: Mineração de Dados. Auditoria. Imobiliária. ABSTRACT TITULO DO TRABALHO Nome de autor: Thiago Pasetto Febras Nome do orientador: Patricia Mariotto Mozzaquatro Chicon The audit is used in various sectors such as accounting, vehicular, among others in order to attest something, and may be corporate balance sheets, the quality and integrity of a product, among others.

And it can also be applied in real estate along with risk analysis, so that real estate can, through an audit, check the conditions that were a particular property at its time of lease and delivery, thus checking whether the delivery it took place under the same conditions. Objetivo Geral 12 1. Objetivos específicos 12 1. Justificativa 13 1. Organização do Trabalho 13 2. EMBASAMENTO TEÓRICO 14 2. Também apresentamos na Tabela 1 a proporção de domicílios locados entre 1940 e 2010 por região, onde verificamos um grande crescimento entre os anos de 2000 e 2010. Tabela 1- proporção de domicílios locados entre 1940 e 2010 por região Fonte: (IBGE, 2010). Juntamente a esse crescimento de locações, cresceu também o índice de inadimplência, sendo esse de 41% entre os anos de 2011 e 2012, segundo Gazeta do Povo (2012), para as dívidas dentro do mês, ou seja, o locatário apenas atrasa o pagamento em alguns dias, mas ainda faz o pagamento dentro do mês vigente.

Podemos então ressaltar que como já existe uma incidência em atrasar o pagamento, qualquer imprevisto pode fazer com que o locatário não consiga efetuar o pagamento do mesmo. Temos então, conforme Campos Filho (1994) que as organizações estão utilizando a tecnologia da informação no cotidiano de seu dia a dia e em suas tarefas, como formas de auxiliar nas mais diversas tarefas, e um exemplo que podemos citar é na análise de risco de contratações ou análises de crédito. Essas informações podem ser armazenadas em uma base de dados, para juntamente com outras imobiliárias gerar uma central de conhecimento que pode auxiliar na tomada de decisão do negócio, como por exemplo, cobrar um calção maior de determinados perfis de clientes.

Objetivos As subseções a seguir descrevem os objetivos geral e específicos do trabalho proposto. Objetivo Geral O objetivo geral do trabalho é aplicar a mineração de dados na descoberta de conhecimento em bases de dados de imobiliárias a fim de se minerar o perfil dos usuários com maior probabilidade de não entregar o imóvel conforme o mesmo foi pego, e também em atrasar os pagamentos. Objetivos específicos Para atingir tal objetivo serão construídos os seguintes objetivos específicos: Realizar um estudo sobre: • Descoberta de conhecimento em bases de dados • Mineração de dados • Técnica de clusterização • Algoritmo k-means • Auditoria imobiliária • Aquisição das respectivas bases de dados; • Pesquisa de demais sistemas similares; • Pré-processamento das bases de dados para trabalhar somente com as informações necessárias; • Modelagem das bases • Aplicação de técnica de classificação • Geração dos resultados 1.

Justificativa De forma a fornecer maior segurança para as imobiliárias, como justificativa social, deseja-se realizar uma análise de risco do perfil do locatário antes do mesmo assinar o contrato, dessa forma poderemos verificar se, através de fatores como idade, sexo, renda, escolaridade, quantidade de filhos, entre outros, qual a probabilidade do mesmo em causar problemas. O primeiro nível contempla o gerenciamento de dados; o segundo nível a criação, compartilhamento e gerenciamento de informações; o nível 3 representa a inteligência empresarial oriunda da informação obtida através dos dados, e por fim, o nível 4 apresenta a sabedoria representada pela obtenção do conhecimento. Figura 1: Pirâmide do conhecimento. Fonte: Portal IBC. O processo de descoberta de conhecimento pode ser observado na Figura 2 e começa, inicialmente com uma base de dados bruta, que passa por um processo de pré-processamento e formatação, visando deixar os dados padronizados e também excluir os registros incompletos ou repetidos, após isso é aplicada a técnica deseja, de acordo com o objetivo almejado.

Figura 2- Processo de mineração de dados. Quanto os dados provêm de diferentes bases de dados a tarefa de padronização torna-se ainda mais importante, pois cada organização trabalha com diferentes formatos para cadastro de endereços, datas, entre outros. Formatação: A fase de formatação consiste em formatar as imagens ou o resultado de acordo com o algoritmo que será utilizado. Para um bom resultado, usualmente utilizam-se mais de um algoritmo de forma a comparar os resultados. Mineração de Dados: Segundo Tan et al. a mineração de dados é o processo de descoberta automática de conhecimento em grandes repositórios de dados (big data), e segundo Liu (2012) é parte integral do processo de descoberta de conhecimento (KDD) que tem por objetivo converter dados brutos em informações úteis, que podem ou não conter conhecimento.

O agrupamento hierárquico é um conjunto de grupos aninhados organizado como uma árvore hierárquica, tal como demonstrado na Figura 4. Esse tipo de agrupamento cria uma hierarquia entre os elementos e são muito utilizados na área de bioinformática. Figura 4: Exemplo de agrupamento hierárquico. Fonte: Nievola, 2017. Já os agrupamentos baseados em densidade são utilizados geralmente quando os grupos são irregulares ou entrelaçados, ou quando existe uma grande quantidade de ruídos e pontos externos, tal como descrito por Nievola (2017). esses pontos são considerados como centros dos agrupamentos (ou suas médias); 3. cada instância textual é usada como entrada: será associada ao agrupamento com o centro mais próximo; 4. o valor da média do agrupamento mais próximo é atualizada para ser considerada este novo elemento do agrupamento; 5.

os passos (3) e (4) são repetidos até que não ocorram mais mudanças de rotulação nas instâncias. Figura 5: Funcionamento k-means a cada iteração. De acordo com Weka (2019), o software também fornece recursos para uso de análise computacional e estatística de dados fornecidos. Um exemplo de seu funcionamento e criação de uma árvore de decisão é apresentado na Figura 6. O software desenvolvido em Java, oferece suporte para multi-plataformas e atualmente está na versão 3. Figura 6: Exemplo weka com árvore de decisão. Fonte: Weka (2019). Na metodologia proposta, a cidade é subdivida em seções de grade, onde as grades que estiverem vazias significa que não existe ocorrências na região, geralmente são regiões mais afastadas do centro, com pouco ou nenhuma presença de pessoas.

Também existem as seções quentes, compostas por um grande número de ocorrências, e as seções em aquecimento, onde as ocorrências vem aumentando. A metodologia também engloba a relação entre o tempo, onde os crimes são divididos em meses e é estudada essa relação entre eles, pois as ocorrências de um mês podem influenciar o mês subsequente e assim por diante. A fim de se escolher o melhor resultado, foram comparados os resultados dos seguintes algoritmos de classificação: Um Vizinho Mais Próximo (One Nearest Neighbor), Árvores de Decisão J48, Support Vector Machine (SVM), Redes Neurais com múltiplas camadas e Redes Bayesianas. Na maior parte dos testes as redes neurais e as redes bayesianas apresentaram um melhor resultado, quanto a previsão de ocorrências, é realizado uma votação entre os classificadores verificando se algum dos locais será considerado como quente.

O principal algoritmo utilizado para as árvores de decisão foi o ID3, e também o SLIQ e o SPRINT, através da ferramenta Thérèse. Quanto a auditoria imobiliária, boa parte das pesquisas tem por foco à aŕea contábil das auditórias, avaliando os balanços das imobiliárias bem como os valores das construções de uma forma geral. Dessa forma temos que o foco da auditoria é verificar se os dados apresentados estão corretos, sendo essa a contribuição para a pesquisa, ou seja, o objetivo de uma auditoria, sendo ela do tipo que for. Um exemplo desses trabalhos é o de Kamphorst (2015), onde a autora aplicada a auditoria a incorporação imobiliária de forma a atender as normas societárias e fiscais, onde, através de fluxogramas e acompanhamento de uma obra por etapas, ela demonstra o momento ideal para a fase de apropriação de custos.

procedimentos metodológicos A pesquisa classifica-se como: • Natureza: Pesquisa Aplicada, onde de acordo com Roll-Hansen (2009) é um método que envolve a aplicação prática da ciência, utilizando-se de teorias, métodos e técnicas. com/blog/2017/09/understaing-support-vector-machine-example-code/>. Acessado em 18 de junho de 2019. BECKER, Hila & NAAMAN, Mor & GRAVANO, Luis. Beyond Trending Topics: Real-World Event Identification on Twitter. Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media. J. Algorithms and applications for approximate nonnegative matrix factorization. Computacional Statistics Data Analysis 52. BREIMAN,L. FRIEDMAN,J. n. p. CAUDILL, M. Neural networks primer, part i. AI expert. abril. com. br/economia/total-de-domicilios-alugados-no-brasil-cresce-53-em-dois-anos/>. Acessado em 4 de setembro de 2019. FELLDMANN, Advogados. S. Metodologia da pesquisa científica. Fortaleza: UEC, 2002. GAZETA DO POVO. Aumenta o calote de poucos dias no aluguel. Domícios permanentemente alugados.

Disponível em <https://sidra. ibge. gov. br/tabela/3524>. K-Means Clustering – What it is and How it Works. Disponível em <http://www. learnbymarketing. com/methods/k-means-clustering/>. Acessado em 06 de maio de 2019. Informs. KAMPHORST, Tânia. Contabilidade aplicada à incorporação imobiliária. Monografia apresentada ao curso de ciências contábeis, Univantes, 2015. NIEVOLA, Júlio Cesar. PORTAL DE AUDITORIA. Conceito e a importância da auditoria interna. Disponível em <http://www. portaldeauditoria. com. R. Induction of decision trees. Machine Learning, 1(1):81-106. REZENDE, Yara. A falsa utilidade da biblioteca de empresa. br/blog/o-que-e-pesquisa-qualitativa/>. Acessado em 24 de novembro de 2019. SAPIRO, Arão. Inteligência empresarial: a revolução informacional da ação competitiva. Revista de Administração de Empresas, São Paulo, v. Florianópolis: Universidade Federal de Santa Catarina - UFSC, 2005. Disponível em <https://projetos.

inf. ufsc. br/arquivos/Metodologia_de_pesquisa_e_elaboracao_de_te ses_e_dissertacoes_4ed. Editora Ciência Moderna Ltda. Rio de Janeiro. TURBAN, Efraim; Sharda, Ramesh; Dellen, Dursen. Decision Support and Business Inteligence Systems. ed. W. MORABITO, M. DING, W. Crime forecasting using data mining techniques. Preceedings of the IEEE International Conference on Data Mining Workshops. Von & ATTUX, Romis R. F. DCA/FEEC/Unicamp. IA004. Tópico 7.

454 R$ para obter acesso e baixar trabalho pronto

Apenas no StudyBank

Modelo original

Para download