DSpace at My University FC - Faculdade de Ciências FC - Matemática
Use este identificador para citar ou linkar para este item: http://monografias.uem.mz/handle/123456789/1455
Tipo: Trabalho de Conclusão de Curso
Título: Tratamento de dados com Outliers: uma aplicação à análise de Regressão
Autor(es): Cumbi, Eurico Fernandes José
Primeiro Orientador: Mulenga, Alberto
Resumo: Na análise de dados é frequente encontrar observações com características diferentes das demais e que parecem não pertencer ao padrão de variabilidade formado por outras observações, estas são chamadas de Outliers. A presença de outliers provoca distorção das estimativas tais como a média, o desvio padrão, etc. Por isso é importante detecta-los e procurar formas de corrigir ou minimizar os efeitos provocados pela sua presença na amostra. Assim, no presente trabalho pretende-se estimar modelos de regressão linear cujos dados amostrais possuem outliers. Para tal usou-se a base de dados TEMPENTREGA e estimou-se um modelo de regressão usando o método dos Mínimos Quadrados Ordinários (MQO), em seguida, para detectar a presença de outliers usou-se os resíduos estudantizados e os valores da diagonal principal da matriz de projecção e para avaliar se os outliers encontrados são ou não influentes no modelo de regressão usaram-se as medidas de influência da Distância de Cook, o SDFFITS e o SDFBETA, com os quais detectou-se duas observações como outliers influentes. Para minimizar o efeito das observações outliers usou-se dois métodos: o método da regressão robusta dos Mínimos Quadrados Aparados (MQA) e o método dos MQO sem as observações outliers. Do estudo concluiu-se que os modelos de regressão dados pelos métodos dos MQA e MQO sem as observações outliers eram os melhores para fazer previsões pois apresentavam melhores estimativas. Palavras-chave: Outliers, Resíduos, Medidas de influência, Modelo de regressão.
Abstract: In data analysis, it is common to find observations with characteristics different from the others and that do not seem to belong to the variability pattern formed by other observations, these are called Outliers. The presence of outliers distorts estimates such as the mean, standard deviation, etc. Therefore, it is important to detect them and look for ways to correct or minimize the effects caused by their presence in the sample. Thus, in the present work we intend to estimate linear regression models whose sample data have outliers. For this, the TEMPENTREGA database was used and a regression model was estimated using the Ordinary Least Squares (OEM) method, then, to detect the presence of outliers, the studentized residuals and the values ​​of the main diagonal were used. of the projection matrix and to assess whether the outliers found are or not influential in the regression model, the measures of influence of Cook's Distance, the SDFFITS and the SDFBETA were used, with which two observations were detected as influential outliers. To minimize the effect of outliers observations, two methods were used: the Robust Trimmed Least Squares (MQA) regression method and the OLS method without outliers observations. From the study it was concluded that the regression models given by the MQA and OLS methods without the outliers observations were the best for making predictions because they presented better estimates. Keywords: Outliers, Residues, Measures of influence, Regression model. ( Tradução Nossa )
Palavras-chave: Outliers
Resíduo
Medidas de influência
Modelo de regressão
CNPq: Ciências Exactas e da Terra
Matemática
Idioma: por
País: Moçambique
Editor: Universidade Eduardo Mondlane
Sigla da Instituição: UEM
metadata.dc.publisher.department: Faculdade de Ciências
Departamento de Matemática
Tipo de Acesso: Acesso Aberto
URI: http://monografias.uem.mz/handle/123456789/1455
Data do documento: 14-Fev-2010
Aparece nas coleções:FC - Matemática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2010 - Cumbi, Eurico Fernandes José.pdf.pdf666.8 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.