Use este identificador para citar ou linkar para este item:
http://monografias.uem.mz/handle/123456789/1455
Tipo: | Trabalho de Conclusão de Curso |
Título: | Tratamento de dados com Outliers: uma aplicação à análise de Regressão |
Autor(es): | Cumbi, Eurico Fernandes José |
Primeiro Orientador: | Mulenga, Alberto |
Resumo: | Na análise de dados é frequente encontrar observações com características diferentes das demais e que parecem não pertencer ao padrão de variabilidade formado por outras observações, estas são chamadas de Outliers. A presença de outliers provoca distorção das estimativas tais como a média, o desvio padrão, etc. Por isso é importante detecta-los e procurar formas de corrigir ou minimizar os efeitos provocados pela sua presença na amostra. Assim, no presente trabalho pretende-se estimar modelos de regressão linear cujos dados amostrais possuem outliers. Para tal usou-se a base de dados TEMPENTREGA e estimou-se um modelo de regressão usando o método dos Mínimos Quadrados Ordinários (MQO), em seguida, para detectar a presença de outliers usou-se os resíduos estudantizados e os valores da diagonal principal da matriz de projecção e para avaliar se os outliers encontrados são ou não influentes no modelo de regressão usaram-se as medidas de influência da Distância de Cook, o SDFFITS e o SDFBETA, com os quais detectou-se duas observações como outliers influentes. Para minimizar o efeito das observações outliers usou-se dois métodos: o método da regressão robusta dos Mínimos Quadrados Aparados (MQA) e o método dos MQO sem as observações outliers. Do estudo concluiu-se que os modelos de regressão dados pelos métodos dos MQA e MQO sem as observações outliers eram os melhores para fazer previsões pois apresentavam melhores estimativas. Palavras-chave: Outliers, Resíduos, Medidas de influência, Modelo de regressão. |
Abstract: | In data analysis, it is common to find observations with characteristics different from the others and that do not seem to belong to the variability pattern formed by other observations, these are called Outliers. The presence of outliers distorts estimates such as the mean, standard deviation, etc. Therefore, it is important to detect them and look for ways to correct or minimize the effects caused by their presence in the sample. Thus, in the present work we intend to estimate linear regression models whose sample data have outliers. For this, the TEMPENTREGA database was used and a regression model was estimated using the Ordinary Least Squares (OEM) method, then, to detect the presence of outliers, the studentized residuals and the values of the main diagonal were used. of the projection matrix and to assess whether the outliers found are or not influential in the regression model, the measures of influence of Cook's Distance, the SDFFITS and the SDFBETA were used, with which two observations were detected as influential outliers. To minimize the effect of outliers observations, two methods were used: the Robust Trimmed Least Squares (MQA) regression method and the OLS method without outliers observations. From the study it was concluded that the regression models given by the MQA and OLS methods without the outliers observations were the best for making predictions because they presented better estimates. Keywords: Outliers, Residues, Measures of influence, Regression model. ( Tradução Nossa ) |
Palavras-chave: | Outliers Resíduo Medidas de influência Modelo de regressão |
CNPq: | Ciências Exactas e da Terra Matemática |
Idioma: | por |
País: | Moçambique |
Editor: | Universidade Eduardo Mondlane |
Sigla da Instituição: | UEM |
metadata.dc.publisher.department: | Faculdade de Ciências Departamento de Matemática |
Tipo de Acesso: | Acesso Aberto |
URI: | http://monografias.uem.mz/handle/123456789/1455 |
Data do documento: | 14-Fev-2010 |
Aparece nas coleções: | FC - Matemática |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2010 - Cumbi, Eurico Fernandes José.pdf.pdf | 666.8 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.