Análise de componentes principais
Bryan J. F. Manly
A técnica de análise de componentes principais foi inicialmente descrita por Karl Pearson (1901). Ele aparentemente acreditou que era a solução correta para alguns dos problemas de interesse para biométricos naquele tempo, apesar de ter proposto um método prático para duas ou três variáveis apenas. Uma descrição de métodos computacionais práticos veio muito mais tarde, [graças a] Hotelling (1933). Mesmo então, os cálculos eram extremamente amedrontadores para mais do que poucas variáveis [pois] tinham [de] ser feitos à mão. Somente após os computadores eletrônicos terem se tornado [ordinariamente] disponíveis é que a técnica de componentes principais alcançou amplo uso.
Análise de componentes principais é um dos métodos multivariados mais simples. O objetivo da análise é tomar p variáveis X1, X2 ..., Xp e encontrar combinações destas para produzir índices Z1, Z2 ..., Zp que sejam não correlacionados na ordem de sua importância e que descrevam a variação nos dados. A falta de correlação significa que os índices estão medindo diferentes ‘dimensões’ dos dados, e a ordem é tal que Var (Z1) ≥ Var (Z2) ≥ ... ≥ Var (Zp), em que Var (Zi) denota a variância de Zi. Os índices Z são então os componentes principais. Ao fazer uma análise de componentes principais, há sempre a esperança de que as variâncias da maioria dos índices serão tão baixas a ponto de serem desprezíveis. Neste caso, a maior parte da variação no conjunto de dados completos pode ser descrita adequadamente pelas poucas variáveis Z com variâncias que não são desprezíveis, e algum grau de economia é então alcançado.
A técnica de análise de componentes principais foi inicialmente descrita por Karl Pearson (1901). Ele aparentemente acreditou que era a solução correta para alguns dos problemas de interesse para biométricos naquele tempo, apesar de ter proposto um método prático para duas ou três variáveis apenas. Uma descrição de métodos computacionais práticos veio muito mais tarde, [graças a] Hotelling (1933). Mesmo então, os cálculos eram extremamente amedrontadores para mais do que poucas variáveis [pois] tinham [de] ser feitos à mão. Somente após os computadores eletrônicos terem se tornado [ordinariamente] disponíveis é que a técnica de componentes principais alcançou amplo uso.
Análise de componentes principais é um dos métodos multivariados mais simples. O objetivo da análise é tomar p variáveis X1, X2 ..., Xp e encontrar combinações destas para produzir índices Z1, Z2 ..., Zp que sejam não correlacionados na ordem de sua importância e que descrevam a variação nos dados. A falta de correlação significa que os índices estão medindo diferentes ‘dimensões’ dos dados, e a ordem é tal que Var (Z1) ≥ Var (Z2) ≥ ... ≥ Var (Zp), em que Var (Zi) denota a variância de Zi. Os índices Z são então os componentes principais. Ao fazer uma análise de componentes principais, há sempre a esperança de que as variâncias da maioria dos índices serão tão baixas a ponto de serem desprezíveis. Neste caso, a maior parte da variação no conjunto de dados completos pode ser descrita adequadamente pelas poucas variáveis Z com variâncias que não são desprezíveis, e algum grau de economia é então alcançado.
[...]
Fonte: Manly, B. J. F.
2008. Métodos estatísticos multivariados,
3ª edição. Porto Alegre, Bookman.
0 Comentários:
Postar um comentário
<< Home