Página 75 - A&D_v23_n3_2011

Versão HTML básica

Gabriel Teixeira Ervilha, Frederick Fagundes Alves, Adriano Provezano Gomes
Bahia anál. dados, Salvador, v. 23, n. 3, p.553-566, jul./set. 2013
559
Detecção de
outliers
Dada a alta sensibilidade da análise envoltória
de dados à presença de
outliers
e erros de amos-
tra, é de grande importância a utilização de métodos
para sua detecção. No presente trabalho, utilizou-
-se a metodologia desenvolvida por Sousa e Stosic
(2003). Os autores conceberam uma combinação de
dois métodos de reamostragem, de modo a proceder
com uma análise de
outliers
específica para métodos
DEA. A partir dos métodos
jackknife
(determinístico)
e
bootstrap
(estocástico), os autores deram origem
ao procedimento denominado
jackstrap
. Em um pri-
meiro momento, o
jackknife
é utilizado por meio de
um algoritmo que mensura a influência de cada DMU
no cálculo das eficiências, removendo isoladamen-
te cada unidade da amostra para que as eficiências
sejam então calculadas sem sua presença. Poste-
riormente, é utilizado o método
bootstrap
de reamos-
tragem estocástica, levando-se em consideração a
informação das influências obtidas pelo
jackknife
.
O estimador obtido desta maneira é denomina-
do
leverage
e possibilita uma análise automática
da amostra, dispensando uma análise manual que,
além de imprecisa, se torna inviável à medida que a
amostra aumenta. Formalmente, o
leverage
de Sou-
sa-Stosic pode ser definido como o desvio padrão
das medidas de eficiência antes e depois da remo-
ção de cada DMU do conjunto amostral. Assim, o
leverage
da
j
-ésima DMU pode ser definido como:
(4)
em que o índice
k
representa as DMU, varian-
do de 1 até
K
;
o índice
j
representa a DMU re-
movida, e
θ
são os indicadores de eficiência. As-
sim
representa o conjunto de
eficiências originais sem alteração na amostra, e
representa o conjunto
de eficiências recalculado após a remoção indivi-
dual de cada DMU.
Presume-se que as DMU caracterizadas como
outliers
possuam um
leverage
consideravelmente
acima da média global. Desta maneira, caso es-
teja muito acima dessa média, há a suspeita de que
a DMU em questão seja um
outlier
. Quando a DMU
j
está localizada dentro da fronteira eficiente, ocorre
que
e, então,
, o que significa
que a observação em questão não é influente. Por
sua vez, no caso crítico de uma DMU cuja influ-
ência seja extrema, sua remoção faz com que as
unidades remanescentes apresentem um valor de
eficiência igual a 1, isto é,
, e então
. Assim, o índice de
leverage
en-
contra-se dentro do intervalo [0,1].
Com a informação dada pelo
leverage
é pos-
sível assim identificar e eliminar observações
ou-
tliers
. Para tanto, é necessário utilizar um critério
específico relacionado ao desvio do índice em re-
lação à sua média global. Sousa e Stosic (2005)
sugerem um múltiplo da média global,
,
em que representa a média global do
leverage
e
c
é uma constante que assume valor de 2 ou
3 de modo geral, ou, alternativamente, adota-se
como critério de corte. Desta forma,
DMU com um
leverage
acima desse valor seriam
caracterizadas como
outliers
e, então, removidas
da amostra.
Construção do índice de eficiência
A partir dos indicadores de eficiência obtidos e
do Índice de Gini de cada município, será construí-
do um indicador de eficiência com base no cálculo
do IFDM. Tal componente consistirá numa média
geométrica dada por:
(5)
em que
Es
é o indicador da eficiência com os
gastos em saúde;
Ee
consiste na eficiência com os
gastos em educação;
G
corresponde ao Índice de
Gini, e
EF
é o índice de eficiência média resultante
do cálculo.