2. 1
CARACTERIZACION DE ALGORITMOS PARA UN
SISTEMA DE COMPROBACION Y SELECCIÓN FISCAL.
Propuesta realizada por:
MSc. Marcial STAGG.
Gerencia regional de Tributos Internos – Región Zuliana
Lic. Gabriel Rodriguez.
Gerencia General de Fiscalización.
Octubre 2009
3. 2
Algoritmos de Comprobación y Selección
Ficha 1
Algoritmo T1,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio AX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de los indicadores de selección.
Cálculo de AX:
Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador AX se describe mediante la
fórmula:
( )
),(
),(
1
),(
),(),(
),(
kjVN
kjCN
kjVN
kjCNkjVN
kjAX −=
−
=
Donde
AX(j,k): Valor Agregado (VA) generado por el contribuyente con Rif K, como proporción de sus
Ventas Netas anuales, al final del periodo fiscal j
VN(j,k)= ventas netas del año j del contribuyente con Rif k
CN(j,k)= compras netas del año j del contribuyente con Rif k
∑=
=
12
1
),,(47),(
i
kjiITEMkjVN
CN(j,k)= ∑=
12
1
),,(32
i
kjiITEM + ∑=
12
1
),,(322
i
kjiITEM + ∑=
12
1
),,(323
i
kjiITEM + ∑=
12
1
),,(34
i
kjiITEM +
+∑=
12
1
),,(342
i
kjiITEM ∑=
12
1
),,(343
i
kjiITEM
4. 3
−
= ∑=
12
1
),,(47),(
i
kjiITEMkjAX
∑∑∑ ∑ ∑ ∑ === = = =
+++++
12
1
12
1
12
1
12
1
12
1
12
1
),,(47),,(343),,(342),,(34),,(323),,(322),,(32
iii i i i
kjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjiITEM
∑
∑ ∑ ∑ ∑ ∑ ∑
=
= = = = = =
+++++
−= 12
1
12
1
12
1
12
1
12
1
12
1
12
1
),,(47
),,(343),,(342),,(34),,(323),,(322),,(32
1
i
i i i i i i
kjiITEM
kjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjiITEM
Algoritmo de la distribución muestral de AX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que ݔ < 3ܵ ∪ ݔ > 3ܵ , para toda x
que pertenece al conjunto C.
Para ello, primero se calcula la Media Aritmética de la muestra, mediante ܺത =
∑ ௫
భ
donde ܺത
representa la media muestral de los datos. xi representa a cada observación del indicador AX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando ܵ = ට
∑ (௫ିത)మ
భ
ିଵ
donde S es la Desviación estándar de la muestra
y ∑ (ݔ − ܺത)ଶ
ଵ representa la suma cuadrática de las diferencias de los valores individuales de x
con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la ܺത en ambos sentidos para obtener
los pasos a partir de la media ܺത ± ܵ donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > ܺത + 3ܵ ó xi < ܺത − 3ܵ
5. 4
Descripción Formal:
Función selec_AX
// C es un conjunto no vacío de razones AX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z //
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܣሿ ← ݔ
Devolver ሾܺܣሿ
Fin
6. 5
Diagrama de Flujo AX.
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
8. 7
ሾܺܣሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [AX]
2
Fin
Si
No
9. 8
Ficha 2
Algoritmo T2,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio BX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de BX.
Cálculo de BX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador BX se describe mediante la
fórmula:
( )
),(
),(),(
),(
kjVN
kjCEkjVE
kjBX
−
=
BX(j,k)= Expresa la proporción de las Ventas Exentas Netas sobre las Ventas Netas Totales en el
año j del contribuyente con Rif k.
VE(j,k)= Ventas Exentas del año j del contribuyente con Rif k.
CE(j,k)= Compras exentas del año j del contribuyente con Rif k.
∑=
=
12
1
),,(40),(
i
kjiITEMkjVE ∑=
=
12
1
),,(46),(
i
kjiITEMkjVN
∑=
=
12
1
),,(30),(
i
kjiITEMkjCE
∑
∑ ∑
=
= =
−
= 12
1
12
1
12
1
),,(46
),,(30),,(40
),(
i
i i
kjiITEM
kjiITEMkjiITEM
kjBX
10. 9
Algoritmo de la distribución muestral de BX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que ݔ < 3ܵ ∪ ݔ > 3ܵ , para toda x
que pertenece al conjunto C.
Para ello, primero se calcula la Media Aritmética de la muestra, mediante ܺത =
∑ ௫
భ
donde ܺത
representa la media muestral de los datos. xi representa a cada observación del indicador BX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando ܵ = ට
∑ (௫ିത)మ
భ
ିଵ
, donde S es la Desviación estándar de la
muestra y ∑ (ݔ − ܺത)ଶ
ଵ representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la ܺത en ambos sentidos para obtener
los pasos a partir de la media ܺത ± ܵ donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > ܺത + 3ܵ ó xi < ܺത − 3ܵ
11. 10
Descripción Formal:
Función selec_BX
// C es un conjunto no vacío de razones BX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector Z //
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܤሿ ← ݔ
Devolver ሾܺܤሿ
Fin
12. 11
Diagrama de Flujo BX
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
14. 13
ሾܺܤሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [BX]
2
Fin
Si
No
15. 14
Ficha 3
Algoritmo T3,para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio CX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de CX.
Cálculo de CX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador CX se describe mediante la
fórmula:
( )
),(
),(),(),(
),(
kjVN
kjSCFPPkjSCFPAkjIP
kjCX
−+
=
CX(j,k)= Representa el Impuesto Pagado como proporción del las Ventas Netas anuales,
considerando el saldo neto de Créditos Fiscales del año j del contribuyente con Rif k..
IP(j,k)= Impuesto pagado en el año j del contribuyente con Rif k.
SCFPA(j,k)=Saldo de créditos fiscales del año anterior al año j del contribuyente con Rif k.
SCFPP(j,k)= Saldo de créditos fiscales del año posterior al año j del contribuyente con Rif K.
∑ ∑ ∑∑ ∑ ∑ = = == = =
+++++=
12
1
12
1
12
1
12
1
12
1
12
1
),,(90),,(58),,(55),,(24),,(51),,(22),(
i i iI I i
kjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjIP
SCFPA(j,k)= ∑=
12
1
),,(20
i
kjiITEM ∑=
=
12
1
),,(60),(
i
kjiITEMkjSCFPP ∑=
=
12
1
),,(46),(
i
kjiITEMkjVN
16. 15
+
+++++= ∑ ∑ ∑∑ ∑ ∑ = = == = =
12
1
12
1
12
1
12
1
12
1
12
1
),,(90),,(58),,(55),,(24),,(51),,(22),(
i i iI I i
kjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjiITEMkjCX
−
∑
∑∑
=
==
12
1
12
1
12
!
),,(46
),,(60),,(20
i
ii
kjiITEM
kjiITEMkjiITEM
Algoritmo de la distribución muestral de CX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que ݔ < 3ܵ ∪ ݔ > 3ܵ , para toda x
que pertenece al conjunto C.
Para ello, primero se calcula la Media Aritmética de la muestra, mediante ܺത =
∑ ௫
భ
donde ܺത
representa la media muestral de los datos. xi representa a cada observación del indicador CX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando ܵ = ට
∑ (௫ିത)మ
భ
ିଵ
, donde S es la Desviación estándar de la
muestra y ∑ (ݔ − ܺത)ଶ
ଵ representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la ܺത en ambos sentidos para obtener
los pasos a partir de la media ܺത ± ܵ donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > ܺത + 3ܵ ó xi < ܺത − 3ܵ
17. 16
Descripción Formal:
Función selec_CX
// C es un conjunto no vacío de razones CX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector CX//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܥሿ ← ݔ
Devolver ሾܺܥሿ
Fin
18. 17
Diagrama de Flujo CX
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
20. 19
ሾܺܥሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [CX]
2
Fin
Si
No
21. 20
Ficha 4
Algoritmo T4, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio DX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de DX.
Cálculo de DX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario 00030
del IVA en el mes i del año j del contribuyente con Rif k. El indicador DX se describe mediante la
fórmula:
),(
),(
),(
kjVN
kjVX
kjDX =
VX(j,k)=Total de venta de exportación del período j del contribuyente con Rif k.
VN(j,k)=Total de ventas en el período j del contribuyente con Rif k.
DX(j,k)= representa la proporción de Ventas de Exportación con respecto al total de ventas
netas de la empresa en el período j del contribuyente con Rif k.
∑=
=
12
1
),,(41),(
i
kjiITEMkjVX ∑=
=
12
1
),,(46),(
i
kjiITEMkjVN
∑
∑
=
=
= 12
1
12
1
),,(46
),,(41
),(
i
i
kjiITEM
kjiITEM
kjDX
22. 21
Algoritmo de la distribución muestral de DX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que ݔ < 3ܵ ∪ ݔ > 3ܵ , para toda x
que pertenece al conjunto C.
Para ello, primero se calcula la Media Aritmética de la muestra, mediante ܺത =
∑ ௫
భ
donde ܺത
representa la media muestral de los datos. xi representa a cada observación del indicador DX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando ܵ = ට
∑ (௫ିത)మ
భ
ିଵ
, donde S es la Desviación estándar de la
muestra y ∑ (ݔ − ܺത)ଶ
ଵ representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la ܺത en ambos sentidos para obtener
los pasos a partir de la media ܺത ± ܵ donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > ܺത + 3ܵ ó xi < ܺത − 3ܵ
23. 22
Descripción Formal:
Función selec_DX
// C es un conjunto no vacío de razones DX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector DX//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܦሿ ← ݔ
Devolver ሾܺܦሿ
Fin
24. 23
Diagrama de Flujo DX
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
26. 25
ሾܺܦሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [DX]
2
Fin
Si
No
27. 26
Ficha 5
Algoritmo T5, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio EX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de EX.
Cálculo de EX:
Dado el año j, el Contribuyente X, el RIF k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ-
00026 del ISLR del año j del contribuyente con Rif k. El indicador EX se describe mediante la
fórmula:
( )
),(
),(),(
),(
kjIN
kjCVkjIN
kjEX
−
=
IN(j,k)=Ingresos Netos en el año j del contribuyente con Rif k.
CV(j,k)=Costos de Venta del año j del contribuyente con Rif k.
IN(j,k)= ) ]),(710),(709),(708 kjITEMjjITEMkjITEM −+ .
IN(j,k)= ) ]),(710),(709),(708 kjITEMkjITEMkjITEM −+ .
([ ++−++= ),(723),(717),(714),(713),(712),( kjITEMkjITEMkjITEMkjITEMkjITEMkjCV
])),(733),(732),(726),(725),(724 kjITEMkjITEMkjITEMkjITEMkjITEM ++++ .
29. 28
Descripción Formal:
Función selec_EX
// C es un conjunto no vacío de razones EX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector EX//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܧሿ ← ݔ
Devolver ሾܺܧሿ
Fin
30. 29
Diagrama de Flujo EX
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
32. 31
ሾܺܧሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [EX]
2
Fin
Si
No
33. 32
Ficha 6
Algoritmo T6, para realizar la selección de contribuyentes a partir de la distribución muestral del
ratio FX
Problema: Seleccionar una muestra de contribuyentes fiscales a partir del análisis de la
distribución muestral de FX.
Cálculo de FX:
Dado el año j, el Contribuyente X, el Rif k donde el ITEMZ(i,j,k) es el ITEMZ del formulario DPJ-
00026 del ISLR del año j del contribuyente con Rif k. El indicador FX se describe mediante la
fórmula
),(
)),(),((
),(
kjVN
kjISLRCkjISLRP
kjFX
−
=
FX(j,k): Evalúa la tasa efectiva de recaudación del contribuyente con Rif k en el año j. FX(j,k) es
una razón que cuantifica la proporción del Impuesto Sobre la Renta neto pagado en el año j, como
proporción del total de Ingresos por ventas netas de la empresa en el año j del contribuyente con
Rif k. Mide la tasa efectiva de tributación del ISLR del contribuyente con Rif k, en el año j..
ISLRP(j,k)=impuesto sobre la renta pagado en el año j del contribuyente con Rif k.
ISLRC(j,k)=impuesto sobre la renta compensado en el año j del contribuyente con Rif k.
VN(j,k)=ventas netas en el año j del contribuyente con Rif k.
Si 0),(90 >kjITEM entonces:
),(710),(711
),(90),(291),(241
),(
kjITEMkjITEM
kjITEMkjITEMkjITEM
kjFX
−
++
=
Si 0),(90 <=kjITEM entonces:
),(710),(711
),(87*)!(
),(
kjITEMkjITEM
kjITEM
kjFX
−
−
=
34. 33
Algoritmo de la distribución muestral de FX.
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de seleccionar aquellos que se sitúen a más de ±3 desviaciones
estándares con respecto a la media. Sin pérdida de generalidad, se asume que el conjunto de
contribuyentes no será vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, el
subconjunto de selección n, constituido por todas las xi, tal que ݔ < 3ܵ ∪ ݔ > 3ܵ , para toda x
que pertenece al conjunto C.
Para ello, primero se calcula la Media Aritmética de la muestra, mediante ܺത =
∑ ௫
భ
donde ܺത
representa la media muestral de los datos. xi representa a cada observación del indicador FX y n
representa el número de elementos muestreados.
Seguidamente, se calcula la Varianza Muestral y se le saca la raíz cuadrada para obtener la
Desviación Estándar, utilizando ܵ = ට
∑ (௫ିത)మ
భ
ିଵ
, donde S es la Desviación estándar de la
muestra y ∑ (ݔ − ܺത)ଶ
ଵ representa la suma cuadrática de las diferencias de los valores
individuales de x con respecto a la Media Aritmética calculada con anterioridad.
A continuación se suman y se restan los valores de la S de la ܺത en ambos sentidos para obtener
los pasos a partir de la media ܺത ± ܵ donde S = 1,2,3 lo cual permite obtener los límites de
selección en términos de distancias desde la Media Muestral según la siguiente regla de decisión:
Seleccionar xi si xi > ܺത + 3ܵ ó xi < ܺത − 3ܵ
35. 34
Descripción Formal:
Función selec_FX
// C es un conjunto no vacío de razones FX.//
݊ ← ܥ // Se selecciona una muestra correspondiente a un sector económico particular.
// Se calcula la media aritmética de la muestra//
ܺ݅ ← 0 // Ponemos en cero el acumulador X.
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܺ݅ = ܺ݅ +
Si ݅ = ݊ entonces
ܺത =
ܺ݅
݊
Devolver ܺത
// Se calcula la Varianza y Desviación Estándar de la muestra//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
←
(௫ିത)మ
ିଵ
// Se suman los cuadr de las difs de las obs indiv con respecto a la media//
Si ݅ = ݊ entonces
ܵ ← √ܵଶ // Se calcula la raíz cuadrada de la suma de cuadrados se dividida entre n -1 obs.//
// Se calculan los pasos hacia la izq y der de la media y se almacena el valor crítico 3P//
1ܲ = ܺത ± ܵ ; 2ܲ = ܺത ± ܵ ; 3ܲ = ܺത ± ܵ
// Se seleccionan los contribuyentes más atípicos y se almacenan en un vector FX//
Para ݅ ← 1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
Si ݔ > +3ܲ || ݔ < −3ܲ entonces
ሾܺܨሿ ← ݔ
Devolver ሾܺܨሿ
Fin
36. 35
Diagrama de Flujo FX
ܺ݅ = ܺ݅ +
Para ݅ ← 1
¿݅ == ݊?
Almacenar ܺത
݊ ← ܥ
ܺ݅ ← 0
ܺത =
ܺ݅
݊
Para ݅ ←
1 ℎܽܽݐݏ ݊ ℎܽܿ݁ݎ
ܵଶ
← ∑(ݔ − ܺത)
ଶ
;
i++
1
Si
݅ + +
No
38. 37
ሾܺܨሿ ⇔ ݔ݅ < ܺഥ − ܲ || ݔ݅ > ܺഥ + ܲ
Para ݅ ← 0 Asignar:
݅ + +¿ ݏܧ ݅ == ݊?
Devolver [FX]
2
Fin
Si
No
39. 38
Ficha 7
Algoritmo T7, para calcular intervalos de confianza para la media real de los ratios analizados.
Problema: Calcular el intervalo de confianza para la media real de cada uno de los indicadores
analizados.
Planteamiento Formal:
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de calcular el Intervalo de Confianza para la media real ߤ con ߪଶ
desconocida. Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será
vacío y los mismos se enumeran como c1, c2, c3,….., cn
Es decir, dada una muestra de contribuyentes fiscales ܥ = ሼܿ, ܿଵ, … . , ܿሽ se pide encontrar, los
límites del intervalo, ݔҧ − ݐିଵ; ఈ
ௌ
√
≤ ߤ ≤ ݔҧ + ݐିଵ; ఈ
ௌ
√
, donde i representa a los indicadores
(ratios) de selección calculados para diferentes grupos de contribuyentes.
En la construcción del intervalo, se tiene que:
ݔҧ: es la media muestral del j-ésimo ratio.
ݐିଵ; ఈ: es el valor crítico de t que corresponde a un área específica de la cola superior ߙ de la
distribución t de student.
ௌ
√
: Es la desviación estándar muestral dividida entre la raíz cuadrada del tamaño de la muestra.
Como las medias Muestrales y las desviaciones estándares fueron calculadas en base a los
algoritmos T1…T6, sólo resta implementar un procedimiento para calcular ݔҧ ± ݐିଵ; ఈ
ௌ
√
En función de esto, primero se fija un nivel de significación ó error máximo admisible ߙ, el cual
generalmente es del 5%, con lo cual se consigue un nivel de confianza del 95%. Luego se consigue
el valor crítico de t, con n-1 grados de libertad y él ߙ seleccionado en una tabla t de student, cuyo
valor crítico de tabla se multiplica por el cociente obtenido de de la división de la desviación
estándar entre la raíz cuadrada de n.
Seguidamente, se suma el resultado de ݐିଵ; ఈ
ௌ
√
más la media aritmética muestral con lo cual
obtenemos el límite derecho del intervalo representado por: ݔҧ + ݐିଵ; ఈ
ௌ
√
. Para obtener el
límite izquierdo se resta la media muestral menos el resultado de ݐିଵ; ఈ
ௌ
√
, con lo cual se
obtiene: : ݔҧ − ݐିଵ; ఈ
ௌ
√
.
40. 39
Finalmente se ensambla el intervalo con la forma:
ቀݔҧ − ݐିଵ; ఈ
ௌ
√
≤ ߤ ≤ ݔҧ + ݐିଵ; ఈ
ௌ
√
ቁ
Si la media muestral calculada para el j-ésimo ratio cae dentro del intervalo no habrá razones que
permitan negar que dicha media pudiera ser la real. Es decir, con un 95% de confianza podrá
afirmarse que la media real del ratio j estará comprendida entre ݔҧ − ݐିଵ; ఈ
ௌ
√
y ݔҧ + ݐିଵ; ఈ
ௌ
√
.
Descripción Formal:
Función intervalo_media_real
// ࢄഥ es la media muestral de la j-ésima razón de selección. //
ۻ ← ࢄഥ
// S es la desviación estándar de la j-ésima razón de selección//
۾ ← ࡿ
// Se fija ࢻ =0,05 como nivel de significación; es decir 1- ࢻ =95% como nivel de confianza del
intervalo//
ࢻ ← 0,05
//Se consigue el valor crítico de t en la tabla t de student, para n-1 grados de libertad y ࢻ , se
multiplica por el cociente resultante de la división de S entre la raíz cuadrada de n y se almacena
en tc //
ܿݐ ← ݐିଵ; ఈ ∗
ܵ
√݊
// Se obtienen los límites del intervalo sumando y restando tc a la media muestral//
݅ܮ ← ݔҧ − ܿݐ ; ݏܮ ← ݔҧ + ܿݐ
Devolver ሾ,݅ܮ ݏܮሿ
Fin
41. 40
Diagrama de Flujo para la obtención del intervalo de confianza para ࣆ con
࣌
desconocida.
ܿݐ ← ݐିଵ; ఈ ∗
ܵ
√݊
ܺ݅ = ܺ݅ +
Almacenar
,݅ܮ ݏܮ
ۻ ← ࢄഥ
۾ ← ࡿ
ࢻ ←
0,05ࢻ ←
ࢻ ← 0,05
← 0,05
݅ܮ ← ࢄഥ − ܿݐ
ݏܮ ← ࢄഥ + ܿݐ
¿ ݏܧ ݅ܮ ≤ ࢄഥ ≤ ?ݏܮ
Si
No
1
Existe evidencia
estadística
significativa, que
permite no aceptar
que ܺത está dentro
del intervalo.
Tomar nueva
muestra de
contribuyentes del
mismo sector
42. 41
Fin
∴
Al 95% de confianza puede afirmarse que
la media real del ratio j, está entre
ݔҧ − ݐିଵ; ఈ
ௌ
√
y ݔҧ + ݐିଵ; ఈ
ௌ
√
.
No existe evidencia estadística que
permita no aceptar que ܺത está dentro de
ese rango.
1
Almacena ܺത . Es
posible usar a
ܺത Como promedio
del sector
43. 42
Ficha 8
Algoritmo T8, para realizar una prueba de igualdad de medias con ࣌
desconocida y poblaciones
independientes.
Problema: Calcular la prueba de igualdad de medias con la varianza desconocida y en muestras
provenientes de poblaciones independientes. Se entiende por poblaciones independientes
aquellas que son colectivamente exclusivas. p.ej: AX y EX.
Planteamiento Formal:
La estructura de los ratios AX y EX plantean la medición del valor agregado generado por el
contribuyente. La primera vista desde los datos aportados por las declaraciones del IVA y la
segunda por los datos provenientes de las declaraciones del ISLR. Es así que en busca de la
consistencia contable, ambas razones deberían ser iguales ó similares durante un período
determinado. Para determinar, la igualdad de ambas razones se propone lo siguiente:
Dado un grupo finito de contribuyentes fiscales pertenecientes al mismo sector económico de
actividad (C), se tiene el problema de realizar la prueba de hipótesis para comprobar la igualdad de
las medias reales de dos poblaciones independientes ߤଵ ௬ ߤଶ con ߪଶ
desconocidas. Esto a efecto
de comprobar si ambas razones AX y EX demuestran similitud en el sector económico de análisis.
Sin pérdida de generalidad, se asume que el conjunto de contribuyentes no será vacío y los
mismos se enumeran como c1, c2, c3,….., cn
Es decir, ⇔ ambos resultados de los intervalos de confianza de las medias reales de AX y EX,
incluyen a las medias Muestrales de cada uno respectivamente, se procede a la comparación de
las medias reales asumiendo que:
ܺത ݕ ܺതா ∃ ݁݊ ( ݔҧ − ݐିଵ; ఈ
ௌ
√
≤ ߤ ≤ ݔҧ + ݐିଵ; ఈ
ௌ
√
)
∴
ܪ: ߤଵ = ߤଶ
ܪଵ: ߤଵ ≠ ߤଶ
Donde:
ߤଵ = ܺത ݕ ߤଶ = ܺതா
∴
Planteada la restricción anterior, dadas dos muestras de ratios AX y EX → AX= ሼܽ, ܽଵ, … . , ܽሽ y
EX= ሼ݁, ݁ଵ, … . , ݁ሽ se pide comparar las medias reales de ambos grupos independientes, para
determinar si los mismos tienen comportamientos similares durante un período determinado.
44. 43
Para ello se utiliza el siguiente estadístico de prueba:
ݐᇱ
=
ܺതଵ − ܺതଶ
ඨ
ܵଵ
ଶ
݊ଵ
+
ܵଶ
ଶ
݊ଶ
Cuya regla de decisión para una prueba de dos colas es:
Rechazar ܪ → ݐᇱ
>
ା(௧భௐభା௧మௐమ)
ௐభାௐమ
ó → ݐᇱ
<
ି(௧భௐభା௧మௐమ)
ௐభାௐమ
ó
De lo contrario no rechazar ܪ
Donde:
ݐଵ = valor t crítico al nivel ߙ de significación con (n1 – 1) grados de libertad.
ݐଶ = valor t crítico al nivel ߙ de significación con (n2 – 1) grados de libertad.
ܹଵ =
ௌభ
మ
భ
= es la razón de la varianza de n1 en proporción a n1.
ܹଶ =
ௌమ
మ
మ
= es la razón de la varianza de n2 en proporción a n2.
Obtenidas las medias y desviaciones estándares Muestrales de AX y EX se calcula ݐᇱ
. A
continuación se fija el nivel de significación ߙ de la prueba, el cual generalmente será del 5%.
Posteriormente se hallan los valores críticos t1 y t2 en la tabla t de Student. En caso de que las
muestras sean de igual tamaño t1 = t2 se encuentra un solo valor de t.
Seguidamente se procede al cálculo de
±(௧భௐభା௧మௐమ)
ௐభାௐమ
para realizar la comparación con ݐᇱ
de la cual
resultará el rechazo ó no rechazo de ܪ , según la regla de decisión planteada anteriormente.
En caso de no rechazarse la ܪ podrá concluirse que con un 95% de confianza, las medias reales
de ambas poblaciones de ratios pueden ser iguales. De lo contrario, al rechazar la ܪ se
confirmará la diferencia entre las medias; lo cual permite concluir en la diferencia de ambas
razones.
45. 44
Descripción Formal:
Función comparar_medias
// ܺത1 y ܺത2 son las medias Muestrales de dos ratios de selección y se almacenas en M1 y M2 //
M1 ← ܺത1
M2 ← ܺത2
// Se obtienen las varianzas de ambas muestras y se amacenas en P1 y P2//
P1 ← ܵଵ
ଶ
P2 ← ܲଶ
ଶ
//Se obtiene el valor crítico t’ a partir del estadístico de prueba y se almacena en Z//
ܼ ←
ܯଵ − ܯଶ
ඨ
ܲଵ
ଶ
݊ଵ
+
ܲଶ
ଶ
݊ଶ
// Se fija ߙ =0,05 como nivel de significación; es decir 1- ߙ =95% como nivel de la prueba//
ߙ ← 0,05
//Se consiguen los valores críticos de t1 y t2 en la tabla t de student, para n-1 grados de libertad y
ߙ //
t1=1ݐିଵ; ఈ
t2=2ݐିଵ; ఈ
//Se calculan las razones de las varianzas con respecto a los tamaños de muestras.//
ܹଵ ←
ܵଵ
ଶ
݊ଵ
ܹଶ ←
ܵଶ
ଶ
݊ଶ
46. 45
//Se obtiene la suma de los productos de los valores críticos de t1 y t2 por las razones de las
varianzas con respecto a los tamaños de muestras y se divide entre la suma las razones de las
varianzas con respecto a los tamaños de muestras.
−ܮ ←
−(ݐଵܹଵ + ݐଶܹଶ)
ܹଵ + ܹଶ
ܮ ←
+(ݐଵܹଵ + ݐଶܹଶ)
ܹଵ + ܹଶ
// Se comparan los valores de ±ܮ con respecto a Z.
Rechazar ܪ → ܼ > ܮ ó → ܼ < −ܮ ó
De lo contrario no rechazar ܪ
Devolver ሾܼ, ,ܮ −ܮሿ
Fin
47. 46
Diagrama de Flujo para la prueba de igualdad de medias para dos
poblaciones independientes con ࣌
desconocidas.
ܼ ←
ܯଵ − ܯଶ
ඨ
ܲଵ
ଶ
݊ଵ
+
ܲଶ
ଶ
݊ଶ
M2 ← ܺത2
M1 ← ܺത1
P1 ← ܵଵ
ଶ
P2 ← ܲଶ
ଶ
ࢻ ← 0,05
← 0,05
t1=1ݐିଵ; ఈ
t2=2ݐିଵ; ఈ
¿ ݏܧ ܼ > ܮ ó ܼ < −?ܮ
Si
No
1
Existe evidencia
estadística
significativa al 95%,
que permite concluir
que las medias
reales de AX y EX
son iguales.
ܹଵ ←
ܵଵ
ଶ
݊ଵ
ܹଶ ←
ܵଶ
ଶ
݊ଶ
Fin
48. 47
Fin
ܵ݅ ݐᇱ
>
ା(௧భௐభା௧మௐమ)
ௐభାௐమ
ó → ݐᇱ
<
ି(௧భௐభା௧మௐమ)
ௐభାௐమ
∴
No existe evidencia estadística significativa que
permita aceptar la igualdad de medias reales
entre AX y EX.
1
View publication statsView publication stats