Welcome

welcome

We run crazy fun party overnight frequently.

You can join into our wild party on Africa, we are running a party at wild african jungle. JOIN US!

more

CUENTA

Cuenta

De Wikipedia, la enciclopedia libre

La cuenta es el elemento básico y central en la contabilidad y en los servicios de pagos. La cuentas suponen la clasificacion de todas las transaciones comerciales que tiene una empresa o negocio. Se refiere al nombre debidamente codificado o numerado que se da a los valores que posee la empresa. La cuenta facilita el registro de las operaciones contables en los libros de contabilidad, representa bienes, derechos y obligaciones de los que dispone una empresa en una fecha determinada.

Instrumento de representación y medida de cada elemento patrimonial. Por lo tanto hay tantas cuentas como elementos patrimoniales tenga la empresa. Gráficamente se dibujan como una T, donde a la parte izquierda se llama "Debito" o "Debe" y a la parte derecha "credito"o "haber", sin que estos términos tengan ningún otro significado más que el indicar una mera situación física dentro de la cuenta. Hay dos tipos de cuenta: de patrimonio y de gestión. Las cuentas de patrimonio aparecerán en el Balance y pueden formar parte del Activo o del Pasivo (y dentro de éste, del Pasivo Exigible o de los Fondos Propios o Neto). Las cuentas de gestión son las que reflejan ingresos o gastos y aparecerán en la Cuenta de Pérdidas y Ganancias.

Independientemente de si las cuentas son de Patrimonio o de Gestión, también se dice que por su naturaleza son deudoras o acreedoras. Las cuentas son deudoras cuando siendo de Patrimonio se refieren a un activo o siendo de Gestión se refieren a un gasto y son acreedoras cuando siendo de Patrimonio se refieren a un pasivo o a una cuenta de capital, o cuando siendo de Gestión se refieren a un ingreso. Una cuenta complementaria de activo o de pasivo puede invertir la lógica anterior, por ejemplo la Estimación para Cuentas Incobrables o de Inventarios Obsoletos o de Lento Movimiento que siendo cuentas de activo su naturaleza es acreedora. También podemos tener cuentas complementarias en las cuentas de Gestión.

Un tipo muy común de cuenta son las cuentas Corrientes, estas son cuentas que en cualquier momento pueden ser deudoras o acreedoras y su naturaleza la define solamente el hecho de si son cuentas de Patrimonio o de Gestión, y mas aún dentro de las clasificaciones anteriores es su ubicación específica dentro del estado financiero lo que define su naturaleza, no olvidemos son cuentas que pueden ser deudoras o acreedoras.

Una cuenta es un concepto representativo de una serie de elementos patrimoniales de la misma clase. Las cuentas se representan: Activa, Pasiva y Patrimonio.

Activa [editar]

Las cuentas activas representan los bienes y derechos de propiedad de la empresa. Para clasificarlos se aplican los siguientes criterios: Activos corrientes o circulantes: son el efectivo y aquellos bienes o derechos que se espera convertir en efectivo o consumir dentro del ciclo normal de las operaciones de la empresa. Por ciclo normal de operaciones se entiende el tiempo promedio en que el efectivo invertido en materia prima se convierte de nuevo en efectivo pasando por las etapas de producción, venta y recaudo de cuentas por cobrar; esto para el caso de empresas manufactureras. En empresas comerciales, por su misma naturaleza, se omite el proceso productivo. Si el ciclo normal operativo es menor de un año, se considerarán activos corrientes aquellos bienes que se convierten en efectivo o se consumen en menos de un año; si es mayor de un año se aplicará este criterio en la clasificación. Es costumbre considerar como corto plazo el período menor de un año. Las partidas del activo corriente más importantes son el efectivo, las inversiones temporales (fácilmente convertibles en efectivo), las cuentas por cobrar o cartera y los inventarios (materia prima, productos en proceso y productos terminados). Estas partidas usualmente reciben el nombre de capital de trabajo. De menor importancia, dentro del grupo de activos corrientes, figuran los gastos pagados por anticipado, tales como seguros e intereses. Activos fijos: para que un activo se incluya en este grupo, debe cumplir las siguientes condiciones:

Que tenga una vida útil relativamente larga.

Que se utilice en las operaciones propias del negocio.

Que no esté para la venta.

Con base en este criterio se agrupan dentro del activo fijo los terrenos, edificios, maquinaria y equipo, muebles y enseres y vehículos para uso de la empresa. -Los activos fijos están sujetos a depreciación, excepto los terrenos. El concepto de depreciación desde el punto de vista contable consiste en distribuir el costo de un activo fijo durante su vida útil, entendiéndose por vida útil el tiempo en que se espera preste servicio. Se recomienda que el gasto de deprecia¬ción guarde relación con los ingresos que genere el activo, haciéndolo compatible con su desgaste o deterioro. -Otros activos: se incluyen en este grupo todos los demás activos que no reúnen las condiciones de corriente y fijo, tales como: inversiones a largo plazo en otras empresas, bienes raíces, terrenos y edificios que no se utilicen en operaciones propias, i cargos diferidos, como gastos de organización y pagos anticipados a más de un año; intangibles (patentes, good-will, marcas). Algunas empresas presentan estas partidas por separado sin englobarlas dentro del rubro general de "otros activos".

Pasiva [editar]

El pasivo representa las deudas totales de la empresa. Los acreedo¬res o beneficiarios de estas deudas son por lo general personas o instituciones diferentes a los dueños, aunque en ocasiones existen pasivos con los socios o accionistas de la empresa. El pasivo se clasifica de acuerdo con su liquidez o exigibilidad. Si es exigible en el curso de un año o menos, se considera pasivo corriente (circulante); si el compromiso es a más de un año se clasifica dentro del pasivo a largo plazo. El pasivo corriente incluye partidas, tales como cuentas por pagar a proveedores o simplemente "Proveedores"; obligaciones bancarias a corto plazo; impuestos por pagar; porción corriente de préstamos a largo plazo, es decir, la parte que se vence en menos de un año. Otros pasivos corrientes son los intereses por pagar, salarios acumulados por pagar y cesantías porción-corriente. El pasivo a largo plazo comprende entre otras las siguientes cuen¬tas: obligaciones bancarias a largo plazo, cesantías no corrientes, pensiones de jubilación, bonos emitidos en circulación.

Patrimonio [editar]

El patrimonio representa lo que es propiedad de la empresa y refleja los aportes iniciales de los socios, aportes posteriores (si los hubo), ganancias obtenidas por los propietarios y reinvertidas en la misma empresa (utilidades retenidas). Las utilidades retenidas comprenden las reservas (o utilidades apropiadas) y las no apropiadas. Entre las reservas se destacan la legal y las creadas para fines específicos como reserva para expansión de planta. De acuerdo con disposiciones vigentes en Colombia, el 10% de la ganancia neta anual debe apropiarse para una reserva legal, hasta que ésta alcance el 50% del capital invertido (suscrito).


MODA



Moda (Mo): indica el valor que más se repite, o la clase que posee mayor frecuencia.


En el caso de que dos valores presenten la misma frecuencia, decimos que existe un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto de datos multimodal.

4.3.1 Ejemplo: moda para datos no agrupados

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más consume a la semana:

Marca 1

Marca 2

Marca 1

Marca 1

Marca 1

Marca 3

Marca 1

Marca 3

Marca 1

Marca 2

Marca 1

Marca 1

Marca 2

Marca 1

Marca 3

Marca 3

Marca 2

Marca 1

Marca 1

Marca 1

Marca 1

Marca 3

Marca 1

Marca 2

Marca 3

Marca 1

Marca 3

Marca 3

Marca 2

Marca 3

SOLUCIÓN

PASO 1: Determinar las frecuencias de cada valor de la variable.

La marca 1 se repite 15 veces

La marca 2 se repite 6 veces

La marca 3 se repite 9 veces

PASO 2: la moda representa el valor que más se repite. En este caso es la marca 1.

4.3.2 Ejemplo: moda para datos agrupados

Calcular la moda a partir de la siguiente tabla de frecuencia:

Ni

Lm

Ls

f

Mc

1

[ 4

6 )

2

5

2

[ 6

8 )

4

7

3

[ 8

10 )

4

9

4

[ 10

12 )

5

11

5

[ 12

14 ]

5

13

Total

20


SOLUCIÓN

Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto decimos que es un caso donde aparecen dos modas (bimodal).

4.3.3 Calculo de la moda mediante fórmula

Algunos autores suelen aplicar una fórmula para determinar la moda para tablas de frecuencia.

Donde LS-1 equivale al límite superior del intervalo anterior donde se encuentra la moda.

4.3.4 Calculo de la mediana en Excel

Con la función MODA que provee Excel, podremos calcular el valor que posee mayor frecuencia en datos no agrupados.


MODA: Determina el valor que más se repite en un conjunto de datos.


Formato: MODA(número1;número2;…)

Categoría: Estadísticas


Calcule la moda a partir de los siguientes datos copiados en una hoja nueva de Excel:

Active la función MODA en la celda B9 y en el campo número1 selecciones los datos del ejercicio.

La moda del ejercicio es 2.

Esta fórmula solo muestra una moda, correspondiente a la de menor valor. En el caso de que no exista la moda aparecen los símbolos #N/A.

4.3.5 Ventajas

  • Es estable a los valores extremos.

  • Es recomendable para el tratamiento de variables cualitativas.

4.3.6 Desventajas

  • Pueda que no se presente.

  • Puede existir más de una moda.

  • En distribuciones muy asimétricas suele ser un dato muy poco representativo.

  • Carece de rigor matemático.

4.4 EJERCICIOS PROPUESTOS

4.4.1 Calcular la media, mediana y moda para los siguientes datos:

11

5

4

8

9

8

6

11

3

7

10

2

7

3

8

4.4.2 Determinar la media, mediana y moda a la siguiente tabla de frecuencia:

Ni

Lm

Ls

f

1

100,0

150,1

1

2

150,1

200,1

2

3

200,1

250,1

15

4

250,1

300,1

16

5

300,1

350,1

21

6

350,1

400,1

14

7

400,1

450,1

11

8

450,1

500,0

7

Total

87

4.4.3 Para que un producto sea aceptado por su cliente principal, debe cumplir con ciertas especificaciones de calidad. Una de ellas, radica en que el promedio de longitud de los 20 primeros productos este entre 20,0 y 20,9 centímetros. Si las medidas son:

22,3

20,4

19,8

19,9

20,1

20,8

21,6

19,8

20,5

23,4

19,6

21,5

18,5

18,7

20,9

21,1

20,1

21,5

22,3

17,9

¿Cumple en el proveedor con las especificaciones del cliente?

4.4.4 Calcular la media, mediana y moda para los siguientes datos (agrúpelos en una tabla de frecuencia):

22,1

44,4

32,1

56,0

29,4

37,7

32,3

29,0

30,5

45,3

20,7

15,6

41,1

41,2

39,5

20,8

34,1

31,8

21,9

47,0

25,6

4.4.5 Calcular la media, mediana y moda de la tabla de frecuencia dada en el ejercicio 2.3.10.

4.4.6 Calcule y ubique la media, mediana y moda en el siguiente gráfico de ojiva:

4.4.7 Calcule la media, mediana y moda a partir del siguiente histograma:



Enciclopedia Virtual
PresBiblioteca




PERCENTIL

Percentil q (pq)

Una medida de posición muy útil para describir una población, es la denominada 'percentil'. En forma intuitiva podemos decir que es un valor tal que supera un determinado porcentaje de los miembros de la población.

Por ejemplo, considere un curso de cuarenta alumnos que se forma en línea por orden de estatura, primero los grandes y al final los chicos. Suponga, además, que se considera ‘chico’ a un alumno de la cuarta parte final de esta línea.

Éste es un concepto relativo a este curso, con toda seguridad variará al referirse a otro. Es fácil aceptar que los ‘chicos’ de octavo básico tienen menor estatura que los ‘chicos’ de cuarto medio.

Como la cuarta parte corresponde al 25% de la población, en el ejemplo que se menciona, los chicos de un curso, son aquellos cuya estatura no supera el ‘percentil veinticinco’ de la población formada por los alumnos del curso.

Si una variable pudiese asumir muchos valores, la representación de la proporción del total, menor o igual que un valor, tendría una forma creciente parecida a la siguiente:

Si en este conjunto de valores se quiere encontrar el percentil 20, la solución gráfica es muy simple

Como puede verse, el valor de la variable bajo el cual se encuentra un 20% de los valores, es algo mayor que 2.

En forma aproximada se podría conocer los percentiles usando este tipo de gráfico.

La descripción intuitiva de ‘percentil’ en una población continua, como la anterior, no es difícil de entender. Sin embargo, la definición en una muestra de tamaño finito puede resultar más difícil porque, en este caso, los valores que representan las proporciones acumuladas tienen una representación gráfica en forma de escalera.

Ejemplo.

Considere los siguientes datos de una muestra de tamaño 10.

4 8 11 12 13 16 18 19 21 22

En una muestra de tamaño n, cada dato representa 1 enésimo del total. En este caso, en que hay diez datos, esta proporción es un décimo. En el gráfico, puede observarse que la gráfica muestra un salto de un décimo (10%) en cada dato muestral. El primer salto se observa en el número 4,el menor de los datos. Antes del valor 4, la curva asume el valor cero y a partir de él, un décimo. El segundo salto se produce en 8, a partir del cual la gráfica comienza a valer dos décimos. Así se producen los saltos hasta alcanzar el valor uno (100%) a partir del último dato muestral 22.

Si en este ejemplo se decide calcular el percentil 25, se observa que la recta horizontal trazada a la altura del 25%, cruza la gráfica de escalera justo al llegar al tercer dato ordenado (11), por lo tanto, éste es el valor buscado. (Nótese que percentiles cercanos, mayores que 20 y menores que 30, tienen el mismo valor 11).

Sin embargo, si se desea calcular un percentil que coincida con una proporción asociada a un dato de la muestra, se produce una indefinición. Tómese el caso del percentil 20. En este caso la línea horizontal que busca cortar la gráfica de escalera, coincide justamente con un tramo horizontal de ésta; el que corre a la altura del 20% entre los datos muestrales 8 y 11. Cualquier valor entre 8 y 11 podría ser considerado como el percentil 20.

Más adelante se usará una convención para encontrar salidas a esta indefinición.

La presentación gráfica hecha anteriormente corresponde a la siguiente definición de percentil:

Definición.

Sea q un número real tal que 0<=q<=100. El percentil q ( pq ). es un valor del recorrido de las observaciones tal que:

1º. A lo menos q% de las observaciones son menores o iguales que pq.

2º. A lo menos (100-q)% de las observaciones son mayores o iguales que pq.

Para calcular un percentil, no es práctico usar esta definición.

Resulta más conveniente usar la siguiente regla que se deduce de la misma.

Para obtener el percentil q (0<q<100), se ordenan los datos de menor a mayor y se calcula el número

Si no es entero, el percentil está dado por:

Esto es, el dato cuyo orden es el entero inmediatamente superior a .

Si es entero, el percentil cumple la siguiente condición:

Es decir, pq se encuentra entre dos datos de orden consecutivo. El menor es el de orden dado por y el mayor es el dato siguiente en la muestra ordenada.

En el caso del ejemplo anterior, el percentil 25 se obtuvo calculando en primer lugar el 25% de 10, dado que éste es el tamaño n de la muestra. Entonces, está dado por . Por lo tanto, el entero inmediatamente superior es 3. En consecuencia, el percentil 25 es el tercer dato en el orden creciente; es decir 11. Tal como ya se determinó gráficamente.

Al calcular el percentil 20, tenemos que , valor entero. Por lo tanto, el percentil 20 es cualquier número entre el segundo y tercer dato ordenado. Es decir, cualquier número entre 8 y 11.

NOTA.

El cálculo de un percentil de una muestra presenta algunas dificultades por tratarse de un conjunto de datos en que se producen incrementos de la proporción acumulada en forma de saltos, y no suavemente como en el caso de una variable continua. Estos saltos representados por un gráfico de escalera son los que producen situaciones indefinidas en los casos que se indicó anteriormente.

Sin embargo, el uso inicial del gráfico de escalera y alguna ejercitación con la fórmula de cálculo, ayudan a entender un procedimiento que en un comienzo aparece mucho más difícil.

CÓMO DECIDIR EN EL CASO DE MÚLTIPLES SOLUCIONES PARA UN PERCENTIL.

Como se viO anteriormente, existen situaciones en el cálculo de un percentil muestral en las que todo un intervalo de números reales cumple con las condiciones de ser el percentil buscado. Esta respuesta no es útil porque habitualmente se necesita un único valor como resultado.

Para obtener este único resultado hay diversas soluciones. Aquí se usará aquella que calcula un punto de intervalo entregado por el cálculo anterior usando el mismo porcentaje que define al percentil.

El procedimiento es el siguiente:

1. Se calcula la longitud del intervalo

mediante la diferencia de sus extremos.

2. La longitud calculada anteriormente se multiplica por el porcentaje que define el percentil.

3. El valor obtenido en 2. se suma al límite inferior del intervalo calculado. Este resultado es el percentil buscado.

Ejemplo.

Como se vio en los cálculos precedentes, el percentil 20 del conjunto de datos usado se encuentra entre 8 y 11. Aplicando el procedimiento recién descrito, calculamos la longitud del intervalo.

Ésta resulta ser 11 - 8 = 3.

A continuación calculamos el 20% de 3 y obtenemos 0.6.

En consecuencia, el percentil 20 para este caso es 8 + 0.6 = 8.6.

Comentario.

No hay sólo un criterio para calcular percentiles muestrales. De hecho, importantes programas de computación estadística entregan resultados diferentes debido a que usan criterios similares, pero no iguales. No debe causar sorpresa, entonces, encontrar estas diferencias originadas por la falta de un procedimiento universalmente aceptado.

Algunos ejemplos de percentiles.

Mediana.

La mediana es el percentil 50.

Cuartiles.

El primer cuartil , es el percentil 25.

El tercer cuartil , es el percentil 75.

Deciles.

El k-ésimo decil, k entero entre 0 y 10, es el percentil 10*k.

Ejemplo.

En la tabla siguiente se presentan treinta datos simulados y ordenados, que permitirán practicar el cálculo de percentiles muestrales.

8

135

592

678

806

945

58

190

651

717

880

960

65

217

674

730

888

970

119

260

675

738

903

980

129

491

677

741

944

983

CUARTIL

Medidas de posición

De Wikipedia, la enciclopedia libre

(Redirigido desde Cuartil)

Las medidas de posición son unos estadísticos que nos sintetizan la información sobre los datos que analizamos, facilitando su manejo. En lugar de trabajar con toda la tabla de frecuencias, las medidas de posición resumen los valores que separan a los datos en grupos significativos. Una medida de posición es un indicador que se usa para señalar qué porcentaje de datos dentro de la muestra se encuentra a un lado y a otro del mismo.

Tabla de contenidos

[ocultar]

Cuartiles [editar]

Dados una serie de valores X1,X2,X3...Xn ordenados en forma creciente,

Definimos:

  • Primer cuartil (Q1) como la mediana de la primera mitad de valores.
  • Segundo cuartil (Q2) como la propia mediana de la serie.
  • Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

En estadística descriptiva Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales.

Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesión (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos.

Datos Agrupados [editar]

Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3

Donde:

  • Lk = Límite real inferior de la clase del cuartil k
  • n = Número de datos
  • Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
  • fk = Frecuencia de la clase del cuartil k
  • c = Longitud del intervalo de la clase del cuartil k

Si se desea calcular cada cuartil individualmente, mediante otra fórmula se tiene lo siguiente:

  • El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones.

Fórmula de Q1, para series de Datos agrupados:

Donde:

  • L1 = limite inferior de la clase que lo contiene
  • P = valor que representa la posición de la medida
  • f1 = la frecuencia de la clase que contiene la medida solicitada.
  • Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
  • Ic = intervalo de clase


  • El segundo cuartil Q2, (coincide, es idéntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores.

Fórmula de Q2, para series de Datos agrupados:

Donde:

  • L1 = limite inferior de la clase que lo contiene
  • P = valor que representa la posición de la medida
  • f1 = la frecuencia de la clase que contiene la medida solicitada.
  • Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
  • Ic = intervalo de clase
  • El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones.

Fórmula de Q3, para series de Datos agrupados:

Donde:

  • L1 = limite inferior de la clase que lo contiene
  • P = valor que representa la posición de la medida
  • f1 = la frecuencia de la clase que contiene la medida solicitada.
  • Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada.
  • Ic = intervalo de clase.

Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil.

Para Datos No Agrupados [editar]

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:

El primer cuartil:

  • Cuando n es par: 1*n/4
  • Cuando n es impar: 1(n+1)/4

Para el tercer cuartil

  • Cuando n es par: 3*n/4
  • Cuando n es impar: 3(n+1)/4

Quintiles [editar]

  • Se representan con la letra K.
  • Es el primer quintil. Separa a la muestra dejando el 20% de los datos a su izquierda.
  • Es el segundo quintil. Es el valor que indica que el 40% de los datos son menores.
  • Es el tercer quintil. Indica que el 60% de los datos son menores que él.
  • Es el cuarto quintil. Separa al 80% de los datos del otro 20%.

Percentiles [editar]

  • Se representan con la letra C.
  • Es el percentil i-ésimo, donde la i toma valores del 1 al 99. El i % de la muestra son valores menores que él y el 100-i % restante son mayores.

Cuando los datos no están agrupados en intervalos los cuartiles, así como el resto de las medidas de posición, tienen un valor claro. Sin embargo, cuando tenemos una agrupación de los datos ya no es tan sencillo realizar el cálculo. Sí que resulta claro ver en cuál de los intervalos está el cuartil (quintil, decil o percentil) buscado, pero para calcular su valor exacto necesitaremos usar una fórmula.

Cálculos en Scilab / MATLAB: [editar]

  • Los percentiles de un conjunto de datos son calculados con la instrucción “perctl”.

A esta instrucción hay que introducirle dos vectores. Uno de ellos “x” debe contener los datos que queremos procesar y en el otro “y”, valores enteros comprendidos entre el 1 y el 100. La función calcula cuales son los valores de “x” que se corresponden con los percentiles indicados en “y”. Para probar esta función vamos a introducir un vector x que contenga el conjunto de datos con el que queremos trabajar:

x=[7,12,4,8,3,10,11,5,13,1,12,3,5,1,17,4,8,8,7,19,8,1,7,17,4,7,1,7,3,7,3,13,3,4,7,8,10,2,5,11,5,4,3,5,8];
y=[15,25,60,80]

Con esto calcularemos los percentiles 15, 25, 60 y 80 del conjunto de datos del vector “x”

prctile(x,y)
ans =
3. 43.
3.5 5.
7. 19.
10.8 6.

Nos devuelve una matriz de dos columnas. En la primera de ellas aparecen los valores de los percentiles pedidos y en la segunda aparece la posición que ocupan en el vector “x” dichos valores.


  • Los cuartiles de la muestra son calculados con la instrucción “quart”.

Esta instrucción es más sencilla que la anterior. Basta con introducirle un vector o matriz de valores y nos devolverá un vector con el valor de los cuartiles de los datos introducidos. Voy a usar el mismo vector “x” que en el caso anterior:

quart(x)
ans = 3.75 7. 8.5

Scilab también nos permite calcular el rango intercuartilico que es la distancia que hay entre un cuartil y otro. Podemos hacerlo con la instrucción “iqr”.

iqr(x)
ans = 4.75

DESVIACION ESTANDAR

Desviación estándar

De Wikipedia, la enciclopedia libre

Desviaciones estándar en una distribución normal.
Desviaciones estándar en una distribución normal.

La desviación estándar (o desviación típica) es una medida de dispersión para variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva. Es una medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su media aritmética, expresada en las mismas unidades que la variable.

Para abordar las cuestiones que comentábamos en el párrafo anterior, nos valemos de herramientas como la varianza y la desviación estándar. Ambas medidas están estrechamente relacionadas ya que definimos una a partir de la otra.

Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer también la desviación que representan los datos en su distribución respecto de la media aritmética de dicha distribución, con objeto de tener una visión de los mismos más acorde con la realidad a la hora de describirlos e interpretarlos para la toma de decisiones.

Tabla de contenidos

[ocultar]

Formulación [editar]

La varianza representa la media aritmética de las desviaciones con respecto a la media elevadas al cuadrado. Si atendemos a la colección completa de datos (la población en su totalidad) obtenemos la varianza poblacional; y si por el contrario prestamos atención sólo a una muestra de la población, obtenemos en su lugar la varianza muestral. Las expresiones de estas medidas son las que aparecen a continuación.

Expresión de la varianza muestral:

 {S_X^2} = \frac{ \sum_{i=1}^n \left( X_i - \overline{X} \right) ^ 2 }{n-1} = \frac{ \sum X_i^2} {n-1}- \overline{X}^2

Expresión de la varianza poblacional:

 {\sigma^2} = \frac{ \sum_{i=1}^N \left( X_i - {\mu} \right) ^ 2 }{N} = \frac{ \sum X_i^2 }{N} - \mu^2

Una vez entendida la f Expresión de la desviación estándar poblacional:

 \sqrt{{\sigma^2}} =\sqrt{{\frac{ \sum_{i=1}^N \left( X_i - {\mu} \right) ^ 2 }{N}}}

El término desviación estándar fue incorporado a la estadística por Karl Pearson en 1894.

Por la formulación de la varianza podemos pasar a obtener la desviación estándar, tomando la raíz cuadrada positiva de la varianza. Así, si efectuamos la raíz de la varianza muestral, obtenemos la desviación típica muestral; y si por el contrario, efectuamos la raíz sobre la varianza poblacional, obtendremos la desviación típica poblacional.

Expresión de la desviación estándar muestral:

 \sqrt{s^2} =\sqrt{{ \frac{ \sum_{i=1}^n \left( x_i - \overline{x} \right) ^ 2 }{n-1}}}También puede ser tomada como
S = \sqrt{\frac{a-2(s/n)(s)+(s^2/n)}{n-1}}

con a como \sum_{i=1}^n x_i^2 y s como \sum_{i=1}^n x_i

Interpretación y aplicación [editar]

La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética.

Una desviación estándar grande indica que los puntos están lejos de la media, y una desviación pequeña indica que los datos están agrupados cerca a la media.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 4 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es coherente, ya que las mediciones caen fuera del rango de valores en el cual sería razonable esperar que ocurrieran si el modelo teórico fuera correcto. La desviación estándar es uno de tres parámetros de ubicación central; muestra la agrupación de los datos alrededor de un valor central (la media o promedio).

Desglose [editar]

La desviación estándar (DS/DE), también llamada como desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. De hecho, específicamente, la desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, \sigma^{}_{}.

La desviación estándar de un conjunto de datos es una medida de cuánto se desvían los datos de su media. Esta medida es más estable que el recorrido y toma en consideración el valor de cada dato.

Es posible calcular la desviación estándar de una variable aleatoria continua como la raíz cuadrada de la integral

{\sigma}^2 = \int_{-\infty}^\infty {(x - \mu)}^2 f(x) dx

donde

\mu = \int_{-\infty}^\infty x f(x) dx
  • La DS es la raíz cuadrada de la varianza de la distribución
\sigma^2 = \lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^n  \left( x_i - \overline{x} \right) ^ 2

Así la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Aunque esta fórmula es correcta, en la práctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 (Corrección de Bessel)

s^2 = \frac{ \sum_{i=1}^n \left( x_i - \overline{x} \right) ^ 2 }{n-1}

También hay otra función más sencilla de realizar y con menos riesgo de tener equivocaciones :

s^2 = \frac{ \sum_{i=1}^n x_i^2 - n\overline{x}^2}{n-1}

Ejemplo [editar]

Aquí se muestra cómo calcular la desviación estándar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de niños. { 4, 1, 11, 13, 2, 7 }

1. Calcular el promedio o media aritmética \overline{x}.

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i.

En este caso, N = 6 porque hay seis datos:

x_1 = 4\,\!
x_2 = 1\,\!
x_3 = 11\,\!
x_4 = 13\,\!
x_5 = 2\,\!
x_6 = 7\,\!

i=número de datos para sacar desviación estándar

\overline{x}=\frac{1}{6}\sum_{i=1}^6 x_i Sustituyendo N por 6
\overline{x}=\frac{1}{6} \left ( x_1 + x_2 + x_3 + x_4 + x_5 + x_6 \right )
\overline{x}=\frac{1}{6} \left ( 4 + 1 + 11 + 13 + 2 + 7 \right )
\overline{x}= 6.33 Este es el promedio.


2. Calcular la desviación estándar \sigma\,\!

\sigma = \sqrt{\frac{1}{N-1} \sum_{i=1}^N (x_i - \overline{x})^2}
\sigma = \sqrt{\frac{1}{5} \sum_{i=1}^6 (x_i - \overline{x})^2} Sustituyendo N - 1 por 5 ( 6 - 1 )
\sigma = \sqrt{\frac{1}{5} \sum_{i=1}^6 (x_i - 6.33)^2} Sustituyendo \overline{x} por 6.33


\sigma = \sqrt{\frac{1}{5} \left [ (4 - 6.33)^2 + (1 - 6.33)^2 + (11 - 6.33)^2 + (13 - 6.33)^2 +(2 - 6.33)^2 + (7 - 6.33)^2 \right ] }
\sigma = \sqrt{\frac{1}{5} \left ( (-2.33)^2 + (-5.33)^2 + 4.67^2 + 6.67^2 + (-4.33)^2 + 0.67^2 \right ) }
\sigma = \sqrt{\frac{1}{5} \left ( 5.43 + 28.4 + 21.8 + 44.5 + 18.7 + 0.449 \right ) }
\sigma = \sqrt{\frac{119.28}{5}}
\sigma = \sqrt{23.86}
\sigma = 4.88\,\! Esta es la desviación estándar.