jueves, 27 de marzo de 2008

diagrama de cajas

DIAGRAMA DE CAJAS Y BIGOTES :
Presentación visual que describe al mismo tiempo varias características importantes de un conjunto de datos, tales como el centro, la dispersión, el alejamiento de la simetría, y la identificación de valores extremos (puntos atípicos), es decir, de valores que se alejan de una manera poco usual del resto de los datos.
Presenta los tres cuartiles, (y los valores mínimos y máximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento

Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formará la caja, que tiene la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben también los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es decir, corresponde al rango intecuartílico Þ H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Þ Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. Así, las Cercas Internas Inferior (CIi) y Superior (CIs) estarán dadas por:CIi = Q1 - PasoCIs = Q3 + PasoSi la cerca interna inferior da menor que el valor mínimo de la muestra, ésta se hace igual al valor mínimo; igualmente, si la cerca interna superior da mayor que el valor máximo, ésta se hace igual a dicho valor.

Cercas Externas, ubicadas a un paso de las cercas internas. Así, las Cercas Externas Inferior (CEi) y Superior (CEs) estarán dadas por:CEi = CIi - PasoCEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atención, ya que pueden ser valores atípicos, que, en algunos casos, no pertenecen realmente a la distribución general de donde provienen los datos.
"Valores lejanos" o , ubicados por fuera de las cercas externas, correspondientes a valores extremos, que requieren un mayor análisis que los valores atípicos.

comentario:
este tipo de diagrama es mayor mente utilizado para hacer comparacion entre poblaciones

varios

QUE ES ESTADISTICA?
es la ciencia que le facilita al hombre el estudio de datos masivos para con esa manera llegar a concluciones verdaderas y efectuar predicaciones razonables de ellos.

A QUE SE LE LLAMA INDIVIDUO O UNIDAD ESTADISTICA:
se le llama individuo a cada unidad o a cada uno de los elementos que componen la poblacion estadistica el individuo es entre observable que no tiene porque ser una persona; puede ser un objeto.

POBLACION:
tambien llamado universo es cualquier coleccion de individuos o grupos que practicamente se utilizan en estadistica como una muestra y tambien es la muestra mas utilizada para resolver cualquier problema estadistico.

MUESTRA:
es un grupo de poblacion que debe representar a todo un grupo.

PARAMETRO:
variable que en la poblacion sirve para identificar cada uno de ellos mediante su valor numerico.

ESTIMADOR O ESTADISTICO:
es una caracteristica cuyo valor queremos evaluar empleando para ello una muestra establecida por una unidad de muestreo.

VARIABLE Y SU CLASIFICACION:
se refiere a una caracteristica que se mide en el estudio

VARIABLE CONTINUA:
llamada tambien variable cuantitativa es aquella variable cuyo dominio puede asumir una cantidad infinita no numerables de distintos valores.

VARIABLE DISCRETA:
tiene un numero limitado de valores

ESCALA NOMINAL:
solo permite asignar nombre a los datos.

ESCALA ORDINAL:
permite asignar orden ademas de nombre
ESCALA DE INTERVALO:
es la que permite calcular diferencias ademas de asignar nombres y orden
ESCALA DE RAZON:permite calcular posiciciones ademas de diferencias

Que es una variable

una variable es un dato que cambia y existen dos tipos de variable cualitativa y cuantitativa.

comentario:
la variable es si es un dato que no va ser siempre el mismo osea que ese dato puede ser cualquier cantidad

variable cualitativa:
determinan la cualidad, representan una cualidad atributo o caracteristica que clasifica a cada caso en una de varias categorias se dividen en 2 clases: nominales, ordinales.

variable cuantitativa :
informacion relativa a un poblacion que se expresa en cantidades numericas pueden ser continuas o discretas.

comentario:
las variables cualitativas expresan cualidades en si de determinada muestra en cambio las vaiables cuantitativas son las que son contables.

la variable cualitativa tiene 2 diviciones como lo son: NOMINALES Y ORDINALES

NOMINALES:
son una forma de observar o medir datos se ajustan por categorias que, no matienen ninguna relacion de orden entre si por ejemplo: color de ojos, sexo profesion, presencia o ausencia.
ORDINALES:
en las escalas utilizadas existe un cierto orden o jerarquia entre categorias por ejemplo: grado de importancia, grado academico.

comentario:
las escalas nominales son en si datos que identifican cualidades y las ordinales son en si titulos obtenidos.


viernes, 14 de marzo de 2008

´comentario de teorema de Chebyshev

este es un teorema que practicamente se puede aplicar en cualquier tipo de datos estadisticos pero este teorema solo nos indica que porcentajes deben caer dentro de ciertos limites pero la mayoria de veces el porcentaje que cae es mayor al que nos dice el teorema de chebyshev pero nos dice que este teorema es mas comun mente utilizado en lo que son las muestras como poblaciones ya que es lo mas comun que se utiliza para muestreo.