Este documento describe la estadística como la ciencia que estudia la recolección, análisis e interpretación de datos. Se divide en estadística descriptiva, que resume y describe datos, y estadística inferencial, que genera modelos e inferencias sobre poblaciones basadas en muestras. También explica brevemente cómo generar números aleatorios en Excel usando las funciones ALEATORIO e ENTERO.
1. Científicos relacionados con la estadística<br />La estadística es una ciencia que estudia la recolección, análisis e interpretación de datos, ya sea para ayudar en la resolución de la toma de decisiones o para explicar condiciones regulares o irregulares de algún fenómeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadística es más que eso, en otras palabras es el vehículo que permite llevar a cabo el proceso relacionado con la investigación científica.<br />Es transversal a una amplia variedad de disciplinas, desde la física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en áreas de negocios o instituciones gubernamentales.<br />La estadística se divide en dos grandes áreas:<br />La estadística descriptiva, se dedica a los métodos de recolección, descripción, visualización y resumen de datos originados a partir de los fenómenos de estudio. Los datos pueden ser resumidos numérica o gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide poblacional, clúster, entre otros.<br />La estadística inferencia, se dedica a la generación de los modelos, inferencias y predicciones asociadas a los fenómenos en cuestión teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la población bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hipótesis), estimaciones de características numéricas (estimación), pronósticos de futuras observaciones, descripciones de asociación (correlación) o moldeamiento de relaciones entre variables (análisis de regresión). Otras técnicas de moldeamiento incluyen anova, series de tiempo y minería de datos.<br />Ambas ramas (descriptiva e inferencia) comprenden la estadística aplicada. Hay también una disciplina llamada estadística matemática, a la que se refiere a las bases teóricas de la materia. La palabra «estadísticas» también se refiere al resultado de aplicar un algoritmo estadístico a un conjunto de datos, como en estadísticas económicas, estadísticas criminales, entre otros.<br />Los métodos estadístico-matemáticos emergieron desde la teoría de probabilidad, la cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian Huygens (1657) da l primer tratamiento científico que se conoce a la materia. El Ars coniectandi (póstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de Abraham de Moivre estudiaron la materia como una rama de las matemáticas.[1] En la era moderna, el trabajo de Kolmogórov ha sido un pilar en la formulación del modelo fundamental de la Teoría de Probabilidades, el cual es usado a través de la estadística.<br />La teoría de errores se puede remontar a la Ópera miscellánea (póstuma, 1722) de Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el cual aplica por primera vez la teoría de la discusión de errores de observación. La reimpresión (1757) de este trabajo incluye el axioma de que errores positivos y negativos son igualmente probables y que hay unos ciertos límites asignables dentro de los cuales se encuentran todos los errores; se describen errores continuos y una curva de probabilidad.<br />Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la combinación de observaciones desde los principios de la teoría de probabilidades. Laplace representó la ley de probabilidades de errores mediante una curva y dedujo una fórmula para la media de tres observaciones. También, en 1871, obtiene la fórmula para la ley de facilidad del error (término introducido por Lagrange, 1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del máximo producto de las probabilidades de un sistema de errores concurrentes.<br />El método de mínimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808), y Carl Friedrich Gauss (1809). Gauss había usado el método en su famosa predicción de la localización del planeta enano Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837), Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). La fórmula de Peters para r, el probable error de una observación simple es bien conocido.<br />El siglo XIX incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoraron la presentación de la teoría. Adolphe Quetelet (1796-1874), fue otro importante fundador de la estadística y quien introdujo la noción del «hombre promedio» (l’homme moyen) como un medio de entender los fenómenos sociales complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.<br />Generador de números aleatorios en la calculadora y en Excel<br />Un número aleatorio es un componente o funcionalidad que crea números o símbolos para un programa software en una forma que carezca de un patrón evidente, y que así parezcan ser números aleatorios.<br />La mayor parte de los generadores de números aleatorios son, en realidad, pseudoaleatorios: se calcula (o introduce internamente) un valor X0, que llamaremos semilla, y, a partir de él, se van generando X1, X2, X3,...<br />Siempre que se parta de la misma semilla, se obtendrá la misma secuencia de valores.<br />El algoritmo básico es el método congruencial123, que genera valores en el intervalo [0,1), mediante el siguiente esquema: Se fijan A, B, enteros positivos (deben tener ciertas propiedades para obtener un buen generador), y, a partir de una semilla X0 en el conjunto 0,1,...,(N-1), se generan X1 = A*X0+B (mod N) X2 = A*X1+B (mod N) X3 = A*X2+B (mod N) ... X(k+1) = A*Xk+B (mod N) ...<br />Donde A*X+B (mod N) es el resto de la división entera de A*X+B entre N. Por ejemplo, 16 (mod 7) es 2.<br />A partir del método congruencia, es posible tomar valores pseudoaleatorios en el intervalo [0,1) como sigue: Se toma N, entero, muy grande, se toman A, B adecuados, y una semilla X0 en 0,1,.., (N-1). A partir de ella, se generan X1, X2, X3,... por el método congruencia, y a partir de ellos, Y0, Y1, Y2, Y3,... mediante la fórmula Yk = Xk /N<br />El método base es el método congruencia de generación de números en el conjunto <br />Para ello, se toman A, B enteros adecuados, se indica un valor inicial (semilla) X0 en el conjunto, y se aplica el esquema recursivo<br />, , ,..., <br />Donde por XmodN indica el resto de la división entera de X entre N. Por ejemplo, 12mod7 = 5<br />Si se conoce cómo generar valores en es posible generar valores en el intervalo [0,1), como sigue: Se toma N, muy grande, entero, se toma una semilla, y se construye la secuencia obtenida aplicando la expresión Yk = Xk / N<br />¿CÓMO PUEDO GENERAR NÚMEROS ALEATORIOS?<br />La lógica nos hace pensar que las personas somos generadores aleatorios imperfectos, hay estudios que demuestran que existen tendencias claras en los humanos para la elaboración de secuencias sesgadas y están relacionadas con características personales, con los conocimientos o informaciones previas o con la edad<br />Podemos aprovecharnos de situaciones reales para obtener una tabla de números aleatorios, como la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones. <br />Métodos manuales, lanzamiento de monedas, lanzamientos de dados, dispositivos mecánicos, dispositivos electrónicos<br />Métodos de computación analógica, son métodos que dependen de ciertos procesos físicos aleatorios, por ejemplo, el comportamiento de una corriente eléctrica.<br />Métodos de computación digital, cuando se usa el ordenador digital.<br />Tablas de bibliotecas, son números aleatorios que se han publicado; de los cuales podemos encontrar listas en los libros de probabilidad y tablas de matemáticas. Estos números fueron generados por alguno de los métodos de computación analógica.<br />Números aleatorios con Excel<br />Para conseguir números aleatorios con Excel, tenemos que utilizar las funciones: ENTERO y ALEATORIO. <br />- Función ALEATORIO (), genera un número al azar entre cero y uno y no tiene argumentos<br />-Función ENTERO (valor) que devuelve la parte entera de un número decimal.<br />Vamos a plantear un ejemplo real de números aleatorios: simular una combinación de la lotería primitiva; en los que hay que escoger 6 números de entre 49 números.<br />-Si utilizamos la función: ALEATORIO (), esta sólo nos devolverá un número decimal entre el 0 y el 1, ambos incluidos. Para nuestro caso, hay que hacer algunos ajustes en esa fórmula. Si multiplicamos cualquiera de esos números aleatorios comprendidos entre 0 y 1 por 49 y le sumamos 1, obtendremos números decimales con parte entera mayor o igual que 1 y menor o igual que 49. =ALEATORIO ()*49+1 <br />En general, si queremos generar números aleatorios entre a y b la fórmula que se aplica es: =ALEATORIO ()*(b-a)+a. <br />-De esos números decimales lo único que nos interesa es la parte entera. Para prescindir de la parte decimal recurrimos a la función ENTERO, que escribe sólo la parte entera de un número. Y La función final es: ENTERO (ALEATORIO ()*49+1)<br />Nota que si quieres hallar números aleatorios entre [aba], lo único que tienes que hacer es cambiar el 49 por otro (b-a) y el 1 por a. <br />Las últimas versiones de Excel cuentan con la función: ALEATORIO.ENTRE (Inferior; Superior) que genera directamente un aleatorio entre inferior y superior. <br />