1. Centro de Ciencias de la Salud
Departamento de Optometría
Maestría en Rehabilitación Visual
METODOS ESTADISTICOS
Conociendo el Software R
Profesor:
Dr. Rogelio Salinas Gutiérrez
Alumna:
Opt. Melissa P. García Félix
20 de Febrero del 2014
2. Índice
• Conociendo al Software R…………………………………………..……………………………………………..3
• Origen histórico del Software R
¿De dónde proviene R y para qué fue hecho?.....................................................................................4
• Tipo de licencia “GNU General Public License” de R.
¿Cuánto se debe pagar por utilizar R?.………………………………………………………………………....7
• Uso del software R en instituciones educativas y centros de investigación.
¿Quién usa R y por qué?...........................................................................................................................8
• Ventajas y desventajas del software R.
¿Qué tanto vale la pena usar R?.............................................................................................................9
• Conclusiones………………………………………………………………………………………………………..11
• Referencias……………………………………………………………………………………………………….....12
2
3. Conociendo el Software R
Objetivo
Conocer el Software R, su origen histórico, así como su tipo de licencia e instituciones educativas
que utilizan dicho programa; además de sus ventajas y desventajas para saber el porque se usa
este programa estadístico.
3
4. Origen histórico del Software R
¿De dónde proviene R y para qué fue hecho?
Ross Ihaka es Profesor Asociado de Estadística en la
Universidad de Auckland, que se reconoce, junto con
Robert Gentleman, como uno de los creadores del
lenguaje de programación R (1996); el cual es un
sistema para análisis estadísticos y gráficos, que es
altamente reconocido y que además recibió la Real
Sociedad de Nueva Pickering Medalla de Zelanda en
2008.
R tiene una naturaleza doble de programa y lenguaje de programación y es considerado como un
dialecto del lenguaje S creado por los Laboratorios AT&T Bell.
S esta disponible como el programa S-PLUS comercializado por Insightful. Existen diferencias importantes
en el diseño de R y S
R toma mucho del lenguaje S, desarrollado por Rick Becker, John Chambers y colegas en Bell Labs en los
años setentas y ochentas. Los creadores describen a S como un lenguaje y un ambiente de
programación interactiva para el análisis de datos y graficación.
Sin embargo, R no es S. Las diferencias principales entre los lenguajes son resultado de la herencia de
Scheme, fundamentalmente el manejo de la memoria y el acceso a las variables dependiendo de
donde fueron definidas. Se distinguen también en el manejo del color, áreas de graficación, rotulación
matemática, etc.
4
5. • En agosto de 1993 y lo anunciaron en la lista de distribución s-news. En respuesta recibieron
comentarios de varios interesados sobre su ambiente. El mas persistente fue Martin Machler de ETH
Zurich quien los animo a liberar el código fuente como Software libre.
• En junio de 1995 los autores deciden distribuir R bajo licencia general de la fundación GNU de
software libre. En marzo de 1996 se crean tres listas de distribución de mensajes para anuncios,
desarrollo y ayuda sobre R.
Desde entonces la pagina principal del proyecto R es:
http://www.r-project.org/
• Ese mismo año se publica el artculo donde se anuncia a R formalmente.
• A partir de la creación de las listas de distribución la aportación de mejoras, sugerencias y
aplicaciones se hizo tan frecuente que Ihaka, Gentleman y Machler no respondan con la rapidez
necesaria.
• A mediados de 1997 se creo un grupo de desarrollo mas amplio, R-core, el único autorizado a
modificar el código fuente. Actualmente el grupo cuenta con 18 miembros, incluyendo al mismo
John Chambers, y estadísticos como Brian Ripley, de Oxford University.
Algunas fechas importantes en el desarrollo de R:
• En febrero de 2000 sale finalmente la versión 1.0 de R
• En 2001 se publica el primer numero de R-News, revista electrónica dedicada a la discusión y
anuncios de nuevos procedimientos y paquetes de R; la revista es reemplazada por R -Journal en el
2009.
5
7. Tipo de licencia “GNU General Public License” de R.
¿Cuánto se debe pagar por utilizar R?
R se distribuye gratuitamente bajo los términos de la GNU General Public Licence; su desarrollo y
distribución son llevados a cabo por varios estadísticos conocidos como el Grupo Nuclear
de Desarrollo de R.
R esta disponible en varias formas:
El código fuente escrito principalmente en C (y algunas rutinas en Fortran), esencialmente para
maquinas Unix y Linux, o como archivos binarios precompilados para Windows, Linux (Debian,
Mandrake, RedHat, SuSe), Macintosh y Alpha Unix.
Los archivos necesarios para instalar R, ya sea desde las fuentes o binarios pre-compilados, se
distribuyen desde el sitio de internet Comprehensive R Archive Network (CRAN) junto con las
instrucciones de instalación. Para las diferentes distribuciones de Linux (Debian, . . . ), los binarios
están disponibles generalmente para las versiones más actualizadas de estas y de R.
Finalmente, para garantizar que R sea siempre software libre de código abierto, se creo R
foundation, que entre sus objetivos están:
1. Avanzar el proyecto R para calculo estadístico que provea de software libre y código abierto
para el análisis de datos y graficas.
2. Guardar y administrar los derechos de copia de R y su documentación.
7
8. Uso del software R en instituciones educativas y centros de investigación.
¿Quién usa R y por qué?
El Software o sistema R es también el nombre de un popular lenguaje de programación utilizado por
un número creciente de analistas de datos dentro de las empresas y el mundo académico.
R es similar al de otros lenguajes de programación, como C, Java y Perl, ya que ayuda a las personas
realizan una amplia variedad de tareas de computación , dándoles acceso a los distintos comandos
. Para los estadísticos; por lo tanto, R es particularmente útil , ya que contiene una serie de
mecanismos integrados para organizar los datos, ejecutar cálculos en la información, además de la
creación de representaciones gráficas de los conjuntos de datos EN DIVERSAS ESPECIALIDADES
(Medicina, Finanzas, Biología, Bioestadística, Economía etc.), Y GRAN CANTIDAD DE EMPRESAS para
monitorear la producción y utilidad de algún producto o estudio en especifico.
Resulta muy útil por su gran ayuda a su rápida explicación, comprensión y aceptación; ya que
estadísticos , ingenieros, licenciados y científicos pueden mejorar el código del software o escribir
variaciones para tareas específicas, además de que los paquetes escritos para R añaden los
algoritmos avanzados, colores y gráficos con texturas y técnicas fáciles de profundizar en las bases
de datos .
Se usa con mucha frecuencia ya que el lenguaje, paquetes y ambiente de programación, le
redundará la capacidad de cuestionar y contestar con confianza el cálculo con datos.
Además de que "La exploración de los datos con las preguntas correctas y respuestas confiables son
fundamentales para el análisis de datos"
8
9. Ventajas y desventajas del software R.
¿Qué tanto vale la pena usar R?
VENTAJAS
• En el desarrollo de R están involucrados científicos de primer nivel tanto en el lado estadístico como
de computo lo que garantiza un software de excelencia.
• Es sin duda el software estadística mas empleado en investigación estadística, pero también en
otras áreas como finanzas, medicina y psicología.
• El R-core ha creado una serie de procedimientos que ha hecho sencilla la participación de la
gente aunque se tengan pocos elementos de computo.
• Basta saber un poco de R para poder colaborar con paquetes de su área de especialidad.
• El carácter de colaboración abierta por medio de paquetes se refleja en la posición que ocupa R
en la frontera de la investigación.
• Por el mismo carácter de colaboración, la información de apoyo es muy extensa. La redes de
comunicación incluye listas de discusión a varios niveles; documentos de distribución libre que
explican a distintos niveles generalidades y detalles de R
9
10. • Se distribuye bajo licencia GNU. El software es libre y de código abierto. Es decir, R es gratis y si lo
desea, tiene disponible el código para modificarlo. Es el mismo caso para la mayora de los
paquetes disponibles
• R esta compilado y disponible para los sistemas operativos mas populares: distintas versiones de
Linux, Mac OS X y Windows 32 y 64 bits.
• R le ofrece un ambiente que permite llevar a cabo sus ideas sin limitarlas únicamente a los
procedimientos incluidos en su aplicación estadística
DESVENTAJAS
• Requiere de conocimiento básicos de programación y estadística para operarlo, ejecutarlo y
comprenderlo.
• Existen programas menos complejos de utilizar con un producto final muy similar al programa R.
• No tiene la capacidad de interactuar con Excel.
• El sistema GNU tiene limitaciones, por ser versión gratuita.
10
11. Conclusiones
• R es un lenguaje de alto nivel y un ambiente para el análisis de datos y graficacion, creado por Ross
Ihaka y Robert Gentleman.
• Su diseño sigue la sintaxis de S pero el manejo de memoria y la manera de evaluar lo hace mas
eficientemente como Scheme.
• En el desarrollo actual de R colaboran investigadores de primer nivel estadístico y en computación.
• Entre otras razones de porque aprender R se enuncian:
1.
2.
3.
4.
5.
Es de excelente calidad.
Es libre y de código abierto
Es un proyecto por colaboración por lo que hay mucho material de apoyo y ayuda.
Gran variedad de paquetes.
El sistema le ofrece la facilidad para que usted realizar procedimiento y si as lo considera, contribuya
al acervo de R.
6. Por ultimo, R se enriquece con la colaboración de personas literalmente de todo el mundo.
7. Ofrece mayor cantidad de ventajas que desventajas.
11
12. Referencias
• R: Un lenguaje para análisis de datos y graficacion
Ernesto Barrios Zamudio, 2010
• Material Didáctico Maestría en Rehabilitación Visual
Plataforma de Métodos Estadísticos
• Introducción al uso y programación del sistema estadístico R.
Ramón Díaz Uriarte, http://cran.r-project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf
• Google Académico
http://www.slideshare.net/ODISDIER/introduccion-al-programa-r
http://csg.sph.umich.edu/docs/R/graphics-1.pdf
12