Localizacion de fallas y monitoreo del sistema
IntegrantesRoció Abreu                                 2009 – 3393Hugo Armando Sánchez             2007 - 0012          Frank David De La Cruz             2009 - 3395
Aspectos básicos en la solución de problemas en Linux.Examina los síntomas.Examina lo obvio.Trabaje partiendo de lo simple a lo complejo.Hardware o Software.Sistema Operativo ó Aplicación.Examine los archivos de registro.Examinar la configuración.Use tantos recursos como sea posible.Documentar sus soluciones.
HardwareObtenerinformación de la RAMcat /proc/meminfocat /proc/meminfo | head -n 1
Obtenerinformación de la CPUcat /proc/cpuinfo
Chequea la temperatura de tu CPUcat /proc/acpi/thermal_zone/THRM/temperature
Lista de dispositivos PCI y USBPCI                                                               USBlspcilsusb
Echa un vistazo a la cantidad de espacio en disco duro que quedadf -h
Vea los discos duros detectadossudo fdisk -l
Los archivos de registro del sistemaSi usted está teniendo problemas generales del sistema o si está teniendo problemas con los servicios del sistema principal, tales como DNS o NFS, debe revisar el archivo de registro del sistema principal, que se encuentra en /var/log/messages.Archivos de registro para una aplicación también se puede encontrar en el directorio /var/log/var/log/messagesMar 22 14:41:16 system kernel: /home is out of disk space
Otros registros importantes son:/var/log/dmesg/var/log/boot.log/var/log/lastlog/var /log/maillog/var/log/cron
Resolviendo problemas en el proceso de Booteo
Etapas del proceso de booteo de Linux
Analizando algunos errores en el proceso de booteoMotherboard
Memoria
Periféricos
Subsistemas de discos duros
Otras tarjetas y periféricos Analizando algunos errores en el proceso de SoftwareMBR
Iniciación del Kernel
Proceso initUso de la utilidad fsck
Comandos del recursos del sistemaTop
SetSerialUtilizando un disco de booteoBoot disk
Root/Rescue disk
Utility diskPasos para crear un disco de booteo de rescatemke2fs  /dev/fd0
mount–t ext2  /dev/fd0 /mnt
–db /boot/* /mnt
boot - /dev/fd0 Root- /dev/hda1/sbin/lilo  -C /mnt/lilo.conf.Resolviendo problemas de software y de red
Problemas de logeoUsuario/Contraseña
Red
Servicios de logeo del servidor
Problemas de la cuentaPermisos de Archivos y directorios
Problemas de Impresora
Problemas de correoUsuario/Contraseña
Direccionamiento de Email
Configuración
RedProblemas del paquete de software
Errores:en el backup y en la restauraciónLos fallos de copia de seguridad son comunes, pero son problemas graves que debes enfrentar inmediatamente.
Hardware de copia de seguridadLa mayoría de los errores de copia de seguridad son causados ​​por los errores en los medios de escritura, lo que significa que la aplicación para la copia de seguridad no pudo escribir en la cinta durante la operación.
Software de copia de seguridadLos errores de una mala configuración y el software también pueden hacer que su copia de seguridad fracase. Cuando se produce un fallo de seguridad, su primera tarea debe ser examinar los registros de copia de seguridad.Posibleserrores: Configuracion en el esquema del backup.
Configuracion de la retención.
Usuariosesténusando los archivos.
Problemas con el CRON.
Errores en la restauración de archivosLa aplicación de copia de seguridad debe tener los permisos adecuados para restaurar una archivo en un directorio particular.El archivo restaurado tiene el mismo nombre que el original.No hay suficiente espacio en el disco duro.

Localizacion de fallas