SlideShare una empresa de Scribd logo
1 de 37
Linux RHC030

Modulo 8. Herramientas de Procesos de String

Relator : Cristian Leiva
Linux

1
Unidad 8 – Herramientas de Procesos de
String
 Conteo de palabras y codificación de texto
 Búsqueda de Texto: grep
 Introducción a las expresiones regulares
 Ordenando todo: sort y uniq
 Extraer y reunir texto: cut y paste
 Rastreo de diferencias: diff
 Traducción de texto: tr
 Revisión ortográfica: aspell
 Formatear texto (fmt) y dividir archivos (split)
© 2007 Linux. Todos los derechos reservados.

2
Conteo de palabras y codificación de texto

 Conceptos Claves

 Cuando se almacena texto, los equipos transforman los caracteres en
una representación numérica. Este proceso se conoce como
codificación del texto.
 A fin de cubrir las demandas de una variedad de idiomas, se han
desarrollado diversas técnicas de codificación. Estas técnicas están
representados por una variedad de conjuntos de caracteres.
 La técnica de codificación más prevalente y antigua se conoce como
el conjunto de caracteres ASCII, el cual sirve aún como el denominador
menos común entre otras técnicas.
 El comando wc cuenta el número de caracteres, palabras y líneas en
un archivo. Cuando se aplica a datos estructurados, el comando wc
puede convertirse en una herramienta versátil de conteo.
 El comando cat tiene opciones que permiten la representación de
caracteres de no impresión tal como el caracter NEWLINE.
 Los comandos head y tail tienen opciones que le permiten imprimir
sólo un cierto número de líneas o un cierto número de bytes de un
archivo, (un byte suele correlacionarse con un caracter).
© 2007 Linux. Todos los derechos reservados.

3
Codificación
 Codificación de Datos
– Convertir la información en valores numéricos es llamada
codificación de los datos.
 Codificación de Texto
– Codificación ASCII simplemente toma las letras, números y
comunes caracteres de puntuacion Inglés (los que se
encuentran en un teclado), y los asigna a un número entero
entre 0 y 255.
 Unicode (UCS)
– Supera las limitaciones de ASCII e ISO 8859 basado en
tecnicas de codificación.
 Unicode Transformation Format (UTF-8)
–Balance entre la flexibilidad de Unicode, y la viabilidad de
ASCII, con: longitud variable de codificación.
© 2007 Linux. Todos los derechos reservados.

4
Visualización de secuencias de control
 Los archivos de texto de Linux (y Unix) por lo general se
adhieren a la convención de que el último caracter del archivo
debe ser un avance de línea para la última línea de texto.
 El comando cat indica la presencia de la presencia de
tabulaciones, avances de línea y otras secuencias de control
[student@station student]$ cat -A /etc/hosts
# Do not remove the following line, or various programs$
# that require network functionality will fail.$
127.0.0.1^Ilocalhost.localdomain^Ilocalhost station.example.com $
127.0.0.1^Irha-server$
[student@station student]$ head –n2 /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.
[student@station student]$
© 2007 Linux. Todos los derechos reservados.

7
Comando Word Count (wc)
 El comando wc cuenta el numero de caracteres, palabras y
lineas.
 Tomará su entrada ya sea de archivos llamados en su línea
de comandos o desde su entrada estándar.
wc [-c] [-l] [-w] [filename…]

© 2007 Linux. Todos los derechos reservados.

8
Búsqueda de Texto: grep
 Conceptos Claves
 grep es un comando que imprime en pantalla líneas coincidentes
con un patrón de una cadena de texto especificado.
 grep suele utilizarse como filtro para reducir salida a sólo lo
deseado.
 grep -r buscará de modo recursivo bajo un directorio
determinado.
 grep -v imprime líneas NO coincidentes con una cadena o patrón
de texto.
 Muchas de las opciones permiten a los usuarios especificar el
formato de salida de grep.

© 2007 Linux. Todos los derechos reservados.

9
Búsqueda de contenido de archivo de texto
 grep: general regular expression parser

 Herrramienta útil para la búsqueda de palabras específicas
o secuencias de caracteres en el contenido de archivo de
texto.
 Hay en realidad tres nombres diferentes para la
herramienta grep
–fgrep

•Hace una búsqueda rápida de patrones simples. Utilice este
comando para localizar rápidamente patrones sin caracteres
comodines, útil para buscar una palabra común.
–grep

•Búsqueda de patrones con expresiones regulares comunes.
–egrep

•Búsqueda de patrones con expresiones regulares extendidas de
gran alcance.
© 2007 Linux. Todos los derechos reservados.

10
grep

© 2007 Linux. Todos los derechos reservados.

11
Muestra todas las ocurrencias de una cadena
de texto en un archivo
[student]$ cat file
This file has some words.
It also has even more words.
[student]$ grep even file
It also has even more words.
[student]$
[student]$ echo Every cat has one tail. > general
[student]$ echo No cat has nine tails. > specific
[student]$ echo Therefore, every cat has ten tails. > fallacy
[student]$ grep cat general specific fallacy
general:Every cat has one tail.
specific:No cat has nine tails.
fallacy:Therefore, every cat has ten tails.
[student]$
© 2007 Linux. Todos los derechos reservados.

12
Obtención de números de línea
[student]$ fgrep -n dictionary
/usr/share/dict/words 12526:dictionary
[student]$ fgrep -nr dictionary /usr/share/dict
linux.words:12526:dictionary
words:12526:dictionary

© 2007 Linux. Todos los derechos reservados.

13
Ignorar mayúsculas o minúsculas
[student]$ cat rhyme
The cat
sat on
the mat
at home.
[student]$ grep the rhyme
the mat
[student]$ grep -in the rhyme
1:The cat
3:the mat
© 2007 Linux. Todos los derechos reservados.

14
Expresiones Regulares (cont.)
 Una expresión regular es una secuencia de:
–Caracteres literales
–Comodines
–Modificadores
–Anclas

Comodines literales
Caracteres
 Modificadores
 Anclas

–Los modificador comodines coinciden con cualquier
–Los caracteres literales coinciden únicamente
–Un caracteres altera el significado del caracter con
–Las anclas establecen el expresión, un el patrón tal
contexto para punto
caracter. Dentro deletras, dígitos ejemplo, la (“.”) los
ellos mismos. Las una
patrón precedente inmediato. Por y la mayoría de
como "el comienzo de caracter, ya sea
línea" o "el final espacio,
coincide con cualquieruna de caracteresunde una
caracteres son coincide
expresión “ab*c”ejemploscon cadenas deliterales
texto “ac”,
palabra". Por dígito, puntuación, cualquier cosa.
ejemplo, la expresión “cat” coincidiría
una letra, un “abbbc”lasasí sucesivamente porque el
“abc”,a continuación y excepciones).
(vea “abbc”,
con cualquier ocurrencia de las tres letras mientras
asterisco (“*”) es un modificador que significa
que “^cat” sólo coincidirían con las líneas que
“cualquier número de (incluyendo cero)”.
comienzan por “cat”.

© 2007 Linux. Todos los derechos reservados.

17
Ordenando todo: sort y uniq
 Conceptos clave
 El comando sort clasifica datos en orden alfabético.
 sort -n ordena numéricamente.
 sort -u clasifica y suprime duplicados.
 sort -k y -t clasifica en un campo específico en datos en patrones.

© 2007 Linux. Todos los derechos reservados.

20
El comando sort
 En su forma más simple, el comando sort clasificará
en orden alfabético líneas
[madonna@station madonna]$ cat /etc/sysconfig/mouse
FULLNAME="Generic - 2 Button Mouse (PS/2)"
MOUSETYPE="ps/2"
XEMU3="yes"
XMOUSETYPE="PS/2"
DEVICE=/dev/psaux
[madonna@station madonna]$ sort /etc/sysconfig/mouse
DEVICE=/dev/psaux
FULLNAME="Generic - 2 Button Mouse (PS/2)"
MOUSETYPE="ps/2"
XEMU3="yes"
XMOUSETYPE="PS/2"
© 2007 Linux. Todos los derechos reservados.

21
Opciones para especificar el orden de
clasificación

© 2007 Linux. Todos los derechos reservados.

22
Sort Order
[madonna@station madonna]$ ls -s /var/log/m* | sort
1236

/var/log/maillog.4

20

/var/log/maillog

216

/var/log/messages.3

3104

/var/log/maillog.1

4

/var/log/messages

[madonna@station madonna]$ ls -s /var/log/m* | sort -n
4

/var/log/messages

20

/var/log/maillog

216

/var/log/messages.3

1236

/var/log/maillog.4

3104

/var/log/maillog.1
© 2007 Linux. Todos los derechos reservados.

23
Sort Keys
Opciones para especificar teclas de clasificación

[madonna@station madonna]$ head /etc/passwd | sort -t: -k6
bin:x:1:1:bin:/bin:/sbin/nologin

En resumen, hemos visto que el comando sort
puede utilizarse para clasificar datos estructurados,
mediante la opción -k para especificar el campo de
clasificación(quizás más de una vez) y la opción -t
para especificar el delimitador del campo.

news:x:9:13:news:/etc/news:
[madonna@station madonna]$ ls -l /var/log/m* | sort -n -k5
root:x:0:0:root:/root:/bin/bash
-rw------- 1 root root
651 Oct 5 05:40 /var/log/messages
sync:x:5:0:sync:/sbin:/bin/sync
-rw------- 1 root root
31187 Oct 5 06:05 /var/log/maillog
halt:x:7:0:halt:/sbin:/sbin/halt
-rw------- 1 root root
216885 Sep 22 10:22 /var/log/messages.3
daemon:x:2:2:daemon:/sbin:/sbin/nologin
-rw------- 1 root root
387345 Oct 5 04:07 /var/log/messages.1
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
-rw------- 1 root root
567049 Sep 14 04:08 /var/log/messages.4
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin

© 2007 Linux. Todos los derechos reservados.

24
El comando uniq
 El programa uniq se utiliza para identificar, contar o suprimir
registros duplicados en la información clasificada.

© 2007 Linux. Todos los derechos reservados.

25
Conteo de instancias de datos
 Los switches de parametros -d y -u permiten que el comando uniq
identifique un dato unico o repetido (-c permite contar ocurrencias)
[madonna@station madonna]$ sort -n -u
[madonna@station madonna]$ sort -n trial0 | uniq trial1 | uniq -c

4

14
[madonna@station madonna]$ head trial1

16

45
10
66

10
[madonna@station madonna]$ sort -n trial1 | uniq -d

5

10 7

10

10 8

6

1313
9

7

138
10

8

9 11
8

9

1310
12

10

4 13

10

8 14

8

4 15

6
1 16
2 17
2 18

© 2007 Linux. Todos los derechos reservados.

26
Extraer y reunir texto: cut y paste
 Conceptos clave
 El comando cut extrae textos de archivos de texto, basados
en columnas especificadas por bytes, caracteres o campos.
 El comando paste fusiona dos archivos de texto por línea.

© 2007 Linux. Todos los derechos reservados.

27
Extracción del texto con cut
 El comando cut extrae columnas de texto desde un archivo
de texto
Opciones para el comando cut.

Especificaciones de intervalo

© 2007 Linux. Todos los derechos reservados.

28
Extracción de texto por posición de
caracter con cut -c
[student]$ cat /proc/interrupts
CPU0
0:

4477340

XT-PIC timer

1:

25250

XT-PIC keyboard

2:

0

XT-PIC cascade

3:

7344

XT-PIC ehci-hcd

[student]$ grep '[[:digit:]]:' /proc/interrupts | cut -c1-15
0:

4512997

1:

27954

2:

0

3:

7344

[student]$ grep '[[:digit:]]:' /proc/interrupts | cut -c1-5,340: timer
1: keyboard
2: cascade
3: ehci-hcd

© 2007 Linux. Todos los derechos reservados.

29
Extracción de campos de texto con cut -f
 El comando cut también sirve para extraer texto que no está
estructurado por la posición de caracteres, sino por un
caracter delimitador tal como un TABULADOR o “:”.

[student@rosemont hwdata]$ head -15 pcitable
[student@rosemont hwdata]$ cut -s -f3,4 pcitable | head
# This file is automatically generated from isys/pci.
"unknown"
"Dynalink|IS64PH ISDN Adapter"
0x0675 0x1700 "unknown"
"Dynalink|IS64PH ISDN Adapter"
"hisax"
"Dynalink|IS64PH ISDN Adapter"
0x0675 0x1702 "hisax"
"Dynalink|IS64PH ISDN Adapter"
"unknown"
"Arris|CM 200E Cable Modem"
0x09c1 0x0704 "unknown"
"Arris|CM 200E Cable Modem“

© 2007 Linux. Todos los derechos reservados.

30
Comando paste
 El comando paste sirve para combinar archivos múltiples en
una sola salida.
[student@station student]$ cat file-1
File-1 Line 1
File-1 Line 2
File-1 Line 3
[student@station student]$ cat file-2
File-2 Line 1
File-2 Line 2
File-2 Line 3
student@station student]$ paste file-1 file-2
File-1 Line 1

File-2 Line 1

File-1 Line 2

File-2 Line 2

File-1 Line 3

File-2 Line 3

© 2007 Linux. Todos los derechos reservados.

31
Rastreo de diferencias: diff
 Conceptos clave
 El comando diff resume las diferencias entre dos
archivos.
 El comando diff es compatible con una gran variedad
de formatos de salida que pueden escogerse mediante
varias opciones.
Al comando diff se le puede pedir que ignore ciertos
tipos de diferencias tales como el uso de espacios en
blanco o de mayúsculas.
 El comando diff -r resume de modo recursivo las
diferencias entre los dos directorios.
 Al comparar directorios, se le puede pedir al comando
diff que ignore los archivos cuyos nombres de archivo
coincidan con patrones especificados.
© 2007 Linux. Todos los derechos reservados.

32
Comando diff
 El comando diff está diseñado para comparar dos archivos
similares, pero no idénticos y que generen salida que describa
exactamente la diferencia.
[blondie]$ diff README.pam_ftp.orig README.pam_ftp
11,12c11,12
<
<

could login only with email adress
"ignore"

allow invalid email adresses

-->
>

could login only with email address
"ignore"

allow invalid email addresses

18a19
> Spelling corrections applied by blondie, 22 Sep 2003

© 2007 Linux. Todos los derechos reservados.

33
Opciones para especificar el formato de
salida diff

© 2007 Linux. Todos los derechos reservados.

34
Traducción de texto: tr
 Conceptos clave
 El comando tr traduce lectura de datos desde la entrada estándar.
 En su forma más básica, el comando tr realiza sustituciones byte
por byte.
 Al utilizar la opción -d, el comando tr borrará caracteres
especificados desde un flujo.
 Al utilizar la opción -s se comprimirá una serie de caracteres
repetidos en un flujo a una sola instancia del caracter.

© 2007 Linux. Todos los derechos reservados.

35
Comando tr
 El comando tr es una utilidad muy versátil que realiza
traducciones de caracter en flujos.
 Traducir puede suponer sustituir un caracter por otro,
borrar caracteres o "comprimirlos" (contrayendo
secuencias repetidas de un caracter en uno).
 El comando tr no espera nombres de archivo como
argumentos.
 el comando tr opera exclusivamente en el flujo de
entrada estándar, reservando los argumentos de línea de
comandos para especificar conversiones.
© 2007 Linux. Todos los derechos reservados.

36
Uso de tr para traducir caracteres
 tr command expects to be called with two arguments, each of
which specify a range of characters
[madonna@rosemont madonna]$ echo "abcdefghi" | tr fed xyz
abczyxghi

[madonna@rosemont madonna]$ cat /etc/hosts
# Do not remove the following line, or various programs
# that require network functionality will fail.
127.0.0.1

localhost.localdomain localhost rha-server

[madonna@rosemont madonna]$ tr a-z A-Z < /etc/hosts
# DO NOT REMOVE THE FOLLOWING LINE, OR VARIOUS PROGRAMS
# THAT REQUIRE NETWORK FUNCTIONALITY WILL FAIL.
127.0.0.1

LOCALHOST.LOCALDOMAIN LOCALHOST RHA-SERVER
© 2007 Linux. Todos los derechos reservados.

37
Revisión ortográfica: aspell
 Conceptos clave
– El comando aspell -c realiza revisiones ortográficas
interactivas en los archivos.
– El comando aspell -l realiza una revisión ortográfica en
el flujo de entrada estándar.
– El comando aspell dump puede utilizarse para ver el
maestro del sistema o el directorio personal de un
usuario.
– Los comandos aspell create personal y aspell merge
personal pueden utilizarse para crear o añadirse al
directorio personal del usuario de una lista de palabras.

© 2007 Linux. Todos los derechos reservados.

38
Using aspell
 aspell es el utilitario primario para revisar la ortografía de los
archivos de texto.
[prince@station prince] aspell -c toelvis
Hey Elvis!
I heard you were about to take the lab test for the string
procesing workbook in Red Hat Academy. IIRC, its prety
straightforward, if you've been keeping up with the exercises.
LOL, Prince
=========================================
1) processing

6) preceding

2) precessing

7) professing

3) precising

8) promising

4) proceeding

9) proposing

5) prosing
i) Ignore

I) Ignore all

r) Replace

R) Replace all

a) Add

x) Exit

=========================================
?

© 2007 Linux. Todos los derechos reservados.

39
Formatear texto (fmt) y dividir
archivos (split)
 Conceptos clave
 El comando fmt puede reformatear texto a diferentes
anchuras.
 Al usar la opción -p, el comando fmt sólo reformateará texto
comenzado por el prefijo especificado, preservando el prefijo.
 El comando split puede utilizarse para dividir un archivo
sencillo en múltiples archivos basados en un número de líneas
o en un número de bytes.

© 2007 Linux. Todos los derechos reservados.

40
Comando fmt
 Al igual que la mayoría de los comandos de procesador
de texto encontrados en este cuaderno, el comando
fmt interpreta argumentos como nombres de archivos
en los cuales operar, u operar en entrada estándar si
ninguno es provisto. Su salida se escribe a la salida
estándar.
[elvis@station elvis]$ fmt -w60 side_effect.gvim

One side effect of the variety of text editors in Linux,
and in particular the coexistence of text editors and
word processors, is the inconsistencies with which word
wrapping is handled.
[elvis@station elvis]$ fmt -40 side_effect.gvim
One side effect of the variety of text
editors in Linux, and in particular the
coexistence of text editors and word
processors, is the inconsistencies with
which word wrapping is handled.
© 2007 Linux. Todos los derechos reservados.

41
Comando split
 Es usado cuando se desea dividir un archivo en
archivos más pequeños, cada uno con un número
especificado de líneas o bytes.
elvis@station elvis]$ split -200 pointless.txt sub_pointless_
[elvis@station elvis]$ wc sub_pointless_a*
200

1800

8892 sub_pointless_aa

200

1800

9000 sub_pointless_ab

200

1800

9000 sub_pointless_ac

200

1800

9000 sub_pointless_ad

200

1800

9001 sub_pointless_ae

66

594

3036 sub_pointless_af

1066

9594 47929 total

© 2007 Linux. Todos los derechos reservados.

42
© 2007 Linux. Todos los derechos reservados.

43

Más contenido relacionado

La actualidad más candente

La actualidad más candente (17)

11 suplemments
11 suplemments11 suplemments
11 suplemments
 
Introduccion a Python. Clase 1
Introduccion a Python. Clase 1Introduccion a Python. Clase 1
Introduccion a Python. Clase 1
 
Ficheros C++
Ficheros C++Ficheros C++
Ficheros C++
 
Archivos de Cabecera.
Archivos de Cabecera.Archivos de Cabecera.
Archivos de Cabecera.
 
Introduccion a Python. Clase 3
Introduccion a Python. Clase 3Introduccion a Python. Clase 3
Introduccion a Python. Clase 3
 
Ficheros de cabecera
Ficheros de cabecera Ficheros de cabecera
Ficheros de cabecera
 
Manejo de archivosss
Manejo de archivosssManejo de archivosss
Manejo de archivosss
 
PUNTEROS (APUNTADORES) EN C++
PUNTEROS (APUNTADORES) EN C++PUNTEROS (APUNTADORES) EN C++
PUNTEROS (APUNTADORES) EN C++
 
Introduccion a Python. Clase 2
Introduccion a Python. Clase 2Introduccion a Python. Clase 2
Introduccion a Python. Clase 2
 
Gestion de archivos
Gestion de archivosGestion de archivos
Gestion de archivos
 
Arreglos Turbo C
Arreglos Turbo CArreglos Turbo C
Arreglos Turbo C
 
Flex y bison
Flex y bisonFlex y bison
Flex y bison
 
Flex y Bison
Flex y BisonFlex y Bison
Flex y Bison
 
Tuberías (PIPES). EN GNU-LINUX-CENTOS ::: http://leymebamba.com
Tuberías (PIPES).  EN GNU-LINUX-CENTOS  ::: http://leymebamba.comTuberías (PIPES).  EN GNU-LINUX-CENTOS  ::: http://leymebamba.com
Tuberías (PIPES). EN GNU-LINUX-CENTOS ::: http://leymebamba.com
 
Curso prog sist
Curso prog sistCurso prog sist
Curso prog sist
 
57 Php. Funciones De Compresion
57 Php. Funciones De Compresion57 Php. Funciones De Compresion
57 Php. Funciones De Compresion
 
Manejo archivos
Manejo archivosManejo archivos
Manejo archivos
 

Destacado

Successful positioning of Univention in the market from a partners point of view
Successful positioning of Univention in the market from a partners point of viewSuccessful positioning of Univention in the market from a partners point of view
Successful positioning of Univention in the market from a partners point of viewUnivention GmbH
 
Ost 1 11941 75
Ost 1 11941 75Ost 1 11941 75
Ost 1 11941 75maishai75
 
Ost 1 10019 80
Ost 1 10019 80Ost 1 10019 80
Ost 1 10019 80maishai75
 
Ost 1 11345 74
Ost 1 11345 74Ost 1 11345 74
Ost 1 11345 74maishai75
 
Ost 1 12892 77
Ost 1 12892 77Ost 1 12892 77
Ost 1 12892 77maishai75
 
Los Cerveceros
Los CervecerosLos Cerveceros
Los CervecerosIsabellaOM
 
Bullying sec. tec. 138
Bullying sec. tec. 138Bullying sec. tec. 138
Bullying sec. tec. 138nena35
 
Ost 1 00640 73
Ost 1 00640 73Ost 1 00640 73
Ost 1 00640 73maishai75
 
Adicción a la televisión
Adicción a la televisiónAdicción a la televisión
Adicción a la televisiónAnto Alpusig
 
I Maratón Fotografía digital Andzelika Pastwa
I Maratón Fotografía digital Andzelika PastwaI Maratón Fotografía digital Andzelika Pastwa
I Maratón Fotografía digital Andzelika Pastwafilolacabrera
 
Manuales de como crear servidores en DreamWeaver
Manuales de como crear servidores en DreamWeaverManuales de como crear servidores en DreamWeaver
Manuales de como crear servidores en DreamWeaverCristo Esquivel Pinal
 
Pwer resumen clase 9 regulación ans (1)
Pwer resumen clase 9 regulación ans (1)Pwer resumen clase 9 regulación ans (1)
Pwer resumen clase 9 regulación ans (1)Daniel Lopez Hormazabal
 
La historia de los lumière
La historia de los lumièreLa historia de los lumière
La historia de los lumièredanielvivarrios
 
Ost 1 10964 73
Ost 1 10964 73Ost 1 10964 73
Ost 1 10964 73maishai75
 

Destacado (20)

Successful positioning of Univention in the market from a partners point of view
Successful positioning of Univention in the market from a partners point of viewSuccessful positioning of Univention in the market from a partners point of view
Successful positioning of Univention in the market from a partners point of view
 
Diccionario informatico11
Diccionario informatico11Diccionario informatico11
Diccionario informatico11
 
Ost 1 11941 75
Ost 1 11941 75Ost 1 11941 75
Ost 1 11941 75
 
Ost 1 10019 80
Ost 1 10019 80Ost 1 10019 80
Ost 1 10019 80
 
Ost 1 11345 74
Ost 1 11345 74Ost 1 11345 74
Ost 1 11345 74
 
Ost 1 12892 77
Ost 1 12892 77Ost 1 12892 77
Ost 1 12892 77
 
Los Cerveceros
Los CervecerosLos Cerveceros
Los Cerveceros
 
Bullying sec. tec. 138
Bullying sec. tec. 138Bullying sec. tec. 138
Bullying sec. tec. 138
 
Paradigmas emergentes
Paradigmas emergentesParadigmas emergentes
Paradigmas emergentes
 
images(1)
images(1)images(1)
images(1)
 
Ost 1 00640 73
Ost 1 00640 73Ost 1 00640 73
Ost 1 00640 73
 
Adicción a la televisión
Adicción a la televisiónAdicción a la televisión
Adicción a la televisión
 
Clase 5 -resumen trabajo en equipo
 Clase 5 -resumen trabajo en equipo Clase 5 -resumen trabajo en equipo
Clase 5 -resumen trabajo en equipo
 
I Maratón Fotografía digital Andzelika Pastwa
I Maratón Fotografía digital Andzelika PastwaI Maratón Fotografía digital Andzelika Pastwa
I Maratón Fotografía digital Andzelika Pastwa
 
Manuales de como crear servidores en DreamWeaver
Manuales de como crear servidores en DreamWeaverManuales de como crear servidores en DreamWeaver
Manuales de como crear servidores en DreamWeaver
 
Pwer resumen clase 9 regulación ans (1)
Pwer resumen clase 9 regulación ans (1)Pwer resumen clase 9 regulación ans (1)
Pwer resumen clase 9 regulación ans (1)
 
BBQ3101 SEJARAH
BBQ3101 SEJARAHBBQ3101 SEJARAH
BBQ3101 SEJARAH
 
La historia de los lumière
La historia de los lumièreLa historia de los lumière
La historia de los lumière
 
Aprendizaje colaborativo
Aprendizaje colaborativoAprendizaje colaborativo
Aprendizaje colaborativo
 
Ost 1 10964 73
Ost 1 10964 73Ost 1 10964 73
Ost 1 10964 73
 

Similar a 8 herramientas de procesos de string

Similar a 8 herramientas de procesos de string (20)

Comandos linux
Comandos linuxComandos linux
Comandos linux
 
Quasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIXQuasi - Comandos básicos para UNIX
Quasi - Comandos básicos para UNIX
 
Comandos linux
Comandos linuxComandos linux
Comandos linux
 
Comandoslinux
ComandoslinuxComandoslinux
Comandoslinux
 
Linux ud3 - redireccionamiento y tuberias
Linux   ud3 - redireccionamiento y tuberiasLinux   ud3 - redireccionamiento y tuberias
Linux ud3 - redireccionamiento y tuberias
 
Taller Linea de Comandos - Linuxec 29o
Taller Linea de Comandos - Linuxec 29oTaller Linea de Comandos - Linuxec 29o
Taller Linea de Comandos - Linuxec 29o
 
Agilidad en shell de linux
Agilidad en shell de linuxAgilidad en shell de linux
Agilidad en shell de linux
 
Introduction to linux for bioinformatics
Introduction to linux for bioinformaticsIntroduction to linux for bioinformatics
Introduction to linux for bioinformatics
 
Curso Bash 1
Curso Bash 1Curso Bash 1
Curso Bash 1
 
Script Linux
Script LinuxScript Linux
Script Linux
 
Curso prog sist
Curso prog sistCurso prog sist
Curso prog sist
 
Bash Tips Tricks Campus
Bash Tips Tricks CampusBash Tips Tricks Campus
Bash Tips Tricks Campus
 
Compiladores
CompiladoresCompiladores
Compiladores
 
01 practicas de laboratorio
01 practicas de laboratorio01 practicas de laboratorio
01 practicas de laboratorio
 
15 iniciacion gnu_linux
15 iniciacion gnu_linux15 iniciacion gnu_linux
15 iniciacion gnu_linux
 
Semana 9 entradas salidas estandar y pipes
Semana 9 entradas salidas estandar y pipesSemana 9 entradas salidas estandar y pipes
Semana 9 entradas salidas estandar y pipes
 
Comandos de uso frecuente
Comandos de uso frecuenteComandos de uso frecuente
Comandos de uso frecuente
 
Tarea 3
Tarea 3Tarea 3
Tarea 3
 
Lenguaje Ensamblador
Lenguaje EnsambladorLenguaje Ensamblador
Lenguaje Ensamblador
 
Practica1 complemento comandos
Practica1  complemento comandosPractica1  complemento comandos
Practica1 complemento comandos
 

Más de Juan Camilo

Instalación de un sistema Voip corporativo basado en asterisk
Instalación de un sistema Voip corporativo basado en asteriskInstalación de un sistema Voip corporativo basado en asterisk
Instalación de un sistema Voip corporativo basado en asteriskJuan Camilo
 
10 network applications
10 network applications10 network applications
10 network applicationsJuan Camilo
 
9 managing processes
9  managing processes9  managing processes
9 managing processesJuan Camilo
 
7 standard io and pipes
7 standard io and pipes7 standard io and pipes
7 standard io and pipesJuan Camilo
 
5 the linux filesystem
5 the linux filesystem5 the linux filesystem
5 the linux filesystemJuan Camilo
 
4 file ownerships and permissions
4 file ownerships and permissions4 file ownerships and permissions
4 file ownerships and permissionsJuan Camilo
 
3 users and groups
3   users and groups3   users and groups
3 users and groupsJuan Camilo
 
2 filesystem basics
2 filesystem basics2 filesystem basics
2 filesystem basicsJuan Camilo
 

Más de Juan Camilo (11)

Instalación de un sistema Voip corporativo basado en asterisk
Instalación de un sistema Voip corporativo basado en asteriskInstalación de un sistema Voip corporativo basado en asterisk
Instalación de un sistema Voip corporativo basado en asterisk
 
10 network applications
10 network applications10 network applications
10 network applications
 
9 managing processes
9  managing processes9  managing processes
9 managing processes
 
7 standard io and pipes
7 standard io and pipes7 standard io and pipes
7 standard io and pipes
 
6 la shell bash
6 la shell bash6 la shell bash
6 la shell bash
 
5 the linux filesystem
5 the linux filesystem5 the linux filesystem
5 the linux filesystem
 
4 file ownerships and permissions
4 file ownerships and permissions4 file ownerships and permissions
4 file ownerships and permissions
 
3 users and groups
3   users and groups3   users and groups
3 users and groups
 
2 filesystem basics
2 filesystem basics2 filesystem basics
2 filesystem basics
 
11 suplemments
11 suplemments11 suplemments
11 suplemments
 
1 quick tours
1 quick tours1 quick tours
1 quick tours
 

Último

4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTESaraNolasco4
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfssuser50d1252
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadJonathanCovena1
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024gharce
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfvictorbeltuce
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...YobanaZevallosSantil1
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDUgustavorojas179704
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docxLuisAndersonPachasto
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaLuis Minaya
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Rosabel UA
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfssuser50d1252
 

Último (20)

4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE4º SOY LECTOR PART2- MD  EDUCATIVO.p df PARTE
4º SOY LECTOR PART2- MD EDUCATIVO.p df PARTE
 
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdfFichas de MatemáticA QUINTO DE SECUNDARIA).pdf
Fichas de MatemáticA QUINTO DE SECUNDARIA).pdf
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la Sostenibilidad
 
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
SISTEMA INMUNE FISIOLOGIA MEDICA UNSL 2024
 
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdfMapa Mental de estrategias de articulación de las areas curriculares.pdf
Mapa Mental de estrategias de articulación de las areas curriculares.pdf
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO  YESSENIA 933623393 NUEV...
IV SES LUN 15 TUTO CUIDO MI MENTE CUIDANDO MI CUERPO YESSENIA 933623393 NUEV...
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDUFICHA DE MONITOREO Y ACOMPAÑAMIENTO  2024 MINEDU
FICHA DE MONITOREO Y ACOMPAÑAMIENTO 2024 MINEDU
 
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docxEDUCACION FISICA 1°  PROGRAMACIÓN ANUAL 2023.docx
EDUCACION FISICA 1° PROGRAMACIÓN ANUAL 2023.docx
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
 
PPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptxPPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptx
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Earth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversaryEarth Day Everyday 2024 54th anniversary
Earth Day Everyday 2024 54th anniversary
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 
Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024Actividad transversal 2-bloque 2. Actualización 2024
Actividad transversal 2-bloque 2. Actualización 2024
 
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdfFichas de matemática DE PRIMERO DE SECUNDARIA.pdf
Fichas de matemática DE PRIMERO DE SECUNDARIA.pdf
 

8 herramientas de procesos de string

  • 1. Linux RHC030 Modulo 8. Herramientas de Procesos de String Relator : Cristian Leiva Linux 1
  • 2. Unidad 8 – Herramientas de Procesos de String  Conteo de palabras y codificación de texto  Búsqueda de Texto: grep  Introducción a las expresiones regulares  Ordenando todo: sort y uniq  Extraer y reunir texto: cut y paste  Rastreo de diferencias: diff  Traducción de texto: tr  Revisión ortográfica: aspell  Formatear texto (fmt) y dividir archivos (split) © 2007 Linux. Todos los derechos reservados. 2
  • 3. Conteo de palabras y codificación de texto  Conceptos Claves  Cuando se almacena texto, los equipos transforman los caracteres en una representación numérica. Este proceso se conoce como codificación del texto.  A fin de cubrir las demandas de una variedad de idiomas, se han desarrollado diversas técnicas de codificación. Estas técnicas están representados por una variedad de conjuntos de caracteres.  La técnica de codificación más prevalente y antigua se conoce como el conjunto de caracteres ASCII, el cual sirve aún como el denominador menos común entre otras técnicas.  El comando wc cuenta el número de caracteres, palabras y líneas en un archivo. Cuando se aplica a datos estructurados, el comando wc puede convertirse en una herramienta versátil de conteo.  El comando cat tiene opciones que permiten la representación de caracteres de no impresión tal como el caracter NEWLINE.  Los comandos head y tail tienen opciones que le permiten imprimir sólo un cierto número de líneas o un cierto número de bytes de un archivo, (un byte suele correlacionarse con un caracter). © 2007 Linux. Todos los derechos reservados. 3
  • 4. Codificación  Codificación de Datos – Convertir la información en valores numéricos es llamada codificación de los datos.  Codificación de Texto – Codificación ASCII simplemente toma las letras, números y comunes caracteres de puntuacion Inglés (los que se encuentran en un teclado), y los asigna a un número entero entre 0 y 255.  Unicode (UCS) – Supera las limitaciones de ASCII e ISO 8859 basado en tecnicas de codificación.  Unicode Transformation Format (UTF-8) –Balance entre la flexibilidad de Unicode, y la viabilidad de ASCII, con: longitud variable de codificación. © 2007 Linux. Todos los derechos reservados. 4
  • 5. Visualización de secuencias de control  Los archivos de texto de Linux (y Unix) por lo general se adhieren a la convención de que el último caracter del archivo debe ser un avance de línea para la última línea de texto.  El comando cat indica la presencia de la presencia de tabulaciones, avances de línea y otras secuencias de control [student@station student]$ cat -A /etc/hosts # Do not remove the following line, or various programs$ # that require network functionality will fail.$ 127.0.0.1^Ilocalhost.localdomain^Ilocalhost station.example.com $ 127.0.0.1^Irha-server$ [student@station student]$ head –n2 /etc/hosts # Do not remove the following line, or various programs # that require network functionality will fail. [student@station student]$ © 2007 Linux. Todos los derechos reservados. 7
  • 6. Comando Word Count (wc)  El comando wc cuenta el numero de caracteres, palabras y lineas.  Tomará su entrada ya sea de archivos llamados en su línea de comandos o desde su entrada estándar. wc [-c] [-l] [-w] [filename…] © 2007 Linux. Todos los derechos reservados. 8
  • 7. Búsqueda de Texto: grep  Conceptos Claves  grep es un comando que imprime en pantalla líneas coincidentes con un patrón de una cadena de texto especificado.  grep suele utilizarse como filtro para reducir salida a sólo lo deseado.  grep -r buscará de modo recursivo bajo un directorio determinado.  grep -v imprime líneas NO coincidentes con una cadena o patrón de texto.  Muchas de las opciones permiten a los usuarios especificar el formato de salida de grep. © 2007 Linux. Todos los derechos reservados. 9
  • 8. Búsqueda de contenido de archivo de texto  grep: general regular expression parser  Herrramienta útil para la búsqueda de palabras específicas o secuencias de caracteres en el contenido de archivo de texto.  Hay en realidad tres nombres diferentes para la herramienta grep –fgrep •Hace una búsqueda rápida de patrones simples. Utilice este comando para localizar rápidamente patrones sin caracteres comodines, útil para buscar una palabra común. –grep •Búsqueda de patrones con expresiones regulares comunes. –egrep •Búsqueda de patrones con expresiones regulares extendidas de gran alcance. © 2007 Linux. Todos los derechos reservados. 10
  • 9. grep © 2007 Linux. Todos los derechos reservados. 11
  • 10. Muestra todas las ocurrencias de una cadena de texto en un archivo [student]$ cat file This file has some words. It also has even more words. [student]$ grep even file It also has even more words. [student]$ [student]$ echo Every cat has one tail. > general [student]$ echo No cat has nine tails. > specific [student]$ echo Therefore, every cat has ten tails. > fallacy [student]$ grep cat general specific fallacy general:Every cat has one tail. specific:No cat has nine tails. fallacy:Therefore, every cat has ten tails. [student]$ © 2007 Linux. Todos los derechos reservados. 12
  • 11. Obtención de números de línea [student]$ fgrep -n dictionary /usr/share/dict/words 12526:dictionary [student]$ fgrep -nr dictionary /usr/share/dict linux.words:12526:dictionary words:12526:dictionary © 2007 Linux. Todos los derechos reservados. 13
  • 12. Ignorar mayúsculas o minúsculas [student]$ cat rhyme The cat sat on the mat at home. [student]$ grep the rhyme the mat [student]$ grep -in the rhyme 1:The cat 3:the mat © 2007 Linux. Todos los derechos reservados. 14
  • 13. Expresiones Regulares (cont.)  Una expresión regular es una secuencia de: –Caracteres literales –Comodines –Modificadores –Anclas Comodines literales Caracteres  Modificadores  Anclas –Los modificador comodines coinciden con cualquier –Los caracteres literales coinciden únicamente –Un caracteres altera el significado del caracter con –Las anclas establecen el expresión, un el patrón tal contexto para punto caracter. Dentro deletras, dígitos ejemplo, la (“.”) los ellos mismos. Las una patrón precedente inmediato. Por y la mayoría de como "el comienzo de caracter, ya sea línea" o "el final espacio, coincide con cualquieruna de caracteresunde una caracteres son coincide expresión “ab*c”ejemploscon cadenas deliterales texto “ac”, palabra". Por dígito, puntuación, cualquier cosa. ejemplo, la expresión “cat” coincidiría una letra, un “abbbc”lasasí sucesivamente porque el “abc”,a continuación y excepciones). (vea “abbc”, con cualquier ocurrencia de las tres letras mientras asterisco (“*”) es un modificador que significa que “^cat” sólo coincidirían con las líneas que “cualquier número de (incluyendo cero)”. comienzan por “cat”. © 2007 Linux. Todos los derechos reservados. 17
  • 14. Ordenando todo: sort y uniq  Conceptos clave  El comando sort clasifica datos en orden alfabético.  sort -n ordena numéricamente.  sort -u clasifica y suprime duplicados.  sort -k y -t clasifica en un campo específico en datos en patrones. © 2007 Linux. Todos los derechos reservados. 20
  • 15. El comando sort  En su forma más simple, el comando sort clasificará en orden alfabético líneas [madonna@station madonna]$ cat /etc/sysconfig/mouse FULLNAME="Generic - 2 Button Mouse (PS/2)" MOUSETYPE="ps/2" XEMU3="yes" XMOUSETYPE="PS/2" DEVICE=/dev/psaux [madonna@station madonna]$ sort /etc/sysconfig/mouse DEVICE=/dev/psaux FULLNAME="Generic - 2 Button Mouse (PS/2)" MOUSETYPE="ps/2" XEMU3="yes" XMOUSETYPE="PS/2" © 2007 Linux. Todos los derechos reservados. 21
  • 16. Opciones para especificar el orden de clasificación © 2007 Linux. Todos los derechos reservados. 22
  • 17. Sort Order [madonna@station madonna]$ ls -s /var/log/m* | sort 1236 /var/log/maillog.4 20 /var/log/maillog 216 /var/log/messages.3 3104 /var/log/maillog.1 4 /var/log/messages [madonna@station madonna]$ ls -s /var/log/m* | sort -n 4 /var/log/messages 20 /var/log/maillog 216 /var/log/messages.3 1236 /var/log/maillog.4 3104 /var/log/maillog.1 © 2007 Linux. Todos los derechos reservados. 23
  • 18. Sort Keys Opciones para especificar teclas de clasificación [madonna@station madonna]$ head /etc/passwd | sort -t: -k6 bin:x:1:1:bin:/bin:/sbin/nologin En resumen, hemos visto que el comando sort puede utilizarse para clasificar datos estructurados, mediante la opción -k para especificar el campo de clasificación(quizás más de una vez) y la opción -t para especificar el delimitador del campo. news:x:9:13:news:/etc/news: [madonna@station madonna]$ ls -l /var/log/m* | sort -n -k5 root:x:0:0:root:/root:/bin/bash -rw------- 1 root root 651 Oct 5 05:40 /var/log/messages sync:x:5:0:sync:/sbin:/bin/sync -rw------- 1 root root 31187 Oct 5 06:05 /var/log/maillog halt:x:7:0:halt:/sbin:/sbin/halt -rw------- 1 root root 216885 Sep 22 10:22 /var/log/messages.3 daemon:x:2:2:daemon:/sbin:/sbin/nologin -rw------- 1 root root 387345 Oct 5 04:07 /var/log/messages.1 shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown -rw------- 1 root root 567049 Sep 14 04:08 /var/log/messages.4 adm:x:3:4:adm:/var/adm:/sbin/nologin lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin mail:x:8:12:mail:/var/spool/mail:/sbin/nologin © 2007 Linux. Todos los derechos reservados. 24
  • 19. El comando uniq  El programa uniq se utiliza para identificar, contar o suprimir registros duplicados en la información clasificada. © 2007 Linux. Todos los derechos reservados. 25
  • 20. Conteo de instancias de datos  Los switches de parametros -d y -u permiten que el comando uniq identifique un dato unico o repetido (-c permite contar ocurrencias) [madonna@station madonna]$ sort -n -u [madonna@station madonna]$ sort -n trial0 | uniq trial1 | uniq -c 4 14 [madonna@station madonna]$ head trial1 16 45 10 66 10 [madonna@station madonna]$ sort -n trial1 | uniq -d 5 10 7 10 10 8 6 1313 9 7 138 10 8 9 11 8 9 1310 12 10 4 13 10 8 14 8 4 15 6 1 16 2 17 2 18 © 2007 Linux. Todos los derechos reservados. 26
  • 21. Extraer y reunir texto: cut y paste  Conceptos clave  El comando cut extrae textos de archivos de texto, basados en columnas especificadas por bytes, caracteres o campos.  El comando paste fusiona dos archivos de texto por línea. © 2007 Linux. Todos los derechos reservados. 27
  • 22. Extracción del texto con cut  El comando cut extrae columnas de texto desde un archivo de texto Opciones para el comando cut. Especificaciones de intervalo © 2007 Linux. Todos los derechos reservados. 28
  • 23. Extracción de texto por posición de caracter con cut -c [student]$ cat /proc/interrupts CPU0 0: 4477340 XT-PIC timer 1: 25250 XT-PIC keyboard 2: 0 XT-PIC cascade 3: 7344 XT-PIC ehci-hcd [student]$ grep '[[:digit:]]:' /proc/interrupts | cut -c1-15 0: 4512997 1: 27954 2: 0 3: 7344 [student]$ grep '[[:digit:]]:' /proc/interrupts | cut -c1-5,340: timer 1: keyboard 2: cascade 3: ehci-hcd © 2007 Linux. Todos los derechos reservados. 29
  • 24. Extracción de campos de texto con cut -f  El comando cut también sirve para extraer texto que no está estructurado por la posición de caracteres, sino por un caracter delimitador tal como un TABULADOR o “:”. [student@rosemont hwdata]$ head -15 pcitable [student@rosemont hwdata]$ cut -s -f3,4 pcitable | head # This file is automatically generated from isys/pci. "unknown" "Dynalink|IS64PH ISDN Adapter" 0x0675 0x1700 "unknown" "Dynalink|IS64PH ISDN Adapter" "hisax" "Dynalink|IS64PH ISDN Adapter" 0x0675 0x1702 "hisax" "Dynalink|IS64PH ISDN Adapter" "unknown" "Arris|CM 200E Cable Modem" 0x09c1 0x0704 "unknown" "Arris|CM 200E Cable Modem“ © 2007 Linux. Todos los derechos reservados. 30
  • 25. Comando paste  El comando paste sirve para combinar archivos múltiples en una sola salida. [student@station student]$ cat file-1 File-1 Line 1 File-1 Line 2 File-1 Line 3 [student@station student]$ cat file-2 File-2 Line 1 File-2 Line 2 File-2 Line 3 student@station student]$ paste file-1 file-2 File-1 Line 1 File-2 Line 1 File-1 Line 2 File-2 Line 2 File-1 Line 3 File-2 Line 3 © 2007 Linux. Todos los derechos reservados. 31
  • 26. Rastreo de diferencias: diff  Conceptos clave  El comando diff resume las diferencias entre dos archivos.  El comando diff es compatible con una gran variedad de formatos de salida que pueden escogerse mediante varias opciones. Al comando diff se le puede pedir que ignore ciertos tipos de diferencias tales como el uso de espacios en blanco o de mayúsculas.  El comando diff -r resume de modo recursivo las diferencias entre los dos directorios.  Al comparar directorios, se le puede pedir al comando diff que ignore los archivos cuyos nombres de archivo coincidan con patrones especificados. © 2007 Linux. Todos los derechos reservados. 32
  • 27. Comando diff  El comando diff está diseñado para comparar dos archivos similares, pero no idénticos y que generen salida que describa exactamente la diferencia. [blondie]$ diff README.pam_ftp.orig README.pam_ftp 11,12c11,12 < < could login only with email adress "ignore" allow invalid email adresses --> > could login only with email address "ignore" allow invalid email addresses 18a19 > Spelling corrections applied by blondie, 22 Sep 2003 © 2007 Linux. Todos los derechos reservados. 33
  • 28. Opciones para especificar el formato de salida diff © 2007 Linux. Todos los derechos reservados. 34
  • 29. Traducción de texto: tr  Conceptos clave  El comando tr traduce lectura de datos desde la entrada estándar.  En su forma más básica, el comando tr realiza sustituciones byte por byte.  Al utilizar la opción -d, el comando tr borrará caracteres especificados desde un flujo.  Al utilizar la opción -s se comprimirá una serie de caracteres repetidos en un flujo a una sola instancia del caracter. © 2007 Linux. Todos los derechos reservados. 35
  • 30. Comando tr  El comando tr es una utilidad muy versátil que realiza traducciones de caracter en flujos.  Traducir puede suponer sustituir un caracter por otro, borrar caracteres o "comprimirlos" (contrayendo secuencias repetidas de un caracter en uno).  El comando tr no espera nombres de archivo como argumentos.  el comando tr opera exclusivamente en el flujo de entrada estándar, reservando los argumentos de línea de comandos para especificar conversiones. © 2007 Linux. Todos los derechos reservados. 36
  • 31. Uso de tr para traducir caracteres  tr command expects to be called with two arguments, each of which specify a range of characters [madonna@rosemont madonna]$ echo "abcdefghi" | tr fed xyz abczyxghi [madonna@rosemont madonna]$ cat /etc/hosts # Do not remove the following line, or various programs # that require network functionality will fail. 127.0.0.1 localhost.localdomain localhost rha-server [madonna@rosemont madonna]$ tr a-z A-Z < /etc/hosts # DO NOT REMOVE THE FOLLOWING LINE, OR VARIOUS PROGRAMS # THAT REQUIRE NETWORK FUNCTIONALITY WILL FAIL. 127.0.0.1 LOCALHOST.LOCALDOMAIN LOCALHOST RHA-SERVER © 2007 Linux. Todos los derechos reservados. 37
  • 32. Revisión ortográfica: aspell  Conceptos clave – El comando aspell -c realiza revisiones ortográficas interactivas en los archivos. – El comando aspell -l realiza una revisión ortográfica en el flujo de entrada estándar. – El comando aspell dump puede utilizarse para ver el maestro del sistema o el directorio personal de un usuario. – Los comandos aspell create personal y aspell merge personal pueden utilizarse para crear o añadirse al directorio personal del usuario de una lista de palabras. © 2007 Linux. Todos los derechos reservados. 38
  • 33. Using aspell  aspell es el utilitario primario para revisar la ortografía de los archivos de texto. [prince@station prince] aspell -c toelvis Hey Elvis! I heard you were about to take the lab test for the string procesing workbook in Red Hat Academy. IIRC, its prety straightforward, if you've been keeping up with the exercises. LOL, Prince ========================================= 1) processing 6) preceding 2) precessing 7) professing 3) precising 8) promising 4) proceeding 9) proposing 5) prosing i) Ignore I) Ignore all r) Replace R) Replace all a) Add x) Exit ========================================= ? © 2007 Linux. Todos los derechos reservados. 39
  • 34. Formatear texto (fmt) y dividir archivos (split)  Conceptos clave  El comando fmt puede reformatear texto a diferentes anchuras.  Al usar la opción -p, el comando fmt sólo reformateará texto comenzado por el prefijo especificado, preservando el prefijo.  El comando split puede utilizarse para dividir un archivo sencillo en múltiples archivos basados en un número de líneas o en un número de bytes. © 2007 Linux. Todos los derechos reservados. 40
  • 35. Comando fmt  Al igual que la mayoría de los comandos de procesador de texto encontrados en este cuaderno, el comando fmt interpreta argumentos como nombres de archivos en los cuales operar, u operar en entrada estándar si ninguno es provisto. Su salida se escribe a la salida estándar. [elvis@station elvis]$ fmt -w60 side_effect.gvim One side effect of the variety of text editors in Linux, and in particular the coexistence of text editors and word processors, is the inconsistencies with which word wrapping is handled. [elvis@station elvis]$ fmt -40 side_effect.gvim One side effect of the variety of text editors in Linux, and in particular the coexistence of text editors and word processors, is the inconsistencies with which word wrapping is handled. © 2007 Linux. Todos los derechos reservados. 41
  • 36. Comando split  Es usado cuando se desea dividir un archivo en archivos más pequeños, cada uno con un número especificado de líneas o bytes. elvis@station elvis]$ split -200 pointless.txt sub_pointless_ [elvis@station elvis]$ wc sub_pointless_a* 200 1800 8892 sub_pointless_aa 200 1800 9000 sub_pointless_ab 200 1800 9000 sub_pointless_ac 200 1800 9000 sub_pointless_ad 200 1800 9001 sub_pointless_ae 66 594 3036 sub_pointless_af 1066 9594 47929 total © 2007 Linux. Todos los derechos reservados. 42
  • 37. © 2007 Linux. Todos los derechos reservados. 43

Notas del editor

  1. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  2. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  3. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  4. Se puede decir que las variantes de Bell (1era a 6ta= era una versión comercial continuada por AT&amp;T, y la versión de Berkley era una versión academica. Linux toma partes de cada una de estas ramas.
  5. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  6. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  7. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  8. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  9. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b
  10. [root@station station]# ls /boot boot.b lost+found System.map chain.b message System.map-2.4.21-9.EL config-2.4.21-9.EL message.ja vmlinux-2.4.21-9.EL grub module-info vmlinuz initrd-2.4.21-9.EL.img module-info-2.4.21-9.EL vmlinuz-2.4.21-9.EL kernel.h os2_d.b