2. Lenguaje C
¿Por qué punteros ahora?
De todos los libros de C que existen, creo que ninguno de ellos se atreve a enseñar el
tema de punteros al segundo capítulo. Sin embargo no conocer sobre punteros lo antes
posible creo que fue para muchos la razón por la que abandonaron el lenguaje C y le
temieron desde el principio.
Después de todo, hablar de Lenguaje C es casi como hablar de punteros. Esta en todas
partes del lenguaje y esta en todas sus librerías estándar. Casi todo tiene que ver con
ellos de una u otra forma. Y por desgracia, se requiere buena disciplina para usarlos.
Todo programador ( y administrador de red) novato se ha roto la cabeza intentando
explicarse porque un simple printf termina en una violación de segmento o porque no
compila su programa y se soluciona colocando caracteres extraños como & y *
Estoy convencido que mientras más rápido usemos los punteros, más rápido
aprenderemos el lenguaje C y menos errores sin sentido nos agobiaran al programar.
Conocer lo que hace a este lenguaje tan poderoso sin duda nos dará la mejor de las
ventajas
>>Fids
5. Lenguaje C
Script II – Punteros en C
>> Repasando las Variables
>> Usando Variables
>> Los operadores & y *&
>> Qué es un puntero
>> Puntero Endemoniado
>> Tipos de datos básicos para punteros
>> Asignación de punteros
>> Funciones en C
>> Paso de punteros a funciones
>> Punteros y Arrays
>> Punteros y Cadenas
>> Arrays de Punteros
>> Punteros a Punteros
>> Punteros NULL y VOID
>> Punteros constantes
>> Punteros a funciones
>> Callbacks
>> Bonus Track - Recomendaciones
6. Lenguaje C
REPASANDO LAS VARIABLES
Como ya sabemos, las variables en el
lenguaje C tienen 5 elementos que
debemos tener presente:
Nombre de la Variable
Tipo de Dato
Tamaño
Valor
Dirección de Memoria
Para comprender el uso de punteros es
indispensable conocer el uso de las
variables. Un error muy común es
desconocer la relación entre estos
elementos y como se almacenan
10
edad
int
0xf0113b1
32 bits
7. Lenguaje C
REPASANDO LAS VARIABLES
Para empezar a utilizar punteros en C,
debemos prestar especial atención a las
direcciones de memoria.
¿Oiga, no me estará engañando verdad?
Aunque parezca mentira, y a pesar de que
casi no las miramos, las direcciones de
memoria son la clave para entender las
bases del uso de punteros. Saber usar una
dirección de memoria y el valor de una
dirección de memoria es el quebradero de
cabeza mas común en miles de
programadores en todo el mundo.
Y la culpa no la tienen ellos…
10
edad
int
0xf0113b1
32 bits
8. Lenguaje C
USANDO VARIABLES
edad
int
¿Cómo acceder a los elementos de una variable?
Tanto el tipo de dato int como el nombre de la
variable edad no pueden ser accedidos de ninguna
manera. Esto se debe a que el Lenguaje C no
soporta características reflexivas que permitan
conocer detalles de las variables en tiempo de
ejecución.
Esto nos da a entender que somos responsables de
conocer bien todas las variables que utilizamos y de
conocer sus tipos de datos.
El resto de los elementos (tamaño, valor y dirección
de memoria) si pueden ser conocidos y accedidos
en tiempo de ejecución. Saber como hacerlo es el
primer paso para entender a los punteros
9. Lenguaje C
USANDO VARIABLES
edad
int
32 bits
¿Cómo saber el tamaño de una variable?
La función sizeof() nos permite calcular el tamaño
en bytes de una determinada variable. El resultado
debe ser multiplicado por 8 si queremos conocer el
valor en bits
10. Lenguaje C
USANDO VARIABLES
10
edad
int
32 bits
¿Cómo ver o alterar el valor de una variable?
Es broma !
Simplemente hacemos referencia a ella por su
nombre en cualquier asignación o función
11. Lenguaje C
USANDO VARIABLES
10
edad
int
0x7fff2960d0ac
32 bits
¿Cómo saber la dirección de memoria de una
variable?
Para saber la dirección de memoria de cualquier
variable debemos usar el signo ampersand (&)
ATENCION !
Las direcciones de memoria
cambian con cada ejecución
12. Lenguaje C
Los operadores & y *&
10 edad
int
0x7fff2960d0ac&
*&
¿Qué significan estos símbolos?
& = Referencia o Dirección de Memoria
*& = Dereferencia, Indirección, Valor de dirección de memoria, Valor Apuntado
13. Lenguaje C
Los operadores & y *&
10 edad
int
0x7f5f0ac
USO DE LOS OPERADORES
Estos operadores se usan con cualquier objeto en memoria (variables, estructuras, arrays,
funciones, etc), sin embargo no pueden ser aplicadas a expresiones, constantes o variables
del tipo register
El operador & nos devolverá la dirección de memoria. Así de simple
&edad 0x7f5f0ac
*&edad 10
0x7f5f0ac 10*
14. Lenguaje C
Los operadores & y *&
10 edad
int
0x7f5f0ac
&edad 0x7f5f0ac
*&edad 10
USO DE LOS OPERADORES
El operador * tiene varios usos. Uno de ellos es la Indirección el cual permite acceder al
valor guardado en una dirección de memoria.
Para efectuar una indirección es indispensable que el operador * se aplique a una dirección
de memoria (por ejemplo *0x7f5f0ac)
0x7f5f0ac 10*
15. Lenguaje C
Los operadores & y *&
DEMOSTRADO
La dirección de memoria se puede
obtener al usar el operador & en
cualquier variable
El operador de indirección (*) es
aplicado a direcciones de memoria
y permite acceder al valor
almacenado en ella
Las direcciones de memoria
pueden utilizarse en su forma
hexadecimal
Nota: Debido a que las direcciones memoria son asignadas en tiempo de
ejecución, no es sencillo saber que dirección ocupara una determinada variable.
Es por eso que se ha utilizado el depurador gdb para hacer esta demostración
16. Lenguaje C
Los operadores & y *&
10 edad
int
0x7f5f0ac
*&edad
0x7f5f0ac
*
10VALGAN VERDADES
A nadie en su sano juicio se le ocurrirá utilizar una dirección de memoria dentro del código
fuente. Ni que decir de la sentencia *&edad. ¿Para que alguien tendría que utilizar esta
extraña sintaxis cuando simplemente puede usar la variable con su simple nombre?.
edad = 10; // Este modo es el mas cuerdo
*&edad = 10; // A quien se le ocurriría usar esto por Dios !
*0x7f5f0ac = 10; // Definitivamente ya no tiene amigos
¿CUAL USARIAS ?
17. Lenguaje C
QUE ES UN PUNTERO
¿Recuerdan que nadie en su sano juicio usaría la sentencia así: *0x7f5f0ac?
Un puntero da solución a ese problema !. Conocer las direcciones de memoria brinda lo
que hace al lenguaje C tan potente y requerido: Su velocidad.
Un puntero es una variable especial capaz de guardar una dirección de memoria de tal
forma que no tenemos que recurrir a escribirlas dentro del código. Al poder guardar
cualquier dirección de memoria, un puntero puede tomar posesión de cualquier variable
de su tipo y literalmente jugar con ella
10 edad
int
0x7f5f0ac
0x7f5f0ac ptr
int*
0x503fb43
18. Lenguaje C
QUE ES UN PUNTERO
Examinando un Puntero
Un puntero es una variable, y como tal, tiene
todos los elementos de cualquier variable (tipo
de dato, nombre, tamaño y dirección de
memoria) . La única diferencia visible es que al
declararla, su tipo de dato debe ir acompañado
del símbolo *
Debido a que debe contener direcciones de
memoria, su tamaño debe ser lo suficientemente
grande para poder guardar cualquier dirección
de memoria del sistema operativo. Por esta razón
es muy común que su tamaño sea de 64 bits (8
bytes) que son suficientes para hacer referencia a
muchos terabytes de memoria
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
19. Lenguaje C
QUE ES UN PUNTERO
Declaración de un puntero
En mi humilde opinión, la confusión de muchos
programadores se debe a que el símbolo * se usa
para diferentes cosas, entre ellas para declarar
un puntero.
int *ptr = &edad;
*ptr = 19;
El código anterior demuestra la facilidad con la
que puede confundir a mas de un programador
puesto que se puede llegar erróneamente a
deducir que el puntero ptr puede guardar valores
como el 19 y direcciones de memoria como
&edad. Lo cual es peligroso asumir
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
20. Lenguaje C
QUE ES UN PUNTERO
Declaración de un puntero
A pesar que la gran mayoría utiliza la declaración
del modo int *ptr como la normal, usar la
siguiente declaración ayuda a evitar confundirla
con la indirección:
int* ptr = &edad;
*ptr = 19;
El código anterior separa claramente lo que es la
variable puntero ptr y lo que es la operación de
indirección al puntero ptr. Al parecer el estándar
C99 se percato de esto y recomendó crear tipos
de datos como intptr_t y uintptr_t que no hacen
mas que retirar el signo * de la declaración de un
puntero
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
21. Lenguaje C
QUE ES UN PUNTERO
DEMOSTRADO
Un puntero guarda direcciones de memoria. Así
mismo un puntero al ser una variable, tiene su
propia dirección de memoria
Con la indirección no solo accedemos al valor de
la variable apuntada, sino que también podemos
modificar su valor.
Un puntero obtiene su valor a partir de la
referencia de una variable que se consigue con el
operador &
El tamaño de un puntero puede ser obtenido
mediante la función sizeof()
22. Lenguaje C
PUNTERO ENDEMONIADO
¿Por qué los punteros tienen fama de ser
complicados?
La desventaja de los punteros es que debemos
ser muy disciplinados en su uso y no es tarea
fácil. Entre los errores mas comunes tenemos
• Punteros no inicializados
• Asignación de punteros errónea
• Punteros con tipos distintos
• Indirección errónea
• Uso incorrecto de punteros nulos
Como podrás apreciar, son muchas cosas las que
pueden ir mal, es por eso que los punteros
requieren especial atención y cuidado
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
23. Lenguaje C
PUNTERO ENDEMONIADO
Punteros no inicializados
Todo puntero ANTES de ser utilizado debe ser
inicializado apropiadamente. Es decir, su valor
debe ser NULO o debe contener la dirección de
memoria de una variable de su tipo de dato.
int edad = 10;
int* p;
*p = 19;
Si un puntero no esta inicializado y hace uso de la
operación indirección se produce una Violación
de Segmento y el programa terminará de forma
abrupta
24. Lenguaje C
PUNTERO ENDEMONIADO
Violación de Segmento
Lamentablemente cuando se declara un puntero,
toma como valor inicial una dirección aleatoria
usualmente fuera del segmento de memoria del
programa.
La Violación de Segmento se produce porque un
programa intenta modificar o acceder a un
segmento de memoria que no le corresponde. El
Sistema Operativo al detectar esta intrusión se
protege y detiene el programa ‘agresor’
indicando que ha violado un segmento que no le
corresponde.
25. Lenguaje C
PUNTERO ENDEMONIADO
Inicialización de puntero errónea
Otro error común es olvidar colocar el signo
ampersand (&) al inicializar un puntero.
Con ello se consigue que el puntero guarde el
valor de la variable y no su dirección de
memoria, la cual al ser accedida provoca una
violación de segmento
En el ejemplo que vemos, erróneamente le
estamos indicando que la dirección de memoria
guardada por ptr será la posición 0x10 (lo que
guarda la variable edad). Luego intentaremos
cambiar el valor de la posición 0x10 a 19 lo cual
produce un crash en nuestro programa
26. Lenguaje C
PUNTERO ENDEMONIADO
Punteros con tipos de datos distintos
Los punteros deben ser declarados según el
tipo de dato al que apuntarán.
Si un puntero apunta a una variable cuyo tipo
de dato es distinto puede convertirse en un
problema si el tamaño del tipo de dato al que
se apunta es menor.
En el ejemplo podemos ver un puntero de tipo
int haciendo referencia a la dirección de una
variable de tipo char. Esto conlleva a que se
produzca un desborde y el programa se
detenga por producir una violación de
segmento ya que ptr usara 4 bytes y no 1
27. Lenguaje C
PUNTERO ENDEMONIADO
Indirección errónea
Al ser la operación mas común de un puntero,
la indirección será errónea siempre y cuando la
declaración o incialización este mal hecha
La indirección en si misma no es un error. El
error viene al usarla en un contexto erróneo.
En el ejemplo podemos ver que la indirección
no produce una violación de segmento, pero
ha sido un error alterar el valor mediante la
indirección debido a que estamos desbordando
una variable de tipo char
28. Lenguaje C
PUNTERO ENDEMONIADO
Uso incorrecto de punteros nulos
El lenguaje C permite nulificar un puntero para
evitar acceder de forma accidental a otra
dirección de memoria fuera de nuestro
segmento permitido.
Sin embargo, veamos que pasa cuando no
utilizamos adecuadamente los punteros nulos
En el ejemplo podemos ver que a pesar de
poner un puntero a NULL podemos causar
problemas si realizamos una indirección. Esto
naturalmente tiene sentido debido a que la
dirección 0x0 (NULL) no puede ser alterada.
29. Lenguaje C
TIPOS DE DATOS BASICOS PARA PUNTEROS
¿Y a que tipos de datos puedo apuntar?
En realidad, podemos apuntar a cualquier
tipo de dato que usemos en el Lenguaje C
Los tipos de datos comunes suelen ser los
tipos de datos básicos a los cuales un
puntero podrá hacer referencia.
Incluso podemos usar el puntero void* que
nos permite apuntar a cualquier tipo de
dato. El resto de punteros solo puede
apuntar a su tipo de datos ( por ejemplo el
puntero float* solo podrá apuntar a variables
float, etc)
char*
int*
float*
double*
void*
30. Lenguaje C
ASIGNACION DE PUNTEROS
La clave en el uso de todo puntero es su correcta
asignación (inicialización).
La asignación de punteros es una operación que
permite indicar que dirección de memoria
tomará un puntero determinado.
Hay 2 tipos de asignación de punteros
• Asignación de variable a puntero
• Asignación de puntero a puntero
La primera es la habitual, que permite apuntar a
una variable determinada.
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
31. Lenguaje C
ASIGNACION DE PUNTEROS
Asignación de variable a puntero
Para asignar una variable a un puntero podemos
usar la declaración del puntero
int edad = 10;
int* ptr = &edad;
Sin embargo, también podemos usar esta forma
int edad = 10;
int* ptr;
ptr = &edad;
La 2da forma no se recomienda por ser peligrosa
0x7f5f0ac
ptr
int*
0x503fb43
64 bits
32. Lenguaje C
ASIGNACION DE PUNTEROS
Asignación de puntero a puntero
Una característica muy útil es que los punteros
pueden compartir sus datos entre si. Es decir,
mas de un puntero puede apuntar a la misma
variable
int edad = 10;
int* ptr1 = &edad;
int* ptr2 = ptr1; // No requiere &
*ptr2 = 19;
La ventaja es que lo que cambia un puntero se ve
reflejado en el otro. Solo debemos tener en
cuenta que al asignar un puntero a otro, NO ES
NECESARIO usar el signo &
33. Lenguaje C
FUNCIONES EN C
¿Funciones?????
Sí. Los punteros que usaras estarán en su gran mayoría relacionados con el uso de
funciones. Repasaremos brevemente para que sirven las funciones
Las funciones en C nos permiten dividir porciones de código que resuelven un problema
determinado. La ventaja es que una vez que hemos creado una función, podemos
reutilizarla las veces que necesitemos sin duplicar código. Incluso podemos tener cientos
de funciones agrupadas en librerías y poder utilizarlas en otros programas.
Las funciones tienen las siguientes partes
• Prototipo
• Declaración
• Nombre
• Parámetros
• Código Fuente
• Ambito
• Tipo de Dato
• Valor de Retorno (opcional)
34. Lenguaje C
FUNCIONES EN C
PARTES DE UNA FUNCION
El prototipo es una copia de la
declaración de la función que
debe ir antes de la función main.
El código es como cualquier otro
código C dentro del ámbito de su
función.
Podemos realizar la llamada
indicando el nombre de la
función y el envío de sus
argumentos
35. Lenguaje C
FUNCIONES EN C
int get_uid(int userid)
{
userid = userid + 500;
return userid;
}
Código fuente de
la función
ParámetrosNombre
Valor de
Retorno
Tipo de dato del
valor de Retorno
Declaración /
Prototipo
Por Valor
Por Referencia
Delimitadores
de Ambito de
la Función
36. Lenguaje C
PASO DE PUNTEROS A FUNCIONES
¿Y los punteros?
Paciencia !
Las funciones en C por diseño tienen un detalle
que se pasa inadvertido cuando se programa. Ese
detalle es su manejo de los parámetros.
Ya sean enviados por valor o por referencia, todas
las variables que se ‘reciben’ en una función, en
realidad son creadas in-situ es decir, son copias
de dichas variables con sus propias direcciones de
memoria.
Es decir, en el lenguaje C, técnicamente no existe
el envío de variables a una función
int get_uid(int userid)
{
userid = userid + 500;
return userid;
}
37. Lenguaje C
PASO DE PUNTEROS A FUNCIONES
¿Y cual es el problema con que técnicamente no
se puedan enviar variables a funciones?
Muy simple, al no poder enviarlas, no se pueden
manipular sus valores dentro de las funciones
Pero existe un mecanismo que si nos permitirá
hacerlo. Ese mecanismo es el uso de punteros !
En teoría, si envío un puntero a una función, la
función creara una copia del puntero y luego
dentro de su código al manipular la copia del
puntero, en realidad estará modificando nuestra
variable que originalmente enviamos
void get_uid(int* userid)
{
*userid += 500;
}
38. Lenguaje C
PASO DE PUNTEROS A FUNCIONES
DEMOSTRADO !
Los parámetros de una función son variables
nuevas con su propia dirección de memoria.
Mediante el paso de punteros a funciones, se
puede alterar las variables ‘enviadas’ sin
necesidad de que la función tenga un valor de
retorno. Este tipo de función se denomina
Procedure (Procedimiento)
39. Lenguaje C
PASO DE PUNTEROS A FUNCIONES
¿Cómo pasamos punteros a una función?
Existen 2 formas
Una es mediante punteros, y otra es mediante la
referencia (&) de cualquier variable. De una u
otra manera, lo que nos interesa es enviar
direcciones de memoria.
Siguiendo el ejemplo, podemos ver que la
llamada a la función get_uid se le pasa el puntero
ptr. Nótese que el puntero ptr es un puntero de
tipo int que hace referencia a la variable uid.
Asegúrese de enviar punteros que referencien a
una variable, sino habrán problemas
int uid = 1;
int* ptr = &uid;
get_uid(ptr);
…
void get_uid(int* userid)
{
*userid += 500;
}
40. Lenguaje C
PASO DE PUNTEROS A FUNCIONES
¿Cómo pasamos punteros a una función?
La otra forma es no usar punteros !
¿Qué cosa?
Así es, como lo leyó. Solo basta cualquier variable
común y silvestre para enviarla como si fuera un
puntero. Solo hace falta enviar su referencia
como parte del argumento de la función
En el ejemplo, podemos apreciar que no
necesitamos crear un puntero y apuntarlo a la
variable uid. Únicamente enviamos la referencia
de la variable
int uid = 1;
get_uid(&uid);
…
void get_uid(int* userid)
{
*userid += 500;
}
41. Lenguaje C
PUNTEROS Y ARRAYS
Existe una estrecha relación entre los punteros y los arrays…(eso ya no suena a
novedad). De hecho están tan relacionados que todas las operaciones que se realizan
con arrays pueden ser realizadas por punteros. La diferencia claro esta es que con
punteros las cosas van mas rápido
char a[4+1] = «HOLA0»;
char* ptr = &a[0];
a
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f90x765d3
0x503f5
char*
ptr
42. Lenguaje C
PUNTEROS Y ARRAYS
Operación con Punteros Equivalente en Array
char a[4+1] = «HOLA0»;
char* ptr = &a[0];
*ptr = ‘F’;
a
a[0] a[1] a[2] a[3] a[4]
‘F’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f90x765d3
0x503f5
char*
ptr
char a[4+1] = «HOLA0»;
a[0] = ‘F’;
44. Lenguaje C
PUNTEROS Y ARRAYS
Aritmética de Punteros
a
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f90x765d3
0x503f5
char*
ptr
ptr+1 ptr+2 *(ptr+3) ptr+4
A un puntero se le puede sumar o restar un número entero, lo cual es usado para
moverse por un array. Aplicando el operador ++ o -- a un puntero se consigue que
avance a la siguiente dirección de memoria o a la anterior según sea el caso
45. Lenguaje C
PUNTEROS Y ARRAYS
Aritmética de Punteros
a
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f90x765d3
0x503f5
char*
ptr
ptr+1 ptr+2 *(ptr+3) ptr+4
Operaciones Aritmeticas no permitidas:
• Sumar, Multiplicar o Dividir 2 punteros
46. Lenguaje C
PUNTEROS Y ARRAYS
Diferencias?
a
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f90x765d3
0x503f5
char*
ptr
Por diseño, un array se comporta como un puntero, en el sentido en que un array es un
‘sinónimo’ para la dirección de memoria del elemento inicial.
Esto quiere decir, que según el ejemplo el array a tiene el mismo valor que ptr
ptr+1 ptr+2 *(ptr+3) ptr+4
*(a+3)*(a+0) *(a+1) *(a+2) *(a+4)
47. Lenguaje C
PUNTEROS Y ARRAYS
Diferencias?
a
0x765d3
0x503f5
char*
ptr
Esto quiere decir que la sentencia
ptr = a es equivalente a ptr = &a[0] ptr+1 ptr+2 *(ptr+3) ptr+4
Incluso podemos ver que la referencia de a[i] puede ser escrita como *(a+i) donde i es
el índice del array. De hecho el lenguaje C hace esta conversión de forma interna para
todo array
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
ptr+1 ptr+2 *(ptr+3) ptr+4
*(a+3)*(a+0) *(a+1) *(a+2) *(a+4)
48. Lenguaje C
PUNTEROS Y ARRAYS
Diferencias
a
0x765d3
0x503f5
char*
ptr
Solo hay una diferencia entre un puntero y un array
Siguiendo el ejemplo: El puntero ptr es una variable, pero el nombre del array a no lo
es por lo tanto sentencias como a++ o a=ptr no son permitidas. Un nombre de array es
un puntero constante dado que no puede agregar ni eliminar elementos a su lista
a[0] a[1] a[2] a[3] a[4]
‘H’ ‘O’ ‘L’ ‘A’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
50. Lenguaje C
PUNTEROS Y ARRAYS
Envío de Arrays a Funciones
Es muy común enviar arrays completos a
una función. Sin embargo resulta un
poco confuso hacerlo debido a que
existen 2 formas de hacerlo
La primera es declarando el array en el
prototipo de la función de la siguiente
manera:
<tipo> variable[ ]
Por ejemplo:
int suma(int lista[ ], int ne)
51. Lenguaje C
PUNTEROS Y ARRAYS
Envío de Arrays a Funciones
La segunda forma es declarando el array
en el prototipo de la función mediante
un puntero normal:
Por ejemplo:
int suma(int* lista, int ne)
En cualquiera de las 2 formas, debemos
tener presente algo muy importante: El
nro de elementos del array enviado se
debe conocer. Es usual enviar el nro de
elementos como parte de la función
52. Lenguaje C
PUNTEROS Y CADENAS
¿Que es una cadena?
os
0x765d3
0x503f5
char*
ptr
Una cadena no es mas que un array de tipo char
El lenguaje C NO existe el tipo de dato string, pero mediante arrays se puede conseguir
el tratamiento de cadenas de caracteres sin la cual cualquier lenguaje de programación
no serviría de mucho.
os[0] os[1] os[2] os[3] os[4]
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
char os[4+1] = «UNIX0»;
53. Lenguaje C
PUNTEROS Y CADENAS
¿Que es una cadena?
os
0x765d3
0x503f5
char*
ptr
Las cadenas son un elemento tan importante que es quizá sin exagerar el aspecto más
crítico en el Lenguaje C. La gran mayoría de problemas de seguridad se deben al
inadecuado uso de las cadenas. Incluso el propio lenguaje nos ofrece funciones que son
inseguras debido a que delegan toda la responsabilidad del correcto tratamiento de
cadenas al programador. Hemos ingresado ya en terreno minado !
os[0] os[1] os[2] os[3] os[4]
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
char os[4+1] = «UNIX0»;
54. Lenguaje C
PUNTEROS Y CADENAS
Marcando el final
os
0x765d3
0x503f5
char*
ptr
El gran problema con las cadenas es que debemos indicar donde terminan, es decir
debemos indicarle explícitamente cual es el final de una cadena, asignarle una marca
que permita al lenguaje C reconocer donde detenerse. Incluso si una cadena no utiliza
todos sus elementos debemos indicarlo de lo contrario algo podría explotar
Esa marca es el carácter NULL o también denotado por el símbolo ‘0’
os[0] os[1] os[2] os[3] os[4]
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
char os[4+1] = «UNIX0»;
55. Lenguaje C
PUNTEROS Y CADENAS
El origen de todos los males
En el ejemplo podemos apreciar un error muy común (y sobretodo peligroso) en el
manejo de cadenas: El Desbodarmiento.
Aparentemente se ve inofensivo, pero en realidad copiar una cadena de mayor tamaño
en una menor ocasiona que se sobrescriba memoria ajena que puede detener el
programa e incluso poner en riesgo todo un sistema.
os[0] os[1] os[2] os[3] os[4]
‘W’ ‘I’ ‘N’ ‘D’ ‘O’
0x503f5 0x503f6 0x503f7 0x503f8 0x503f9
char os[4+1];
strcpy(os,
«WINDOWS7»);
printf(«%s»,os);
memoria no reservada
‘W’ ‘S’ ‘ 7’
0x503fa 0x503fb 0x503fc
56. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Copiado
‘U’ ‘N’ ‘I’ ‘X’‘¡’ ‘?’ ‘$’ ‘0’ ‘?’
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
auxos
char* strcpy(os, aux)
os
CODIGO
char os[4+1];
char aux[4] = «UNIX»;
strcpy(os,aux);
Nótese que en el ejemplo, la variable os al ser declarada su valor es aleatorio (debido a
que no ha sido inicializada). Así también se puede apreciar que la función strcpy agrega al
final de la cadena el delimitador nulo (‘0’).
57. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Copiado
‘W’ ‘I’ ‘N’ ‘D’‘U’ ‘N’ ‘I’ ‘X’ ‘0’
‘W’ ‘I’ ‘N’ ‘X’ ‘0’
auxos
char* strncpy(os, aux,3)
os
CODIGO
char os[4+1]=«UNIX0»;
char aux[7] = «WINDOWS»;
strncpy(os,aux,3);
La función strncpy también copia cadenas, sin embargo podemos indicarle el número de
caracteres a copiar. En el ejemplo vemos que solo se copiaran 3 caracteres de la cadena
aux en la cadena os. Nótese que el carácter X aun permanece
‘O’ ‘W’ ‘0’
58. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Concatenar
‘X’ ‘P’ ‘0’‘W’ ‘I’ ‘N’ ‘0’ ‘8’
‘W’ ‘I’ ‘N’ ‘X’ ‘P’
auxos
char* strcat(os, aux)
os
CODIGO
char os[5+1]=«WIN08Z»;
char aux[2] = «XP»;
strcat(os,aux);
La función strcat permite copiar una cadena al final de otra. Podemos ver como se copia la
cadena XP al final de la variable os. Nótese como la función considera al carácter nulo (‘0’)
de os como final cuando realmente no lo es. Al final le agrega el signo ‘0’
‘Z’
‘0’
59. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Concatenar
‘W’ ‘I’ ‘N’ ‘D’‘U’ ‘0’ ‘I’ ‘X’ ‘0’
‘U’ ‘W’ ‘I’ ‘N’ ‘0’
auxos
char* strncat(os, aux,3)
os
CODIGO
char os[4+1]=«U0IX0»;
char aux[7] = «WINDOW0»;
strncat(os,aux,3);
La función strncat también concatena cadenas, sin embargo podemos indicarle el número
de caracteres a concatenar. En el ejemplo vemos que solo se concatenarán 3 caracteres de
la cadena aux en la cadena os.
‘O’ ‘W’ ‘0’
60. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Comparar
‘U’ ‘N’ ‘I’ ‘X’‘U’ ‘N’ ‘I’ ‘X’ ‘0’ auxos
int strcmp(os, aux)
CODIGO
char os[5]=«UNIX0»;
char aux[5] = «UNIX0»;
int r = strcmp(os,aux);
La función strcmp es diferente puesto que devuelve un valor entero. Compara 2 cadenas y
evalúa su similitud. Si las cadenas son iguales retorna el valor cero (0). Es importante
recordar que la evaluación diferencia mayúsculas de minúsculas (p.e A es distinto de a)
‘0’
0r
61. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Comparar
‘I’ ‘O’ ‘S’ ‘4’‘U’ ‘N’ ‘I’ ‘X’ ‘0’ auxos
int strcmp(os, aux)
CODIGO
char os[5]=«UNIX0»;
char aux[5] = «WIN70»;
int r = strcmp(os,aux);
La función strcmp devuelve un número positivo (>0) si la primera cadena enviada es mayor
que la segunda. ¿Cómo puede ser una cadena mayor que otra?. Se comparan sus valores.
Por ejemplo la letra U=85 mientras que la I=73. Luego se devuelve la diferencia de ambas
‘0’
12r
62. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Comparar
‘P’ ‘H’ ‘P’ ‘5’‘P’ ‘E’ ‘R’ ‘L’ ‘0’ auxlang
int strcmp(lang, aux)
CODIGO
char lang[5]=«PERL0»;
char aux[5] = «PHP50»;
int r = strcmp(lang,aux);
La función strcmp devuelve un número negativo(<0) si la primera cadena es menor que la
segunda. ¿Cómo puede ser una cadena menor que otra?. Se comparan sus valores uno por
uno. Por ejemplo la letra E=69 mientras que la H=72. Luego se devuelve 69-72=-3
‘0’
-3r
63. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Comparar
‘P’ ‘H’ ‘P’ ‘5’‘P’ ‘H’ ‘P’ ‘4’ ‘0’ auxlang
int strncmp(lang, aux,3)
CODIGO
char lang[5]=«PHP40»;
char aux[5] = «PHP50»;
int r = strncmp(lang,aux,3);
La función strncmp funciona con la misma lógica que strcmp. La única diferencia es que
solo toma en cuenta la comparación de N caracteres indicados. En el ejemplo, el resultado
es 0 debido a que solo se comparan los 3 primeros caracteres que resultan ser iguales
‘0’
0r
64. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Búsqueda
‘H’‘P’ ‘H’ ‘P’ ‘4’ ‘0’ auxlang
char* strchr(lang, aux)
CODIGO
char lang[5]=«PHP40»;
char aux= «H»;
char* ptr;
ptr = strchr(lang,aux);
La función strchr permite buscar una cadena dentro de otra. Si la encuentra devuelve un
puntero en la primera ocurrencia, caso contrario devolverá un puntero a NULL. En el
ejemplo se busca el carácter H dentro de PHP4 retornando un puntero a la posición 1
ptr
65. Lenguaje C
PUNTEROS Y CADENAS
Operaciones comunes / Búsqueda
‘P’‘P’ ‘H’ ‘P’ ‘4’ ‘0’ auxlang
char* strrchr(lang, aux)
CODIGO
char lang[5]=«PHP40»;
char aux= «P»;
char* ptr;
ptr = strrchr(lang,aux);
La función strrchr devuelve la ultima ocurrencia de una cadena. En el ejemplo podemos
ver que la función retorna un puntero a la posición nro 2 en lugar de la posición 0. Es decir,
devuelve la ultima ocurrencia de la letra P que ha sido buscada.
ptr
66. Lenguaje C
ARRAYS DE PUNTEROS
Como funcionan
‘L’ ‘I’ ‘N’ ‘U’ ‘X’
Un array de punteros funciona de forma similar a un array de cualquier otro tipo de datos.
Donde cada elemento puede apuntar a un valor del tipo de dato declarado previamente.
En el ejemplo podemos apreciar como se declara un array de 3 elementos que contienen
punteros a char. Incluso podemos inicializar de forma inmediata sus valores.
‘0’
‘W’ ‘I’ ‘N’ ‘D’ ‘O’ ‘W’ ‘S’ ‘0’
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
osptr 0
1
2
char* osptr[3]={«LINUX0», «WINDOWS0», «UNIX0»};
67. Lenguaje C
ARRAYS DE PUNTEROS
Paso de array de punteros a funciones
Al igual que el paso de arrays a una
función se puede realizar de 2 formas. El
envío de un array de punteros también
tiene 2 modalidades
La primera es mediante la siguiente
sintaxis en el envío de parámetro de la
función:
<tipo>* variable[ ]
Por ejemplo:
void join(char* lista[ ], int ne)
68. Lenguaje C
ARRAYS DE PUNTEROS
Paso de array de punteros a funciones
La 2da forma resulta en un quebradero
de cabeza para muchos programadores
ya que se trata del uso de puntero a
puntero
Esto se consigue con la siguiente sintaxis
<tipo>** variable
Por ejemplo:
void join(char** lista, int ne)
69. Lenguaje C
PUNTEROS A PUNTEROS
‘L’ ‘I’ ‘N’ ‘U’ ‘X’
Un puntero a puntero funciona de forma similar que cualquier puntero. Nada más que
apunta a otras variables de tipo puntero. Se usa mucho para apuntar a un array de
punteros a char. Debido a que su sintaxis es un poco intimidante los programadores suelen
evitarla. Sin embargo solo se necesita seguir la misma lógica de un puntero normal pero de
2do nivel.
‘0’
‘W’ ‘I’ ‘N’ ‘D’ ‘O’ ‘W’ ‘S’ ‘0’
‘U’ ‘N’ ‘I’ ‘X’ ‘0’
osptr
0
1
2
char* osptr[3]={«LINUX0», «WINDOWS0», «UNIX0»};
char** ptrptr = osptr;
ptrptr
70. Lenguaje C
PUNTEROS NULL y VOID
Como funcionan
‘L’ ‘I’ ‘N’ ‘U’ ‘X’
El puntero NULL no apunta a ningún dato válido en memoria, por lo que es muy utilizado
para indicar cuando un puntero no contiene valor alguno.
Por otro lado un puntero VOID puede apuntar a cualquier dato válido en memoria, sin
importar su tipo de dato. La única condición que debemos tener presente es saber bien el
tipo de dato que se ha asignado en todo momento.
‘0’
19
multi
0
1
2
void* multi[3];
char os[5+1]=«LINUX0»;
int num=19;
multi[0] = os;
multi[1] = #
multi[2] = NULL; NULL
os
num
71. Lenguaje C
PUNTEROS NULL y VOID
Como funcionan
El puntero VOID apunta a cualquier valor,
pero no puede ser dereferenciado, es decir
no se le puede aplicar la indirección a la
misma variable void.
Para poder usar una variable VOID,
debemos primero convertir su valor a un
puntero del tipo de dato deseado.
En el ejemplo podemos apreciar como la
variable multi guarda 3 valores distintos, y
aplicamos la indirección según sea su tipo
de dato
72. Lenguaje C
PUNTEROS CONSTANTES
¿Constante?
El lenguaje C nos permite trabajar con
variables constantes. Es decir, variables cuyo
valor una vez seteados no pueden ser
alterados bajo ninguna condición
Para ilustrarlo mejor, vemos el ejemplo
donde la variable uid es una constante de
tipo int. Si intentamos cambiar su valor en el
transcurso del programa obtendremos un
error
Usualmente vemos errores en tiempo de
compilación si hacemos el cambio en el
mismo código fuente
73. Lenguaje C
PUNTEROS CONSTANTES
¿Constante?
Hay situaciones en las que deseamos que
un puntero sea constante, es decir que su
valor (la dirección de memoria que guarda)
no se pueda alterar. Para conseguir esto
debemos usar la siguiente sintaxis:
const <tipo>* variable
Ejemplo:
const int* ptr;
Nótese en el ejemplo que la variable
apuntada (uid) puede ser alterada (ya que
es una variable int y no const int)
74. Lenguaje C
PUNTEROS A FUNCIONES
Como funcionan
En el ejemplo, podemos apreciar el puntero f que apunta a la función suma. Nótese
que tiene el mismo número de parámetros y el tipo de datos de retorno.
Así mismo, solo basta una asignación simple para apuntar a dicha función
f
int (*f)(short, short);
f = suma;
…
int suma(short a, short b)
{
return (int) a+b;
}
SI ya se dieron cuenta, e lenguaje C
permite apuntar a casi todo ser vivo. Las
funciones por lo tanto también pueden
ser apuntadas.
Solo debemos declarar el puntero de
forma similar al prototipo de la función
que queremos apuntar:
tipo (*variable)(argumentos,…)
75. Lenguaje C
PUNTEROS A FUNCIONES
Como se usan
Bien, ya sabemos declarar y asignar un
puntero a una función, ahora veremos
como utilizarlos
Simplemente debemos llamarlos de la
siguiente manera:
(*variable)(argumentos,…)
Ejemplo:
(*f)(1,2);
Es un poco raro pero funciona !
76. Lenguaje C
CALLBACKS
Que son
Una callback es un mecanismo de
programación por la cual se ejecuta una
función X dentro de otra función Y con la
particularidad de reemplazar la función X
por cualquier otra en tiempo de ejecución
Esto se consigue enviando a una función Y
un argumento de tipo puntero a función
Este mecanismo es muy utilizado en
funciones avanzadas del sistema operativo
para permitir una gran flexibilidad al
momento de programar.
77. Lenguaje C
BONUS TRACK - RECOMENDACIONES
Todo con disciplina
Aquí algunas recomendaciones que pueden servir para mejorar nuestro uso de punteros
• Utiliza nombres con prefijos (como ptr) para indicar que se trata de un puntero
• Escoge un modo de declarar y asignar punteros y no lo cambies
• Usa el signo & solo para asignaciones de punteros
• Inicializa cada puntero una vez que lo has declarado
• Asegúrate siempre de validar si un puntero es nulo
• Inicializa toda cadena que usarás a nulo (vía memset por ejemplo)
• Reserva siempre 1 carácter más para el signo ‘0’ y hazlo visible (p.e. char aux[4+1])
• Toda cadena constante, que uses, termínala con el signo ‘0’
• Usa las funciones seguras de cadenas (las que piden el nro de elementos)
• No pierdas de vista el número de elementos de un puntero a un array
• Valida siempre los límites de un array
• Piensa 4 veces cada indirección que programes
78. Lenguaje C
Anexos
¿Qué necesito para programar en C bajo Linux?
gcc, gdb, vim
¿Cómo compilar un programa C en Linux?
gcc mi-programa.c -g -o mi-programa.exe
¿Cómo depurar un programa C en Linux?
gdb mi-programa.exe
¿Qué necesito para programar en C bajo Windows?
Visual C++ ó Borland C ó C Builder, etc
Nota: La extensión .exe es
solo para referencia
sencilla de que se trata
de un ejecutable, no es
necesario por lo tanto
agregarle dicha extensión
en realidad
Nota: Si se desea
programar con el
estándar C11 se deberá
obtener una copia del
compilador gcc 4.8.1.
79. Lenguaje C
Bibliografia
The C Programming Language, 2nd Edition, B. Kernighan, Dennis Ritchie.
The Art and Science of C, Eric S. Roberts.
Programming in C, 3rd Edition, Stephen G. Kochan
Programación en C, Metodología, algoritmos y estructura de datos. Luis Joyanes
Aguilar
C Programming A Modern Approach. Second Edition. K.K.King
Pointers and Memory. Standford CS Education Library. Nick Parlante