Ejercicio compiladores

CIS-IXB-001
UNIVERSIDAD
NACIONAL
DE LOJA
Área de la Energ´ıa las Industrias y los Recursos Naturales No Renovables
Carrera de Ingenier´ıa en Sistemas
” COMPILADOR: CONVERTIDOR
DE N ÚMEROS EN LETRAS A SU
VALOR ENTERO ”
Tarea- Extra Clase
Noveno B
Autor: Sheimy Liliana Patiño Rivera.
Docente: Ing. Henry Paz.
Fecha: 13-02-2015
Loja-Ecuador
2015
Tarea de Compiladores. By Sheimy Liliana Patiño Rivera is licensed Under a Creative
Commons Reconocimiento-NoComercial-CompartirIgual 3.0 Unported License.
1

Índice
A. INTRODUCCIÓN 3
1 . Analizador léxico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 . Analizador Sintáctico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
B. CASO DE ESTUDIO 4
1 . Estructura del archivo FLEX . . . . . . . . . . . . . . . . . . . . . . . . . 4
1 .1. Opciones y declaraciones . . . . . . . . . . . . . . . . . . . . . . . . 4
1 .2. Código de usuario . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1 .3. Reglas lexicográficas . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1 .4. Ejecución en java . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 . Estructura de un archivo CUP . . . . . . . . . . . . . . . . . . . . . . . . . 7
2 .1. Definición de paquete y sentencias import . . . . . . . . . . . . . . 7
2 .2. Sección de código de usuario . . . . . . . . . . . . . . . . . . . . . . 8
2 .3. Declaración de s´ımbolos terminales y no terminales . . . . . . . . . 9
2 .4. Declaraciones de precedencia . . . . . . . . . . . . . . . . . . . . . . 10
2 .5. Definición del s´ımbolo inicial de la gramática y las reglas de producción 10
2 .6. Ejecución en java . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3 . Errores en el compilador . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
4 . Ejecución del compilador desde Netbeans . . . . . . . . . . . . . . . . . . . 14
4 .1. Métodos generados en código java . . . . . . . . . . . . . . . . . . . 14
4 .2. Compilación del código con la entrada a evaluar . . . . . . . . . . . 14
4 .3. Archivo .txt de entrada . . . . . . . . . . . . . . . . . . . . . . . . . 15
5 . Autómata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
6 . CÓDIGO FUENTE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
C. BIBLIOGRAFIA 17

A. INTRODUCCIÓN
Desde el punto de vista de un profesional informático, practicamente todas las accio-
nes que se va a ver obligado a desarrollar estara relacionado con traductores, como es la
programación, creación de ficheros, utilización de interpretes, entre otros.
En este caso se va a tratar sobre los compiladores, mismos que son programas que leen
un programa escrito en determinado lenguaje, y lo traduce a un programa equivalente en
otro lenguaje. Por lo cual trabajar con compiladores incluye saber cuales seran los token,
lexemas y patrones.
Existen dos partes importantes dentro del compilador, el analizador léxico que es el que
ayuda a leer los caracteres de entrada para formar componentes, identificarlos y pasarlos
al analizador sintáctico quien sera el encargado de determinar si el ingreso de los carcteres
tiene sentido sintáctico, y en caso que exista errores que indique el porque se dan.
1 . Analizador léxico
Para crear un AL hay que [1]:
• Especificar todos los tokens del lenguaje.
• Puede haber varios tokens que correspondan a una misma expresión regular.
• En este caso el algoritmo asociado a la expresión regular deberá diferenciar a
partir del lexema el token.
Funcionamiento:
• Hay una variable (texto) que contiene el lexema encontrado al reconocer un
determinado patrón.
• Cada vez que se llama al AL, éste va leyendo caracteres hasta encontrar un
lexema que pertenece a un lenguaje descrito por una expresión regular.
• En ese momento está el lexema completo y se ejecuta el algoritmo asociado.
• El valor asociado que devuelve el AL var´ıa de un token a otro.
2 . Analizador Sintáctico
Funcionamiento:
El analizador sintactico arranca.
Solicita un token.
El Scanner lo devulve de acuerdo a la codificación Sym.
3

B. CASO DE ESTUDIO
Aplicando los conocimiento recibidos en clase referente a la materia de compiladores,
se pretende solucionar el siguiente problema:
El compilador que se a desarrollado nos permitira realizar la conversión de los números
del 1-9 y de 10 en 10 hasta el 100, ejemplo: uno=1; diez=10; cien=100.
1 . Estructura del archivo FLEX
Un archivo .flex esta dividido en tres partes [2]:
Opciones y declaraciones.
Código de usuario.
Reglas lexicográficas.
1 .1. Opciones y declaraciones
Se importan todos los paquetes que se van a utilizar en nuestro analizador, despues
se pone un par de % para decir que desde ahi inicia el bloque de configuración, mismo
que define un conjunto de parametros que iniciaran con un %, estos indicaran al analizar
como se debe comportar.
Donde:
package <nombrePaquete>: debemos poner el nombre del paquete en el cual se va
a crear el codigo java de archivo flex.
import java cup.runtime.*: esto importamos para que el archivo flex tengo sincro-
nización con el archivo cup.
%class <nombreClase>: comunica a Jflex como se va a llamar la clase.
%cup: establece la compatibilidad de Jflex con CUP.
%line: permite que se puedan contar las l´ıneas.
%column: permite que se puedan contar las columnas.
4

1 .2. Código de usuario
En este bloque se puede incluir codigo Java, mismo que se lo usara en el analizador,
este código se encuentra entre % %, este codigo sera copiado nitidamente en la clase .java
Aqui por ejemplo tenemos la creación de dos métodos:
1. Generamos un Symbol para guardar el tipo de token encontrado.
2. Generamos un Symbol para el tipo de token encontrado junto con su valor.
1 .3. Reglas lexicográficas
Este bloque es una parte muy importante dentro del analizador, aqui se define el con-
junto de expresiones regulares que seran utilizadas en el análisis. El analizador va leyendo
la cadena de entrada y activa la expresión que tiene mayor longitud.
Donde:
Salto: es para tener en cuenta el salto de linea en el texto, r y n son por el sistema
operativo en el que este.
Espacio: es para tener en cuenta el espacio en el texto, aqui llamamos al Salto y
ademas tenemos en cuenta el tabulador y avance de página.
Se pueden utilizar los ambientes léxicos: funcionan como una condición, como es el YYI-
NITIAL con el cual se empieza a escanear, para inicar este estado se debe anterponer un
par de %.
Métodos: los métodos que se utilizan para obtener los valores de los token son:
String yytext(): devuelve lo que se ha le´ıdo.
Int yyline(): devuelve la l´ınea de la entrada actual pero empezando en 0.
Int column(): devuelve la columna.
5

Donde:
” < valorToken > ”: valor que tendra el token, ejemplo ”;”.
{System.out.print(); : valor con el que se va a presentar al momento de necesitarlo.
return symbol(sym.FL,yyline,yycolumn);}: valor que retorna a la clase Sym que es
la que almacena los token, FL es el valor del token. Despu´es de establecer el valor
de todos los tokens se indica que pasa si el caracter ingresado no esta declarado,
para ello se hace:
.{System.err.println(”caracterinvalido : ”+ yytext()+ yyyline()+1+yycolumn()+1);}:
aqui se esta mostrando el texto mal, la linea y columna en la que se encuentra.
6

1 .4. Ejecución en java
Para la generación del codigo en .java se debe importar la libreria .flex dentro de un
proyecto en cualquir ID, en este caso se usa Netbeans y especificamente con la libreria
jflex.Main.main(); y se lo hace de la siguiente manera:
1: Se crea una variable tipo cadena.
2: Hacer un sentencia if, donde primero evaluamos que la variable de tipo cadena
sea sea mayor a 0, si es as´ı entonces igualamos la variable al archivo de tipo flex.
3: Se crea una variable de tipo cadena pero en arreglo y la igualamos a la varible se
creo en el paso 1.
4: Se hace el uso de la libreria jflex y se le envia como parametro el archivo creado
en el paso 3.
2 . Estructura de un archivo CUP
Un fichero de entrada para CUP consta de las siguientes partes [3]:
Definición de paquete y sentencias import.
Sección de código de usuario.
Declaración de s´ımbolos terminales y no terminales.
Declaraciones de precedencia.
Definición del s´ımbolo inicial de la gramática y las reglas de producción.
2 .1. Definición de paquete y sentencias import
En esta sección se incluyen las construcciones para indicar que las clases Java ge-
neradas a partir de este fichero pertenecen a un determinado package o importar las
clases Java necesarias. Esta parte contendrá como m´ınimo la siguiente l´ınea: import
java cup.runtime.∗;
7

Donde:
package <nombrePaquete>: debemos poner el nombre del paquete en el cual se va
a crear el codigo java de archivo flex.
import java cup.runtime.*: esto importamos para que el archivo flex tengo sincro-
nización con el archivo cup.
import java.io.FileReader: esta nos servira para poder hacer la lectura del archivo
de entrada de datos a analizar.
2 .2. Sección de código de usuario
En esta sección se puede incluir código Java que el usuario desee incluir en el analizador
sintáctico que se va a obtener con CUP. La declaración es: parser code {: ... :}; esta nos
permite personalizar métodos algunos dentro del analizador. Donde:
El método report error: nos devolvera el error encontrado, asi como la linea y co-
lumna que este se encuentra.
El método report fatal error: cuando se encuentra un error donde el sistema no
puede recuperarse, nos devolvera un mensaje de error y finaliza la ejecución.
El metodo main: para garantizar la ejecucion del analizador léxico y sintactico,
además que se pase como parametro la tabla de simbolos correspondiente.
Y finalmente el método conversion: es aquel que nos permite realizar la conversión
del número en letras a su valor entero.
8

2 .3. Declaración de s´ımbolos terminales y no terminales
En esta sección se declaran los s´ımbolos terminales y no terminales de la gramática que
define el analizador sintáctico. Tanto los s´ımbolos no terminales (subarboles de sintaxis)
como los s´ımbolos terminales (token) pueden, opcionalmente, tener asociado un objeto
Java de una cierta clase.
Para declarar s´ımbolos terminales y no terminales se utiliza la siguiente sintaxis:
terminal [<nombre clase >] nombre1, nombre2, ... ;
non terminal [< nombre clase >] nombreA, nombreB, ... ;
9

2 .4. Declaraciones de precedencia
En CUP, es posible definir niveles de precedencia y la asociatividad de s´ımbolos ter-
minales (como se verá más adelante, también se pueden definir niveles de precedencia y
asociatividad ligándolos a reglas de producción concretas).
2 .5. Definición del s´ımbolo inicial de la gramática y las reglas de producción
En esta sección del archivo es donde escribiremos nuestra gramatica. La gramatica
tiene la siguiente sintaxis : <non terminal > ::= < terminales o No terminales >;
Como un no terminal puede tener mas de un lado derecho en Cup se utiliza el simbolo
“|”
<non terminal > ::= < terminales o No terminales >
| < terminales o No terminales >;
En este apartado se indica como va a ser el funcionamiento del compilador, en
este caso llamamos a la epxresión lista expr list concatenado con una expresión de
cadena expr part o se da el caso de llamar unicamente a la exprexion de cadena,
esta ultima sera la que nos mostrara el resultado de la expresion regular expr reg
ingreasa.
Aqu´ı estamos utilizando el no terminal expr part, donde se almacena el error si es
que se da el caso o llamamos a la expresión regular exprReg que es la que viene con
el resultado final de la expresión evaluada.
Ahora se procede a evaluar la forma en que el usuario ingresara los datos a ser
analizados, para eso usamos el no terminal exprReg, en esta se almacenara los
posibles errores y la regla gramatical correcta. A continuación se indica algunos de
los errores que seran identificados:
10

• 1: Con la regla gramatical CONVNUM numero:n1 NUMLETRAS FL, CONV-
NUM numero:n1 NUMLETRAS se le indica al usuario que la sintáxis no es la
correcta.
• 2: Con la regla gramatical NUMLETRAS numero:n1, se controla la sintáxis
inicando que esta incompleta.
• 3: Con la regla gramatical NUMLETRAS numero:n1 CONVNUM, se controla
el fin de l´ınea FL.
Hasta esta parte se controla algunos errores que se pueden dar, la explicación de
esto se hace en el apartado de Errores del compilador.
Con esta regla gramatical finalizamos el conjunto de expresiones que se evalua den-
tro del no terminal exprReg, aqu´ı estamos determinando cual es la sintáxis de como
11

deberian ser ingresados los datos a evaluar, primero se ingresa la palabra reserva-
da NUMLETRAS <número a evaluar> operador CONVNUM y fin de l´ınea FL.
Además se hace el uso del método de conversion que se creo al inicio, y este método
sera llamado dentro de un par de corchetes {: método :}, a continuación se muestra
como debe ir:
Con el apartado numero se realiza una expresion gramatical en la que establecemos
el conjunto de los números en letras, la variable RESULT nos indica que el valor que
contiene dentro de ”” sera el valor que retorne.
2 .6. Ejecución en java
Para la generación del codigo en .java se debe importar la libreria .cup dentro de un pro-
yecto en cualquir ID, en este caso se usa Netbeans especificamente con java cup.Main.main();
y se lo hace de la siguiente manera:
1: Se crea una variable tipo cadena.
2: Hacer un sentencia if, donde primero evaluamos que la variable de tipo cadena
sea sea mayor a 0, si es as´ı entonces igualamos la variable al archivo de tipo cup.
3: Se crea una variable de tipo cadena pero en arreglo y la igualamos a la varible se
creo en el paso 1.
4: Se hace el uso de la libreria cup y se le envia como parametro el archivo creado
en el paso 3.
12

3 . Errores en el compilador
Como sabemos que si el usuario no ingresa bien la sintaxis se generara un conjunto de
errores, es por ello que en este ejemplo se tomara en cuenta 4 tipos de errores, para los
cuales proporcionara la linea y columna en la cual se genero el error y para resolverlos se
dara una ayuda en tipo de mensaje de como debe ser la sintáxis.
Por ejemplo si el usuario ingresa:
numLetras uno convNum
La salida que nos enviara sera:
Error en linea 1, y columna 15 : Falta el fin de linea ;
Para eso se hace uso del metodo report error y report fatal error que han sido creados
en código java, y son llamados en la siguiente manera dentro de las reglas gramaticales:
Por ejemplo si el usario ingresa NUMLETRAS numero CONVNUM, entonces en este caso
falta el fin de l´ınea: FL, para ello:
1: se usa código java con el cual se obtiene la l´ınea y columna en la que se produjo
el error.
2: se llama al método parser.report error: aqui le enviamos el respectivo mensaje y
variable de error misma que da la l´ınea y columna del error.
13

4 . Ejecución del compilador desde Netbeans
4 .1. Métodos generados en código java
AL generar este codigo desde el archivo .flex, se generar un metodo next token, el cual
nos devolvera un objeto de la clase Symbol que representa el siguiente token de la cadena
de token que sera la entrada para el analizador s´ıntactico.
El uso del método parse() se lo necesita en el analizador sintáctico, este método nos
devolvera un objeto de la clase Symbol que representa al simbolo no terminal ra´ız del
árbol de derivación que genera la cadena de token de entrada.
4 .2. Compilación del código con la entrada a evaluar
Para realizar la ejecución desde netbeans se crea una clase que contenga:
Como generar los archivos tanto el .flex como el .cup para que proporcionen el código
en una clase .java
Como ejecutar la entrada de un archivo .txt, el cual contendra los datos a ser
evaluados por el compilador.
A continuación se indica el código de la clase que contiene el método main.
1: Se crea tres variables estaticas de tipo entero, para obtener el valor que el usuario
ingresara.
2: Se crea un bucle de elección, esto nos sirve para ejecutar el codigo de acuerdo al
dato entero que el usuario ingreso, se tiene 2 casos:
1. GENERAR: generamos el código java de los archivos flex y cup, para eso se llama
a los archivos; y el caso
2: EJECUTAR: aqui se analiza el archivo .txt que contiene los datos que se van a
evaluar.
14

4 .3. Archivo .txt de entrada
El archivo de entrada debera llevar la siguiente sint´axis:
Y la salida que se genera sera de la siguiente manera:
uno = 1
veinte = 20
ocho = 8
15

Caso contrario si ingresa asi:
Nos enviara la siguiente salida:
5 . Autómata
La creación del autómata nos ayudo a enterder como es el funcionamiento del com-
pilador que se esta desarrollando, en si es para entender como funcionaran las reglas
gramaticales, a continuación se muestra el autómata realizado:
6 . CÓDIGO FUENTE
El código fuente, tanto de los archivos FLEX y CUP as´ı como el código generado en
java de estos 2 archivos, la entrada de datos a analizar que es un .txt, la clase principal
que contiene el ejecutor del programa y la clase sym la que contiene todos los tokens, esta
disponible para su descarga en el siguiente link:
Código Fuente: https://conv-numletras-a-numentero.googlecode.com/svn/trunk/
Documentación: http://es.slideshare.net/SheyliPatio/ejercicio-compiladores
16

C. BIBLIOGRAFIA
Referencias
[1] Definición de analizador lexico; 08/02/2015. Disponible en: http://www.escet.
urjc.es/˜ci/material/lexico.pdf
[2] Estructura de un archivo Jflex; 08/02/2015. Disponible en: http://www.
rafaelvega.com/wp-content/uploads/Articulo.pdf
[3] Estructura del archivo CUP; 09/02/2015; Disponible en: http://www.it.uc3m.es/
˜luis/fo1/p/CUP.html
17

Ejercicio compiladores

Recomendados

Recomendados

Más contenido relacionado

La actualidad más candente

La actualidad más candente (20)

Similar a Ejercicio compiladores

Similar a Ejercicio compiladores (20)

Más de Sheyli Patiño

Más de Sheyli Patiño (6)

Ejercicio compiladores