Hoy en día la cantidad de conocimiento generado de manera digital es considerable en cuanto a la cantidad de objetos de conocimiento disponibles, en específico de artículos científicos. La mayoría de los artículos científicos utilizan el PDF para ser distribuidos. La variedad de plantillas en los que se publican los artículos científicos complica la tarea de extracción secuencial del texto de forma manual, pues si no se tiene cuidado en la selección del texto, se podría extraer texto sin una secuencia correcta y sin sentido. Realizar la extracción de forma semiautomática o automática resulta una tarea más compleja. La clasificación de tales objetos de conocimiento de forma manual con base en el dominio de su contenido y utilizando las clases definidas en una taxonomía, requiere de tantos expertos como dominios de conocimientos en los que se desee clasificar, el salario de los expertos y además tiempo para realizar la clasificación de cada objeto de conocimiento. Cuando el poblado ontológico se realiza de manera manual, esta tarea conlleva tiempo y presenta una desventaja para instanciar múltiples elementos rápidamente. Hoy en día existen herramientas que realizan las tareas antes mencionadas de manera semiautomática o automática, pero de manera separada. Realizar la extracción, clasificación y el poblado ontológico a partir de objetos de conocimiento en PDF de forma manual, resulta una tarea que consume mucho tiempo cuando se requiere procesar múltiples objetos, en un menor tiempo. En el presente trabajo de investigación se analizaron las técnicas existentes para realizar la extracción secuencial del texto y la identificación de características del texto a partir de un artículo científico en PDF. También se analizaron algunos algoritmos de clasificación de textos, identificados a partir del estado del arte, con los cuales se implementaron diversas variaciones del clasificador, dichas variaciones del clasificador fueron probadas con un corpus formado manualmente y la taxonomía de la ACM, a partir de la librería de la ACM. De las ocho variaciones del clasificador, a través de los resultados obtenidos en las pruebas se pudo concluir cual variación arrojaba las mejores métricas. Además se identificó la lógica para realizar el poblado de una ontología que modela a los artículos científicos, las clases en las que pueden estar clasificados y los autores de los artículos. A partir del análisis previo se generó un mecanismo el cual implementa de forma unificada la extracción automática de texto, clasificación automática y el poblado ontológico semiautomático a partir de textos no estructurados en PDF. Al mecanismo que se realizó, se le diseñó una interfaz web que permite seleccionar un artículo científico en PDF y de forma automática se extrae el texto del artículo, se identifican algunas secciones del articulo como por ejemplo, el título, los autores, las palabras clave