Embedded Files: Risks, Challenges and Options

Hace 1 año 274 Visualizaciones

"Building a File Observatory: Making Sense of PDFs in the Wild"

Hace 2 años 78 Visualizaciones

Evaluating Text Extraction at Scale: A case study from Apache Tika

Hace 3 años 105 Visualizaciones

Haystack Live tallison_202010_v2

Hace 3 años 126 Visualizaciones

Haystack 2018 apache_tika-eval_tallison

Hace 6 años 602 Visualizaciones