Este documento resume conceptos clave sobre datos desbalanceados y técnicas para abordarlos. Explica que los datos desbalanceados ocurren cuando una clase predomina sobre la otra y provee ejemplos como fraude y anomalías. Luego describe estrategias como oversampling y undersampling, así como algoritmos como random forest y redes neuronales, para lidiar con datos desbalanceados. Finalmente, propone algunos proyectos de detección como vehículos autónomos vs particulares y usuarios propensos a usar tarjetas de crédito.