Los proyectos de análisis de texto muy a menudo utilizan fuentes públicas de Internet. Estos proyectos generalmente comienzan extrayendo datos de varios sitios web. Llamamos a este proceso “web scraping” (o “scraping”, que significa “raspar”). Aunque una persona puede llevar a cabo este proceso de manera manual, el término “web scraping” a menudo se refiere a métodos automatizados ejecutados utilizando un rastreador web (“web crawler”).
Como ejemplos de proyectos donde el proceso de web scraping añade una valiosa cantidad de información podemos mencionar los de experiencia del cliente (o también los de experiencia del paciente o la experiencia del empleado), la optimización dinámica de los precios, el monitoreo de la competencia o la verificación del cumplimiento normativo.