Tal vez. Hay muchas variables en juego, y mucho depende del tipo de datos que tenga disponible y del tipo de análisis que intenta realizar. Mi última experiencia al intentar hacer esto ocurrió hace varios años e involucró la clasificación de documentos (utilizando una implementación de Naive Bayes propia) y el agrupamiento de documentos (utilizando CLUTO). Los datos de origen provinieron de una base de datos de “Informe de condición” en una gran central nuclear que por lo general vio de 2000 a 2500 informes por mes. El propósito de este ejercicio, que generalmente se realiza trimestralmente como un “Análisis de tendencias”, fue identificar grupos de problemas o tendencias, a menudo relacionadas con el comportamiento humano, que podrían requerir algún tipo de acción correctiva. El análisis general aún incluía un componente significativo realizado por el hombre, pero los métodos de clasificación y agrupación de documentos produjeron mejoras significativas en la calidad de los resultados finales y la cantidad de esfuerzo requerido para obtenerlos.
Descargo de responsabilidad: no soy un científico de datos o un programador. Mi interés en hacer todo lo anterior fue simplemente para ahorrar tiempo y esfuerzo realizando las actividades de análisis de tendencias trimestrales.