Este documento presenta una introducción al uso de R para minería de datos de gran escala. Explica brevemente las aplicaciones y algoritmos de minería de datos, e introduce R como un entorno estadístico de código abierto. Luego, describe estrategias para usar R en paralelo y superar sus limitaciones para datos masivos, incluyendo el paquete Snow y ejemplos de k-means paralelo. Finalmente, menciona el uso de datos abiertos y visualización en R.
Related topics: