- Published on
Wrangling de Strings, Números y Objetos de Fecha y Tiempo en R
- Authors
- Name
- Jordan Rodriguez
Wrangling de Strings, Números y Objetos de Fecha y Tiempo en R
En este tutorial, exploraremos técnicas esenciales para trabajar con strings, números y objetos de fecha y tiempo en R. Estas habilidades son fundamentales para limpiar, transformar y analizar datos de manera eficiente.
1. Wrangling de Strings (Cadenas de Texto)
1.1 Crear y Manipular Strings
# Concatenar cadenas
cadena1 <- "Análisis"
cadena2 <- "Datos"
resultado <- paste(cadena1, cadena2)
print(resultado)
## [1] "Análisis Datos"
# Extraer una subcadena
texto <- "Wrangling de Datos"
subcadena <- substr(texto, 1, 9)
print(subcadena)
## [1] "Wrangling"
# Cambiar mayúsculas y minúsculas
mayusculas <- toupper("wrangling de datos")
print(mayusculas)
## [1] "WRANGLING DE DATOS"
minusculas <- tolower("WRANGLING DE DATOS")
print(minusculas)
## [1] "wrangling de datos"
# Reemplazar patrones
library(stringr)
reemplazo <- str_replace("2024-01-01", "-", "/")
print(reemplazo)
## [1] "2024/01/01"
1.2 Buscar y Detectar Patrones
# Buscar posiciones de patrones
texto <- "Limpieza, Wrangling, Visualización"
posicion <- grep("Wrangling", texto)
print(posicion)
## [1] 1
# Detectar si un texto contiene un patrón
deteccion <- grepl("Datos", "Wrangling de Datos")
print(deteccion)
## [1] TRUE
2. Wrangling de Números
2.1 Operaciones Matemáticas Básicas
# Operaciones básicas
a <- 10
b <- 5
suma <- a + b
print(suma)
## [1] 15
producto <- a * b
print(producto)
## [1] 50
# Operaciones vectorizadas
vector <- c(1, 2, 3, 4)
vector_doble <- vector * 2
print(vector_doble)
## [1] 2 4 6 8
vector_sumado <- vector + c(10, 20, 30, 40)
print(vector_sumado)
## [1] 11 22 33 44
2.2 Medidas Estadísticas Descriptivas
# Estadísticas básicas
datos <- c(10, 20, 30, 40, 50)
media <- mean(datos)
print(media)
## [1] 30
mediana <- median(datos)
print(mediana)
## [1] 30
desviacion <- sd(datos)
print(desviacion)
## [1] 15.81139
# Percentiles
percentiles <- quantile(datos, c(0.25, 0.5, 0.75))
print(percentiles)
## 25% 50% 75%
## 20.00 30.00 40.00
3. Wrangling de Objetos de Fecha y Tiempo
3.1 Crear y Manipular Fechas
library(lubridate)
# Crear objetos de fecha
fecha1 <- ymd("2024-01-01")
print(fecha1)
## [1] "2024-01-01"
fecha2 <- mdy("01-01-2024")
print(fecha2)
## [1] "2024-01-01"
# Extraer componentes
anio <- year(fecha1)
print(anio)
## [1] 2024
mes <- month(fecha2)
print(mes)
## [1] 1
dia <- day(fecha1)
print(dia)
## [1] 1
3.2 Operaciones Aritméticas con Fechas
# Sumar y restar tiempo
fecha <- ymd("2024-01-01")
nueva_fecha <- fecha + days(7)
print(nueva_fecha)
## [1] "2024-01-08"
fecha_reducida <- fecha - months(1)
print(fecha_reducida)
## [1] "2023-12-01"
# Intervalos de tiempo
intervalo <- interval(ymd("2024-01-01"), ymd("2024-12-31"))
hoy <- today() %within% intervalo
print(hoy)
## [1] TRUE
3.3 Formateo de Fechas
# Formatear fechas
fecha_formateada <- format(fecha1, "%d-%B-%Y")
print(fecha_formateada)
## [1] "01-Enero-2024"
4. Consejos Finales y Buenas Prácticas
- Comprender los datos: Antes de realizar operaciones, asegúrate de entender el tipo de dato con el que estás trabajando (string, número o fecha).
- Usar librerías: Paquetes como
stringr
ylubridate
simplifican muchas tareas complejas. - Verificar resultados: Siempre valida los resultados de las operaciones, especialmente en análisis crítico.
Conclusión
Este tutorial te ha mostrado cómo manejar strings, números y objetos de fecha y tiempo en R. Dominar estas técnicas es esencial para cualquier analista de datos, ya que facilita la limpieza, transformación y análisis de conjuntos de datos complejos.
¡Ahora estás listo para aplicar estas técnicas en tus proyectos de análisis de datos!