Published on

Wrangling de Strings, Números y Objetos de Fecha y Tiempo en R

Authors
  • avatar
    Name
    Jordan Rodriguez
    Twitter

Wrangling de Strings, Números y Objetos de Fecha y Tiempo en R

En este tutorial, exploraremos técnicas esenciales para trabajar con strings, números y objetos de fecha y tiempo en R. Estas habilidades son fundamentales para limpiar, transformar y analizar datos de manera eficiente.


1. Wrangling de Strings (Cadenas de Texto)

1.1 Crear y Manipular Strings

# Concatenar cadenas
cadena1 <- "Análisis"
cadena2 <- "Datos"
resultado <- paste(cadena1, cadena2)
print(resultado)
## [1] "Análisis Datos"

# Extraer una subcadena
texto <- "Wrangling de Datos"
subcadena <- substr(texto, 1, 9)
print(subcadena)
## [1] "Wrangling"

# Cambiar mayúsculas y minúsculas
mayusculas <- toupper("wrangling de datos")
print(mayusculas)
## [1] "WRANGLING DE DATOS"

minusculas <- tolower("WRANGLING DE DATOS")
print(minusculas)
## [1] "wrangling de datos"

# Reemplazar patrones
library(stringr)
reemplazo <- str_replace("2024-01-01", "-", "/")
print(reemplazo)
## [1] "2024/01/01"

1.2 Buscar y Detectar Patrones

# Buscar posiciones de patrones
texto <- "Limpieza, Wrangling, Visualización"
posicion <- grep("Wrangling", texto)
print(posicion)
## [1] 1

# Detectar si un texto contiene un patrón
deteccion <- grepl("Datos", "Wrangling de Datos")
print(deteccion)
## [1] TRUE

2. Wrangling de Números

2.1 Operaciones Matemáticas Básicas

# Operaciones básicas
a <- 10
b <- 5
suma <- a + b
print(suma)
## [1] 15

producto <- a * b
print(producto)
## [1] 50

# Operaciones vectorizadas
vector <- c(1, 2, 3, 4)
vector_doble <- vector * 2
print(vector_doble)
## [1] 2 4 6 8

vector_sumado <- vector + c(10, 20, 30, 40)
print(vector_sumado)
## [1] 11 22 33 44

2.2 Medidas Estadísticas Descriptivas

# Estadísticas básicas
datos <- c(10, 20, 30, 40, 50)
media <- mean(datos)
print(media)
## [1] 30

mediana <- median(datos)
print(mediana)
## [1] 30

desviacion <- sd(datos)
print(desviacion)
## [1] 15.81139

# Percentiles
percentiles <- quantile(datos, c(0.25, 0.5, 0.75))
print(percentiles)
##   25%   50%   75%
## 20.00 30.00 40.00

3. Wrangling de Objetos de Fecha y Tiempo

3.1 Crear y Manipular Fechas

library(lubridate)

# Crear objetos de fecha
fecha1 <- ymd("2024-01-01")
print(fecha1)
## [1] "2024-01-01"

fecha2 <- mdy("01-01-2024")
print(fecha2)
## [1] "2024-01-01"

# Extraer componentes
anio <- year(fecha1)
print(anio)
## [1] 2024

mes <- month(fecha2)
print(mes)
## [1] 1

dia <- day(fecha1)
print(dia)
## [1] 1

3.2 Operaciones Aritméticas con Fechas

# Sumar y restar tiempo
fecha <- ymd("2024-01-01")
nueva_fecha <- fecha + days(7)
print(nueva_fecha)
## [1] "2024-01-08"

fecha_reducida <- fecha - months(1)
print(fecha_reducida)
## [1] "2023-12-01"

# Intervalos de tiempo
intervalo <- interval(ymd("2024-01-01"), ymd("2024-12-31"))
hoy <- today() %within% intervalo
print(hoy)
## [1] TRUE

3.3 Formateo de Fechas

# Formatear fechas
fecha_formateada <- format(fecha1, "%d-%B-%Y")
print(fecha_formateada)
## [1] "01-Enero-2024"

4. Consejos Finales y Buenas Prácticas

  1. Comprender los datos: Antes de realizar operaciones, asegúrate de entender el tipo de dato con el que estás trabajando (string, número o fecha).
  2. Usar librerías: Paquetes como stringr y lubridate simplifican muchas tareas complejas.
  3. Verificar resultados: Siempre valida los resultados de las operaciones, especialmente en análisis crítico.

Conclusión

Este tutorial te ha mostrado cómo manejar strings, números y objetos de fecha y tiempo en R. Dominar estas técnicas es esencial para cualquier analista de datos, ya que facilita la limpieza, transformación y análisis de conjuntos de datos complejos.

¡Ahora estás listo para aplicar estas técnicas en tus proyectos de análisis de datos!