Published on

Crear un Environment con Conda para Data Science

Authors
  • avatar
    Name
    Jordan Rodriguez
    Twitter

Tutorial: Crear un Environment con Conda para Data Science

En este tutorial, aprenderás cómo crear un environment con Conda para una versión específica de Python-R y un conjunto de librerías para Data Science especificadas en un archivo de texto. También aprenderás cómo instalar Miniconda y configurar Visual Studio Code para usar este environment a través de un notebook de Jupyter.

Paso 1: Instalar Miniconda

  1. Descargar Miniconda:

  2. Instalar Miniconda:

    • Ejecuta el instalador y sigue las instrucciones en pantalla para completar la instalación.
    • Asegúrate de seleccionar la opción para agregar Miniconda a tu PATH durante la instalación.

Paso 2: Crear un Environment con Conda

  1. Abrir una Terminal:

    • Abre una terminal (Command Prompt en Windows, Terminal en macOS o Linux).
  2. Crear un Nuevo Environment:

    • Ejecuta el siguiente comando para crear un nuevo environment con una versión específica de Python (por ejemplo, Python 3.8):
      conda create --name myenv python=3.8
      
  3. Activar el Environment:

    • Activa el nuevo environment con el siguiente comando:
      conda activate myenv
      

Paso 3: Instalar Librerías para Data Science

  1. Crear un Archivo de Texto con las Librerías:

    • Crea un archivo de texto llamado requirements.txt y añade las librerías necesarias con sus versiones específicas. Ejemplo:
      numpy==1.21.2
      pandas==1.3.3
      matplotlib==3.4.3
      seaborn==0.11.2
      scikit-learn==0.24.2
      jupyter==1.0.0
      
  2. Instalar las Librerías:

    • Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo requirements.txt:
      pip install -r requirements.txt
      

Paso 4: Configurar Visual Studio Code para Usar el Environment

  1. Instalar Visual Studio Code:

    • Visita la página de descargas de Visual Studio Code y descarga el instalador adecuado para tu sistema operativo.
    • Ejecuta el instalador y sigue las instrucciones en pantalla para completar la instalación.
  2. Instalar la Extensión de Python:

    • Abre Visual Studio Code.
    • Ve a la sección de extensiones (Ctrl+Shift+X en Windows, Cmd+Shift+X en macOS).
    • Busca "Python" y haz clic en "Install" para instalar la extensión de Python.
  3. Seleccionar el Environment en Visual Studio Code:

    • Abre la Paleta de Comandos (Ctrl+Shift+P en Windows, Cmd+Shift+P en macOS).
    • Escribe Python: Select Interpreter y selecciona el environment myenv que acabas de crear.

Paso 5: Validar y Usar el Environment en un Notebook de Jupyter

  1. Abrir un Notebook de Jupyter:

    • En Visual Studio Code, abre la Paleta de Comandos (Ctrl+Shift+P en Windows, Cmd+Shift+P en macOS).
    • Escribe Jupyter: Create New Blank Notebook y selecciona el environment myenv como el kernel.
  2. Validar la Instalación:

    • En el nuevo notebook, ejecuta las siguientes celdas para importar las librerías y validar la instalación:

      import numpy as np
      import pandas as pd
      import matplotlib.pyplot as plt
      import seaborn as sns
      import sklearn
      
      print(f"Numpy version: {np.__version__}")
      print(f"Pandas version: {pd.__version__}")
      print(f"Matplotlib version: {plt.__version__}")
      print(f"Seaborn version: {sns.__version__}")
      print(f"Scikit-learn version: {sklearn.__version__}")
      

Paso Opcional 1: Crear un Environment para R con Conda

  1. Abrir una Terminal:

    • Abre una terminal (Command Prompt en Windows, Terminal en macOS o Linux).
  2. Crear un Nuevo Environment para R:

    • Ejecuta el siguiente comando para crear un nuevo environment con R:
      conda create --name my_r_env r-base r-essentials
      
  3. Activar el Environment:

    • Activa el nuevo environment con el siguiente comando:
      conda activate my_r_env
      

Paso Opcional 2: Instalar Librerías Adicionales para R

  1. Instalar Librerías Adicionales:

    • Crea un archivo de texto llamado r_requirements.txt y añade las librerías necesarias. Ejemplo:
      dplyr
      ggplot2
      tidyr
      readr
      shiny
      
  2. Instalar las Librerías desde el Archivo:

    • Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo r_requirements.txt:
      while read requirement; do conda install -c r $requirement; done < r_requirements.txt
      

Paso Opcional 3: Configurar Visual Studio Code para Usar el Environment

  1. Instalar la Extensión de R:

    • Abre Visual Studio Code.
    • Ve a la sección de extensiones (Ctrl+Shift+X en Windows, Cmd+Shift+X en macOS).
    • Busca "R" y haz clic en "Install" para instalar la extensión de R.
  2. Seleccionar el Environment en Visual Studio Code:

    • Abre la Paleta de Comandos (Ctrl+Shift+P en Windows, Cmd+Shift+P en macOS).
    • Escribe R: Select Interpreter y selecciona el environment my_r_env que acabas de crear.

Paso Opcional 4: Validar y Usar el Environment en un Notebook de Jupyter

  1. Abrir un Notebook de Jupyter:

    • En Visual Studio Code, abre la Paleta de Comandos (Ctrl+Shift+P en Windows, Cmd+Shift+P en macOS).
    • Escribe Jupyter: Create New Blank Notebook y selecciona el environment my_r_env como el kernel.
  2. Validar la Instalación:

    • En el nuevo notebook, ejecuta las siguientes celdas para importar las librerías y validar la instalación:

      library(dplyr)
      library(ggplot2)
      library(tidyr)
      library(readr)
      library(shiny)
      
      print("Librerías cargadas correctamente")
      

Conclusión

Este tutorial te ha mostrado cómo instalar Miniconda, crear un environment con Conda, instalar librerías para Data Science, configurar Visual Studio Code y validar el environment en un notebook de Jupyter.

Además, crear un environment para R con Conda, instalar librerías adicionales, configurar Visual Studio Code y validar el environment en un notebook de Jupyter. Estos pasos te ayudarán a configurar un entorno de desarrollo eficiente y reproducible para tus proyectos de Data Science con R y Pyhton.