- Published on
Crear un Environment con Conda para Data Science
- Authors
- Name
- Jordan Rodriguez
Tutorial: Crear un Environment con Conda para Data Science
En este tutorial, aprenderás cómo crear un environment con Conda para una versión específica de Python-R y un conjunto de librerías para Data Science especificadas en un archivo de texto. También aprenderás cómo instalar Miniconda y configurar Visual Studio Code para usar este environment a través de un notebook de Jupyter.
Paso 1: Instalar Miniconda
Descargar Miniconda:
- Visita la página de descargas de Miniconda y descarga el instalador adecuado para tu sistema operativo.
Instalar Miniconda:
- Ejecuta el instalador y sigue las instrucciones en pantalla para completar la instalación.
- Asegúrate de seleccionar la opción para agregar Miniconda a tu PATH durante la instalación.
Paso 2: Crear un Environment con Conda
Abrir una Terminal:
- Abre una terminal (Command Prompt en Windows, Terminal en macOS o Linux).
Crear un Nuevo Environment:
- Ejecuta el siguiente comando para crear un nuevo environment con una versión específica de Python (por ejemplo, Python 3.8):
conda create --name myenv python=3.8
- Ejecuta el siguiente comando para crear un nuevo environment con una versión específica de Python (por ejemplo, Python 3.8):
Activar el Environment:
- Activa el nuevo environment con el siguiente comando:
conda activate myenv
- Activa el nuevo environment con el siguiente comando:
Paso 3: Instalar Librerías para Data Science
Crear un Archivo de Texto con las Librerías:
- Crea un archivo de texto llamado
requirements.txt
y añade las librerías necesarias con sus versiones específicas. Ejemplo:numpy==1.21.2 pandas==1.3.3 matplotlib==3.4.3 seaborn==0.11.2 scikit-learn==0.24.2 jupyter==1.0.0
- Crea un archivo de texto llamado
Instalar las Librerías:
- Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo
requirements.txt
:pip install -r requirements.txt
- Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo
Paso 4: Configurar Visual Studio Code para Usar el Environment
Instalar Visual Studio Code:
- Visita la página de descargas de Visual Studio Code y descarga el instalador adecuado para tu sistema operativo.
- Ejecuta el instalador y sigue las instrucciones en pantalla para completar la instalación.
Instalar la Extensión de Python:
- Abre Visual Studio Code.
- Ve a la sección de extensiones (
Ctrl+Shift+X
en Windows,Cmd+Shift+X
en macOS). - Busca "Python" y haz clic en "Install" para instalar la extensión de Python.
Seleccionar el Environment en Visual Studio Code:
- Abre la Paleta de Comandos (
Ctrl+Shift+P
en Windows,Cmd+Shift+P
en macOS). - Escribe
Python: Select Interpreter
y selecciona el environmentmyenv
que acabas de crear.
- Abre la Paleta de Comandos (
Paso 5: Validar y Usar el Environment en un Notebook de Jupyter
Abrir un Notebook de Jupyter:
- En Visual Studio Code, abre la Paleta de Comandos (
Ctrl+Shift+P
en Windows,Cmd+Shift+P
en macOS). - Escribe
Jupyter: Create New Blank Notebook
y selecciona el environmentmyenv
como el kernel.
- En Visual Studio Code, abre la Paleta de Comandos (
Validar la Instalación:
En el nuevo notebook, ejecuta las siguientes celdas para importar las librerías y validar la instalación:
import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import sklearn print(f"Numpy version: {np.__version__}") print(f"Pandas version: {pd.__version__}") print(f"Matplotlib version: {plt.__version__}") print(f"Seaborn version: {sns.__version__}") print(f"Scikit-learn version: {sklearn.__version__}")
Paso Opcional 1: Crear un Environment para R con Conda
Abrir una Terminal:
- Abre una terminal (Command Prompt en Windows, Terminal en macOS o Linux).
Crear un Nuevo Environment para R:
- Ejecuta el siguiente comando para crear un nuevo environment con R:
conda create --name my_r_env r-base r-essentials
- Ejecuta el siguiente comando para crear un nuevo environment con R:
Activar el Environment:
- Activa el nuevo environment con el siguiente comando:
conda activate my_r_env
- Activa el nuevo environment con el siguiente comando:
Paso Opcional 2: Instalar Librerías Adicionales para R
Instalar Librerías Adicionales:
- Crea un archivo de texto llamado
r_requirements.txt
y añade las librerías necesarias. Ejemplo:dplyr ggplot2 tidyr readr shiny
- Crea un archivo de texto llamado
Instalar las Librerías desde el Archivo:
- Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo
r_requirements.txt
:while read requirement; do conda install -c r $requirement; done < r_requirements.txt
- Ejecuta el siguiente comando en la terminal para instalar todas las librerías listadas en el archivo
Paso Opcional 3: Configurar Visual Studio Code para Usar el Environment
Instalar la Extensión de R:
- Abre Visual Studio Code.
- Ve a la sección de extensiones (
Ctrl+Shift+X
en Windows,Cmd+Shift+X
en macOS). - Busca "R" y haz clic en "Install" para instalar la extensión de R.
Seleccionar el Environment en Visual Studio Code:
- Abre la Paleta de Comandos (
Ctrl+Shift+P
en Windows,Cmd+Shift+P
en macOS). - Escribe
R: Select Interpreter
y selecciona el environmentmy_r_env
que acabas de crear.
- Abre la Paleta de Comandos (
Paso Opcional 4: Validar y Usar el Environment en un Notebook de Jupyter
Abrir un Notebook de Jupyter:
- En Visual Studio Code, abre la Paleta de Comandos (
Ctrl+Shift+P
en Windows,Cmd+Shift+P
en macOS). - Escribe
Jupyter: Create New Blank Notebook
y selecciona el environmentmy_r_env
como el kernel.
- En Visual Studio Code, abre la Paleta de Comandos (
Validar la Instalación:
En el nuevo notebook, ejecuta las siguientes celdas para importar las librerías y validar la instalación:
library(dplyr) library(ggplot2) library(tidyr) library(readr) library(shiny) print("Librerías cargadas correctamente")
Conclusión
Este tutorial te ha mostrado cómo instalar Miniconda, crear un environment con Conda, instalar librerías para Data Science, configurar Visual Studio Code y validar el environment en un notebook de Jupyter.
Además, crear un environment para R con Conda, instalar librerías adicionales, configurar Visual Studio Code y validar el environment en un notebook de Jupyter. Estos pasos te ayudarán a configurar un entorno de desarrollo eficiente y reproducible para tus proyectos de Data Science con R y Pyhton.