Resumen y agenda
Lesson Maintainers: {{ page.maintainers | join: ‘,’ }}
Python es un lenguaje de programación general que es útil para escribir scripts para trabajar con datos de manera efectiva y reproducible.
Esta es una introducción a Python diseñada para participantes sin experiencia en programación. Estas lecciones pueden enseñarse en un día (~ 6 horas). Las lecciones empiezan con información básica sobre la sintaxis de Python, la interfaz de Jupyter Notebook, y continúan con cómo importar archivos CSV, usando el paquete Pandas para trabajar con DataFrames, cómo calcular la información resumen de un DataFrame, y una breve introducción en cómo crear visualizaciones. La última lección demuestra cómo trabajar con bases de datos directamente desde Python. Nota: los datos no han sido traducidos de la versión original en inglés, por lo que los nombres de variables se mantienen en inglés y los números de cada observación usan la sintaxis de habla inglesa (coma separador de miles y punto separador de decimales).
Antes de empezar
La enseñanza en Data Carpentry es práctica, y por tanto se fomenta que los participantes usen sus propias computadoras para asegurar la correcta configuración setup de las herramientas para un trabajo eficiente. Estas lecciones no asumen conocimientos previos sobre los temas presentados o herramientas usadas.
Para empezar, sigue las direcciones en Setup para bajar los datos a tu computadora y siguen las instrucciones de instalación.
Para instructores
Si enseñas esta lección en un taller, por favor lee las Notas de instructor.
Configuración | Descargar los archivos necesarios para la lección | |
Duration: 00h 00m | 1. Antes de comenzar | ¿Qué es Python y por qué debería aprenderlo? |
Duration: 00h 30m | 2. Breve introducción a la Programación en Python |
¿Qué es Python? ¿Porqué deberías aprender Python? |
Duration: 00h 30m | 3. Comenzando con datos |
¿Cómo importar datos en Python? ¿Qué es Pandas? ¿Por qué debería de usar Pandas para trabajar con datos? |
Duration: 01h 30m | 4. Indexación, segmentación y creación de subconjuntos a partir de DataFrames en Python |
¿Cómo puedo acceder a un dato específico en mi ‘dataset’? ¿Cómo pueden ayudarme Python y Pandas a analizar mis datos? |
Duration: 02h 30m | 5. Tipos de datos y formatos |
¿Qué tipos de datos pueden estar contenidos en un DataFrame? ¿Por qué es importante el tipo de datos? |
Duration: 03h 15m | 6. Combinando DataFrames con Pandas |
¿Puedo trabajar con datos de diferentes fuentes? ¿Cómo puedo combinar datos de diferentes datasets? |
Duration: 04h 00m | 7. Flujos de trabajo y automatización |
¿Puedo automatizar operaciones en Python? ¿Qué son las función y por qué debería usarlas? |
Duration: 05h 30m | 8. Creando gráficos con plotnine |
¿Cómo puedo visualizar datos en Python? ¿Qué es la ‘gramática de gráficos’? |
Duration: 07h 00m | 9. Entrada de datos y visualización - Matplotlib y Pandas |
¿Qué otras herramientas aparte de ggplot puedo usar para crear
gráficos? ¿Por qué usar Python para crear gráficos? |
Duration: 08h 45m | 10. Acceso a base de datos SQLite usando Python y Pandas |
¿Cómo conectarse a una base de datos SQLite desde Python? ¿Cómo extraer datos de una base de datos SQLite a un DataFrame de Python? ¿Cuáles son los beneficios de usar una base de datos en vez de un archivo CSV? |
Duration: 09h 30m | Final |
El horario real puede variar ligeramente dependiendo de los temas y ejercicios elegidos por la instructora.
Datos
Los datos para esta lección son del Portal Project Teaching Database - disponible en FigShare.
En esta lección usaremos los seis archivos enumerados a continuación. Descarga estos archivos a su computadora haciendo clic en este enlace, luego tendrás todo en un archivo comprimido. Tienes que descomprimir este archivo después de descargarlo.
O descarga cada archivo individualmente con los siguientes enlaces:
Software
Python es un lenguaje muy utilizado en la computación científica y también es ideal para la programación de propósito general. La instalación de todos los paquetes científicos individualmente puede ser un poco difícil, por lo que recomendamos un instalador todo en uno.
Para este taller utilizamos la versión 3.x.
Instalación de software
Usaremos Anaconda o Miniconda para instalar Python y los paquetes necesarios. Ambos usan Conda, pero Anaconda viene con Pandas, Jupyter Notebook, Numpy y Matplotlib preinstaladas, mientras que Miniconda no lo hace.
Instalación de Anaconda
Anaconda te instalará los paquetes.
Descarga e instala Anaconda
Descarga e instala Anaconda. Recuerde descargar e instalar el instalador para Python 3.x.
Instalación de Miniconda
Miniconda es una versión “ligera” de Anaconda. Si haces la instalación usando Miniconda, también necesitarás instalar los paquetes requeridos para el taller.
Descarga e instala Miniconda
Descarga e instala Miniconda siguiendo las instrucciones. Recuerda descargar y ejecutar el instalador para Python 3.x.
Abre un Jupyter Notebook
Después de instalar Python y los paquetes requeridos, abre un Jupyter Notebook escribiendo este comando en la terminal:
Un Jupyter Notebook se abrirá automáticamente en tu navegador. Si no es así, o si deseas utilizar un navegador diferente, abre este enlace: http://localhost:8888.
Para una breve introducción a Jupyter Notebooks, consulta nuestra página “Introducción a Jupyter Notebooks”.