We may earn an affiliate commission when you visit our partners.
Course image
Course image
Coursera logo

Introducción a la ciencia de datos aplicada

John Calvo Martínez and Harry Cristhian Torres Moreno

Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante comprenderá los fundamentos de la ciencia de datos, las características de un científico de datos, las herramientas que utiliza, la metodología que se debe seguir para este estilo de proyectos, y estará en capacidad de aplicar técnicas estadísticas para la construcción e interpretación de modelos analíticos descriptivos.

Read more

Este curso es una primera inmersión en el mundo de la ciencia de datos, en el cual el estudiante comprenderá los fundamentos de la ciencia de datos, las características de un científico de datos, las herramientas que utiliza, la metodología que se debe seguir para este estilo de proyectos, y estará en capacidad de aplicar técnicas estadísticas para la construcción e interpretación de modelos analíticos descriptivos.

El curso consta de 4 módulos, cada uno de una semana, en los cuales al final del mismo, se tiene una lección dedicada al desarrollo del proyecto del curso. Los módulos son:

Módulo 1. La ciencia de datos y los científicos de datos: En este módulo, se presenta los aspectos fundamentales de la ciencia de datos, la metodología ASUM-DM para la implementación de estos proyectos y la metodología design thinking para identificar problemas y oportunidades de negocio.

Módulo 2. Análisis exploratorio de datos: En este módulo, se presenta los conceptos asociados a estadística descriptiva y exploratoria univariada, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.

Módulo 3. Modelos analíticos basados en estadística bivariada: En este módulo, se presenta los conceptos asociados a pruebas de correlación y análisis de tablas de contingencia, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.

Módulo 4. Comparaciones entre grupos y validación de modelos estadísticos: En este módulo, se presenta los conceptos asociados a ANOVAS a una y dos vías, y una ejemplificación de estos mediante el uso de la herramienta Jupyter Notebook, los cuales son utilizados para validar hipótesis de negocio.

Este curso está pensado para personas de diferentes disciplinas que quieran adentrarse en el mundo de la ciencia de datos, que estén iniciando estudios universitarios o con títulos de técnicos o tecnológicos, así mismo, se recomienda tener un background de conocimientos básicos en probabilidad y estadística. El aspirante a tomar este curso puede provenir de cualquier campo del conocimiento ya sea de gobierno, la industria, la consultoría, la academia, etc.

Para el desarrollo de este curso, es necesario la instalación de un programa especial (Anaconda – Jupyter Notebook) con el fin de poder realizar los análisis de los datos a través del lenguaje de programación Python, es recomendable que el equipo cuente con más de 4GB de RAM y espacio en disco duro superior a 1GB.

Enroll now

What's inside

Syllabus

La ciencia de datos y los científicos de datos
Bienvenidos al primer módulo del curso introducción a la ciencia de datos. En este módulo veremos distintos tópicos que te permitirán iniciar en el fascinante mundo de la ciencia de datos, en particular veremos una definición de ciencia de datos y algunos ejemplos en múltiples disciplinas en donde se pueden implementar proyectos de ciencia de datos, Así mismo, te presentaremos una primera metodología denominada ASUM-DM que te ayudará a desarrollar este tipo de proyectos y una segunda metodología denominada Design Thinking que te permitirá encontrar oportunidades analíticas en el contexto en donde te desempeñas. Finalmente, te presentaremos un caso de uso para que pongas en prácticas tus conocimientos.
Read more
Análisis exploratorio de datos
Bienvenidos al segundo módulo del curso introducción a la ciencia de datos. En este módulo veremos nuestras primeras herramientas para realizar un primer análisis de datos con el fin de encontrar nuestros primeros insights relevantes para el negocio. En este módulo, veremos inicialmente los conceptos de estadística univariada, en particular se estudiarán las medidas de tendencia central, de localización o de posición y medidas de variabilidad. Así mismo, aprenderemos a representar gráficamente nuestros datos con el fin de validar hipótesis de negocio. Adicional a lo anterior en este módulo vas a tener la oportunidad de ver cómo se aplican los distintos tópicos a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook. Finalmente, te presentaremos de nuevo el caso de uso de Airbnb para que pongas en prácticas tus conocimientos.
Modelos analíticos basados en estadística bivariada
Bienvenidos al tercer módulo del curso introducción a la ciencia de datos. En el anterior módulo, aprendimos sobre cómo validar nuestras primeras hipótesis de negocio a través del uso de estadística exploratoria univariada, la cual nos permitía analizar cada variable por separado, ahora, nos enfrentaremos al reto de analizar dos variables al mismo tiempo, en este módulo, estudiaremos los conceptos de correlación, los cuales nos permitirá analizar dos variables cuantitativas al tiempo, adicional a ello, en este módulo tendrás la oportunidad de estudiar sobre tablas de contingencia y pruebas chi cuadrado las cuales nos ayudarán analizar dos variables categóricas al tiempo. Finalmente, vas a tener la oportunidad de ver cómo se aplican los distintos tópicos vistos en este módulo a un caso de uso enfocado en el sector retail mediante el uso de la herramienta Jupyter Notebook y pondrás en prácticas tus conocimientos aplicando todos los conceptos vistos en este módulo al caso de uso de Airbnb.
Comparaciones entre grupos y validación de modelos estadísticos
Bienvenido al cuarto módulo del curso de Introducción a la ciencia de datos aplicada, denominado comparaciones entre grupos y validación de modelos estadísticos. En este módulo te voy a presentar 2 casos que he seleccionado con la intención de mostrarte la importancia de los contrastes de hipótesis y mediante pruebas de significancia estadística en los diferentes proyectos que realicemos. En ellos, podrás observar por qué es necesario validar correctamente nuestras hipótesis.

Good to know

Know what's good
, what to watch for
, and possible dealbreakers
Fomenta una primera aproximación al análisis estadístico descriptivo
Proporciona una base para el desarrollo de modelos analíticos basados en estadística bivariada
Se recomienda tener conocimientos básicos en probabilidad y estadística
Requiere la instalación de un programa especial (Anaconda - Jupyter Notebook) para el análisis de datos
El equipo debe contar con más de 4GB de RAM y espacio en disco duro superior a 1GB

Save this course

Save Introducción a la ciencia de datos aplicada to your list so you can find it easily later:
Save

Activities

Be better prepared before your course. Deepen your understanding during and after it. Supplement your coursework and achieve mastery of the topics covered in Introducción a la ciencia de datos aplicada with these activities:
Repaso de Estadística Básica
Refrescar los conocimientos fundamentales de estadística antes de comenzar el curso.
Show steps
  • Revisar los conceptos básicos de estadística descriptiva e inferencial.
  • Practicar el cálculo de medidas de tendencia central y variabilidad.
  • Resolver problemas relacionados con pruebas de hipótesis y estimación de parámetros.
Búsqueda de Mentores
Obtener orientación y apoyo de mentores expertos en el campo de la ciencia de datos.
Show steps
  • Identificar a los mentores potenciales en la industria o la academia.
  • Contactar a los mentores y solicitar su orientación.
  • Establecer reuniones regulares para discutir el progreso y recibir consejos.
Lectura de 'Introducción a la Ciencia de Datos'
Fortalecer la base de conocimientos en ciencia de datos leyendo un libro introductorio.
Show steps
  • Obtener una copia del libro 'Introducción a la Ciencia de Datos'.
  • Leer el libro y tomar notas sobre los conceptos clave.
  • Resolver los ejercicios y problemas al final de cada capítulo.
  • Discutir los conceptos con compañeros de clase o en un foro en línea.
Six other activities
Expand to see all activities and additional details
Show all nine activities
Organización de Materiales del Curso
Mejorar la retención y el acceso a los materiales del curso organizándolos y revisándolos regularmente.
Show steps
  • Recopilar y organizar notas de clase, tareas y exámenes.
  • Mantener un cuaderno o carpeta digital para todos los materiales.
  • Revisar los materiales regularmente para reforzar la comprensión.
Seguimiento de Tutoriales de Jupyter Notebook
Mejorar las habilidades en el uso de Jupyter Notebook para el análisis de datos.
Show steps
  • Identificar tutoriales relevantes sobre Jupyter Notebook.
  • Seguir los tutoriales paso a paso.
  • Practicar el uso de las funcionalidades de Jupyter Notebook.
  • Resolver problemas y dudas mientras se siguen los tutoriales.
Participación en Grupos de Estudio
Mejorar la comprensión del material del curso a través del intercambio de conocimientos y la resolución de problemas con compañeros.
Show steps
  • Unirse o formar un grupo de estudio con otros estudiantes.
  • Establecer horarios de reunión regulares.
  • Revisar los conceptos del curso, discutir las tareas y resolver problemas juntos.
  • Ayudarse mutuamente a comprender las áreas desafiantes.
Análisis de Datos Prácticos
Fortalecer las habilidades de análisis de datos mediante la resolución de problemas prácticos.
Show steps
  • Buscar conjuntos de datos relevantes.
  • Importar y limpiar los conjuntos de datos.
  • Realizar análisis exploratorios y descriptivos.
  • Construir y evaluar modelos analíticos.
  • Interpretar y comunicar los resultados.
Proyecto de Exploración de Datos
Aplicar los conceptos y técnicas aprendidos en el curso a un proyecto práctico de exploración de datos.
Show steps
  • Identificar un conjunto de datos relevante.
  • Importar y limpiar los datos.
  • Realizar análisis exploratorios utilizando técnicas estadísticas.
  • Construir y evaluar modelos predictivos.
  • Escribir un informe que resuma los hallazgos y las recomendaciones.
Creación de Infografías Analíticas
Desarrollar habilidades de comunicación visual mediante la creación de infografías que resuman los hallazgos analíticos.
Show steps
  • Identificar los hallazgos clave del análisis de datos.
  • Seleccionar las herramientas y plantillas de infografía adecuadas.
  • Diseñar y crear las infografías.
  • Revisar y editar las infografías para mejorar la claridad y el impacto.

Career center

Learners who complete Introducción a la ciencia de datos aplicada will develop knowledge and skills that may be useful to these careers:
Data Analyst
Data Analysts are problem solvers who find the best methods, techniques, and tools to turn raw data into meaningful insights. To be an effective Data Analyst, you will need to understand how to apply your statistical knowledge to interpret data, identify patterns and trends, and develop analytical models. All of these components are covered in this introductory Data Science course, and by studying the course, you will gain experience with the Jupyter Notebook, a valuable tool that Data Analysts must use on the job.
Data Scientist
Data Scientists develop and maintain pipelines to handle and clean raw data, train and evaluate machine learning models, and implement data-processing systems. This course will introduce you to the basics of Data Science, and help you build a foundation across the core competencies of data preprocessing, feature engineering, machine learning model development, and data visualization. You will also learn how to use Jupyter Notebooks and Python, all of which are frequently used by Data Scientists.
Machine Learning Engineer
Machine Learning Engineers develop, test, and implement machine learning models and algorithms. One of the core responsibilities of Machine Learning Engineers is to develop the appropriate statistical models for the predictive analytics that drive business decisions. This introductory Data Science course will help you understand the fundamentals of machine learning and artificial intelligence. You will also learn about supervised learning, unsupervised learning, and ensemble methods, as well as develop skills in Python, which are essential for the field of Machine Learning.
Business Analyst
Business Analysts anticipate change and identify business needs by analyzing business models and data. This course will help you to build a strong foundation in data analysis and visualization. You will learn how to collect, clean, and analyze data, interpret results, and present your findings in a clear and concise way. These are essential skills for Business Analysts.
Data Engineer
Data Engineers clean, structure, and maintain big data for analysis. They also develop and maintain data pipelines to ensure that data is consistent and accessible for analysis. In this Data Science course, you will learn the fundamentals of data engineering, including data wrangling, data transformation, and data integration. You will also gain experience using Python, a commonly-used programming language for Data Engineers.
Quantitative Analyst
Quantitative Analysts use mathematical and statistical models to analyze financial data. They use this data to make investment recommendations and develop trading strategies. This introductory Data Science course will introduce you to the basics of data analysis, statistics, and probability. You will also learn how to use Python and Jupyter Notebooks, tools commonly-used by professionals in the field.
Operations Research Analyst
Operations Research Analysts use advanced analytical techniques to solve complex problems in business and industry. They use a variety of techniques such as linear programming and simulation to optimize processes. Many Operations Research Analysts begin their careers by earning a master's degree. This course may be useful for students who wish to continue their education in operations research.
Statistician
Statisticians collect, analyze, interpret, and present data. This course will introduce you to the fundamentals of statistics, including descriptive statistics, inferential statistics, and regression analysis. You will also gain experience working with real-world data sets using Python. This foundation in statistical techniques will aid you if you wish to pursue a career as a Statistician.
Market Researcher
Market Researchers conduct surveys, analyze data, and develop strategies to help businesses understand their customers. This course will help you develop the skills you need to collect, analyze, and interpret data, which will be very useful in this career. You will also gain experience using Python, a programming language used by many Market Researchers.
Financial Analyst
Financial Analysts use data to make investment recommendations and develop financial plans. This course will introduce you to the basics of data analysis, statistics, and probability. You will also learn how to use Python to analyze financial data. This will help prepare you for the role of a financial analyst, where you will be expected to understand data, trends, and patterns that affect the financial markets.
Consultant
Consultants help businesses solve problems and improve their performance using data. This course will help you develop foundational skills in data analysis and visualization. You will also learn how to apply design thinking metodologies to solve problems. These skills will be valuable to you as a Consultant.
Product Manager
Product Managers develop and launch new products and features. They use data to understand customer needs and develop products, and they use statistical techniques to track the success of the products they develop. This course will provide you with the basic understanding of data analysis, statistics, and probability that is useful for Product Managers.
Software Engineer
Software Engineers use data to build software applications. They use statistical techniques to analyze user behavior and improve the user experience. This course will provide you with a foundation in data analysis and statistics that will be useful in your role as a Software Engineer.
Web Analyst
Web Analysts collect and analyze data to improve the performance of websites and online marketing campaigns. This course will introduce you to the basics of data analytics and visualization. You will also learn how to use Python to analyze web data. This will help prepare you to enter the field of web analytics.
Data Architect
Data Architects design and build data management systems. They use their knowledge of data to ensure that data is stored, managed, and accessed efficiently. This course will provide you with a foundation in data management and data analysis, which you can leverage as a Data Architect.

Reading list

We've selected ten books that we think will supplement your learning. Use these to develop background knowledge, enrich your coursework, and gain a deeper understanding of the topics covered in Introducción a la ciencia de datos aplicada.
Este libro completo cubre una amplia gama de temas de ciencia de datos en Python, incluyendo la manipulación de datos, el análisis estadístico y el aprendizaje automático. Es una referencia valiosa para los profesionales que buscan dominar las herramientas y técnicas de ciencia de datos.
Este libro proporciona una guía práctica para diseñar y desarrollar proyectos de ciencia de datos. Cubre temas como recopilación de datos, preparación de datos, modelado y evaluación, lo que lo convierte en un recurso valioso para los científicos de datos que buscan mejorar sus habilidades de diseño de proyectos.
Este libro de texto clásico proporciona una introducción integral al aprendizaje automático desde una perspectiva estadística. Cubre una amplia gama de algoritmos de aprendizaje automático y técnicas de modelado, lo que lo convierte en un recurso valioso para los científicos de datos que buscan profundizar su comprensión de los métodos estadísticos.
Este libro completo proporciona una introducción integral al aprendizaje profundo, que es un subcampo del aprendizaje automático que se centra en el uso de redes neuronales artificiales. Es un recurso esencial para los científicos de datos que buscan comprender los principios y las aplicaciones del aprendizaje profundo.
Este libro explora los principios y las prácticas de la ciencia de datos responsable, enfocándose en cómo garantizar que los proyectos de ciencia de datos sean éticos, equitativos y transparentes. Es una lectura obligada para los científicos de datos que buscan convertirse en practicantes responsables.
Este libro proporciona una introducción completa a la visualización de datos, una habilidad esencial para los científicos de datos. Cubre principios de diseño, herramientas de visualización y técnicas para comunicar información de manera efectiva utilizando visualizaciones.
Este libro describe las prácticas ágiles para el desarrollo y la implementación de proyectos de ciencia de datos. Proporciona orientación sobre cómo incorporar procesos ágiles en el ciclo de vida de la ciencia de datos, lo que resulta en proyectos más eficientes y efectivos.
Esta guía práctica se centra en el uso de la biblioteca de Python Pandas para análisis de datos. Proporciona instrucciones paso a paso sobre cómo manipular, explorar y visualizar datos utilizando Pandas.
Este libro enseña las técnicas para comunicar de manera efectiva los resultados de la ciencia de datos a través de la narración de historias. Proporciona orientación sobre cómo estructurar historias, crear visualizaciones cautivadoras y presentar información de manera convincente.
Este libro proporciona una descripción general del proceso de pensamiento de diseño, que es una metodología centrada en el ser humano para resolver problemas y crear soluciones innovadoras. Es especialmente útil para los científicos de datos que buscan incorporar enfoques centrados en el ser humano en sus proyectos de ciencia de datos.

Share

Help others find this course page by sharing it with your friends and followers:

Similar courses

Here are nine courses similar to Introducción a la ciencia de datos aplicada.
Ciencia de datos energéticos
Most relevant
Visualización y manipulación de datos con Tableau
Most relevant
Introducción a las radiocomunicaciones
Most relevant
Metodología de la ciencia de datos
Most relevant
Introducción al Análisis de Datos
Most relevant
Introducción al Internet de las cosas (IoT) y sus...
Most relevant
Big Data: procesamiento y análisis
Most relevant
Estadísticas para la Ciencia de Datos con Python
Most relevant
Integración y preparación de datos
Most relevant
Our mission

OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.

Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.

Find this site helpful? Tell a friend about us.

Affiliate disclosure

We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.

Your purchases help us maintain our catalog and keep our servers humming without ads.

Thank you for supporting OpenCourser.

© 2016 - 2024 OpenCourser