We may earn an affiliate commission when you visit our partners.
Course image
Maria Del Pilar Villamil Giraldo and John Calvo Martínez

El manejo de datos que permita generar conocimiento útil para una organización es cada vez más importante en los trabajos de alta demanda al día de hoy. Es así como este curso presenta al estudiante una metodología para el desarrollo de proyectos basados en datos, en especial de ciencia de datos. Hace énfasis en los procesos de exploración, transformación, integración de fuentes de datos estructuradas y no estructuradas con el fin de mejorar la eficiencia y calidad en los resultados de análisis posteriores como los basados en modelos analíticos. El estudiante tendrá a su disposición diferentes tutoriales con ejemplos en contextos cercanos a la realidad para comprender mejor los conceptos desarrollados en el curso y practicar su aprendizaje con el punto de extensión propuesto en cada tutorial. De igual manera, contará con videos, lecturas ilustradas y sugerencias de lecturas para profundizar en los temas de interés. Consideramos que esto le permitirá al estudiante afianzar sus conocimientos llevando a la práctica lo aprendido.

Enroll now

What's inside

Syllabus

Exploración y visualización de datos
Bienvenido al primer módulo del curso. En este módulo trabajaremos sobre la metodología para realizar proyectos centrados en datos, en especial de ciencia de datos. Adicionalmente, profundizaremos en la etapa de entendimiento de los datos, para lo cual comprenderemos temas relacionados con perfilamiento, exploración de datos y visualización de los mismos. De igual manera, introduciremos el caso del proyecto y tendremos una serie de videos en diferentes sectores que espero te ayuden a lograr los objetivos del módulo y disfrutarlo.
Read more
Preparar datos para mejorar la calidad de los datos
Bienvenido al segundo módulo del curso, centrado en la forma de preparar datos para mejorar su calidad. En este módulo tendrás la oportunidad de entender qué es calidad de datos, describiremos algunas de las dimensiones de calidad más frecuentes en fuentes de datos y las acompañaremos de videos, tutoriales y actividades que te permitirán comprender estas temáticas, entender los problemas que se generan en los datos relacionados con las dimensiones de calidad y, algunas formas de solucionarlos.
La Integración de Datos
Hola, en este módulo nos centraremos en la integración de datos. Con ello en mente, nos enfocaremos en las diferentes formas de unir dos o más fuentes de información con el fin de generar análisis y conclusiones que no habríamos podido obtener con información fragmentada. Allí recae el punto de importancia de aprender a integrar datos, pues la información integrada representa un valor para nuestros proyectos de Ciencias de Datos. Es por ello que en este módulo vamos a ver qué hay diferentes formas de unir diferentes fuentes de información, como lo son los joins, union y merge. Además, veremos los conceptos de lookup y de filtrado condicional de información en Pandas. Podrás aplicar todo lo aprendido en las actividades del módulo y en los ejercicios propuestos. ¡Espero te guste!
Transformar datos para construir modelos analíticos
Bienvenido al cuarto y último modulo del curso. En este módulo veras como transformar datos, con el fin de tener un conjunto de datos que podamos trabajar fácilmente al momento de entrenar nuestros modelos de predicción. Vas a poder seleccionar y transformar atributos mediante técnicas como la normalización, la combinación de atributos para generar nuevas variables, la reducción de dimensionalidad y la transformación de texto. Tendrás la oportunidad de reforzar tu aprendizaje mediante ejercicios prácticos y tutoriales utilizando Python.

Good to know

Know what's good
, what to watch for
, and possible dealbreakers
Curso diseñado para estudiantes que buscan desarrollar habilidades en el manejo de datos para la generación de conocimiento útil en entornos laborales
Metodología clara y estructurada para el desarrollo de proyectos basados en datos, enfocada en ciencia de datos
Énfasis en procesos de exploración, transformación e integración de fuentes de datos estructuradas y no estructuradas
Tutoriales con ejemplos prácticos para reforzar el aprendizaje y facilitar la comprensión
Videos, lecturas ilustradas y lecturas complementarias para profundizar en los temas
Punto de extensión propuesto en cada tutorial para aplicar los conceptos aprendidos

Save this course

Save Integración y preparación de datos to your list so you can find it easily later:
Save

Activities

Be better prepared before your course. Deepen your understanding during and after it. Supplement your coursework and achieve mastery of the topics covered in Integración y preparación de datos with these activities:
Connect with experienced data scientists
Seek guidance and support from experienced professionals to accelerate your learning and gain valuable insights.
Show steps
  • Identify potential mentors within your network or through online platforms.
  • Reach out to mentors and request their guidance.
Review Statistics and Probability Concepts
Solidify your understanding of fundamental statistical and probabilistic concepts.
Browse courses on Statistics
Show steps
  • Revisit concepts of central tendency and dispersion
  • Review probability theory and distributions
Revise data visualization techniques
Improve your understanding and fluency with data visualization techniques to facilitate learning in this course.
Browse courses on Data Visualization
Show steps
  • Review common data visualization techniques such as bar charts, line charts, and scatter plots.
  • Practice creating data visualizations from scratch using a tool or library.
14 other activities
Expand to see all activities and additional details
Show all 17 activities
Data Visualization with Seaborn Tutorials
Enhance your data visualization skills by following comprehensive tutorials on Seaborn.
Browse courses on Data Visualization
Show steps
  • Create common data visualizations (e.g., bar charts, line plots)
  • Customize visualization appearance and style
Practice SQL Query Optimization
Refine your SQL skills by optimizing queries for speed and efficiency.
Browse courses on SQL
Show steps
  • Review SQL syntax and data structures
  • Practice writing optimized queries
Participate in data analysis discussion groups
Engage in discussions with peers to exchange ideas, learn from different perspectives, and improve your understanding of concepts.
Show steps
  • Join online or local discussion groups focused on data science.
  • Actively participate in discussions, asking questions and sharing your insights.
Participar en grupos de estudio de Ciencia de Datos
Le permitirá conectarse con compañeros, compartir conocimientos y reforzar su comprensión de los conceptos de Ciencia de Datos.
Show steps
  • Unirse o crear un grupo de estudio de Ciencia de Datos
  • Establecer un horario regular de reunión
  • Preparar temas para discutir y compartir
Pandas DataFrame Manipulation Drills
Reinforce your understanding of Pandas data manipulation techniques through repetitive exercises.
Browse courses on Data Manipulation
Show steps
  • Perform common DataFrame operations (e.g., filtering, sorting, grouping)
  • Practice data cleaning and preparation tasks
Solve data manipulation challenges
Enhance your ability to manipulate and transform data, which is crucial for data science projects.
Browse courses on Data Wrangling
Show steps
  • Find online resources or practice platforms that provide data manipulation challenges.
  • Solve data manipulation challenges regularly to improve your proficiency.
Resolver ejercicios de visualización de datos
Fortalecerá su comprensión de los conceptos de visualización de datos y le permitirá identificar patrones y tendencias en datos complejos.
Show steps
  • Revisar los conceptos básicos de visualización de datos
  • Practicar la creación de diferentes tipos de gráficos
  • Analizar conjuntos de datos y crear visualizaciones basadas en ellos
Data Transformation Pipeline Script
Develop a Python script to automate the data transformation process, improving efficiency and reducing manual error.
Browse courses on Data Wrangling
Show steps
  • Define data transformation functions
  • Create a pipeline using these functions
  • Test the pipeline on a sample dataset
Data Science Workshop on Machine Learning Algorithms
Expand your knowledge of machine learning algorithms through hands-on implementation at a workshop.
Browse courses on Machine Learning
Show steps
  • Attend the workshop and actively participate in sessions
  • Implement various machine learning algorithms (e.g., regression, classification)
  • Evaluate and compare algorithm performance
Build a data exploration dashboard
Develop your ability to create interactive visualizations that explore and summarize data effectively.
Browse courses on Data Exploration
Show steps
  • Choose a dataset and identify key insights you want to explore.
  • Design and implement an interactive dashboard using a tool or library.
  • Share your dashboard with peers or instructors for feedback.
Data Analysis Case Study Presentation
Synthesize your learning by presenting a data analysis case study, demonstrating your ability to apply concepts and communicate insights.
Browse courses on Data Analysis
Show steps
  • Select a real-world dataset and define a problem
  • Analyze the data using relevant techniques
  • Prepare and deliver a presentation showcasing your findings
Explore advanced data mining techniques
Expand your knowledge of advanced data mining techniques to enhance your ability to extract valuable insights from data.
Browse courses on Data Mining
Show steps
  • Identify online courses or tutorials on advanced data mining techniques.
  • Follow the tutorials, completing exercises and applying the concepts to your own datasets.
Contribute to Open Source Data Science Projects
Engage with the data science community by contributing to open-source projects, gaining valuable experience and enhancing your portfolio.
Browse courses on Open Source
Show steps
  • Identify open source data science projects on platforms like GitHub
  • Choose a project and contribute in areas such as data cleaning, feature engineering, or model development
  • Communicate with the project maintainers and seek feedback
Participate in data science competitions
Apply your skills and knowledge in a competitive environment, gaining valuable experience and feedback.
Show steps
  • Identify data science competitions that align with your interests and skill level.
  • Form a team or participate individually in the competition.

Career center

Learners who complete Integración y preparación de datos will develop knowledge and skills that may be useful to these careers:
Data Engineer
Data Engineers design, build, and maintain the infrastructure and tools that enable the collection, storage, and analysis of data. This course provides an introduction to data integration, transformation, and preparation, which are key responsibilities of Data Engineers.
Data Scientist
Data Scientists use scientific methods, processes, algorithms, and systems to extract knowledge and insights from data in various forms, both structured and unstructured. This course helps build a foundation in data exploration, transformation, integration, preparation, and modeling, all of which are essential skills for Data Scientists.
Machine Learning Engineer
Machine Learning Engineers design, develop, and deploy machine learning models. This course helps build a foundation in data exploration, transformation, integration, and preparation, which are essential skills for Machine Learning Engineers.
Quantitative Analyst
Quantitative Analysts use mathematical and statistical methods to analyze data and make investment decisions. This course helps build a foundation in data exploration, transformation, integration, and preparation, which are essential skills for Quantitative Analysts.
Data Visualization Specialist
Data Visualization Specialists create visual representations of data to help people understand and communicate data insights. This course teaches the skills needed to explore, transform, integrate, and prepare data for visualization, which are essential skills for Data Visualization Specialists.
Data Analyst
Data Analysts collect, clean, and analyze data to help organizations make informed decisions. This course teaches the skills needed to explore, transform, integrate, and prepare data for analysis. This course may be useful for those seeking a career as a Data Analyst.
Market Researcher
Market Researchers collect, analyze, and interpret data to understand consumer behavior and market trends. This course teaches the skills needed to explore, transform, integrate, and prepare data for analysis, which are essential skills for Market Researchers.
Business Analyst
Business Analysts use data to identify and solve business problems. This course teaches the skills needed to explore, transform, integrate, and prepare data for analysis, which are essential skills for Business Analysts.
Statistician
Statisticians collect, analyze, interpret, and present data. This course helps build a foundation in data exploration, transformation, integration, and preparation, which are essential skills for Statisticians.
Database Administrator
Database Administrators design, implement, and maintain databases. This course provides an introduction to data integration, transformation, and preparation, which are key responsibilities of Database Administrators.
Financial Analyst
Financial Analysts analyze financial data to make investment recommendations. This course helps build a foundation in data exploration, transformation, integration, and preparation, which are essential skills for Financial Analysts.
Actuary
Actuaries use mathematical and statistical methods to assess risk and uncertainty. This course helps build a foundation in data exploration, transformation, integration, and preparation, which are essential skills for Actuaries.
Software Engineer
Software Engineers design, develop, and maintain software systems. This course may be useful for Software Engineers who work with data, as it teaches the skills needed to explore, transform, integrate, and prepare data for analysis and modeling.
Product Manager
Product Managers oversee the development and launch of products. This course may be useful for Product Managers who work with data, as it teaches the skills needed to explore, transform, integrate, and prepare data for analysis and decision-making.
Consultant
Consultants advise clients on a variety of business issues. This course may be useful for Consultants who work with data, as it teaches the skills needed to explore, transform, integrate, and prepare data for analysis and decision-making.

Reading list

We've selected eight books that we think will supplement your learning. Use these to develop background knowledge, enrich your coursework, and gain a deeper understanding of the topics covered in Integración y preparación de datos.
Este libro de texto ampliamente utilizado proporciona una cobertura integral de los conceptos y técnicas de minería de datos. Es un recurso invaluable para los estudiantes y profesionales que buscan una comprensión profunda de este campo.
Este libro práctico proporciona una guía paso a paso para utilizar Pandas, una biblioteca de Python para la manipulación y análisis de datos. Es un recurso valioso para aquellos que buscan desarrollar habilidades prácticas en ciencia de datos.
Este libro proporciona una introducción completa al análisis de datos bayesiano. Cubre temas como la inferencia bayesiana, los modelos jerárquicos y el modelado predictivo. Es un recurso invaluable para aquellos que buscan desarrollar una comprensión de este enfoque estadístico.
Este libro proporciona una introducción accesible a los métodos de aprendizaje automático interpretables. Cubre temas como la importancia de la interpretabilidad, las técnicas de interpretación y las aplicaciones prácticas del aprendizaje automático interpretable.
Este libro avanzado proporciona una cobertura en profundidad de los métodos de aprendizaje automático basados en la escasez, como el lazo. Es un recurso valioso para los investigadores y profesionales que trabajan en este campo.
Este libro proporciona una guía práctica para el diseño y ejecución de proyectos de ciencia de datos. Cubre temas como la definición del problema, la recopilación de datos, el análisis de datos y la comunicación de los resultados. Es un recurso valioso para los profesionales de la ciencia de datos que buscan mejorar su proceso de trabajo.
Este libro ofrece una introducción accesible a la ciencia de datos para principiantes. Cubre una amplia gama de temas, desde la recopilación y limpieza de datos hasta el análisis y visualización de datos.

Share

Help others find this course page by sharing it with your friends and followers:

Similar courses

Here are nine courses similar to Integración y preparación de datos.
Lectura crítica: proceso, niveles y herramientas
Most relevant
Analítica de Procesos: Optimización desde los Datos
Most relevant
Informes de ventas con HubSpot
Most relevant
Marketing digital y sus análisis basado en datos
Most relevant
Introducción a la ciencia de datos aplicada
Most relevant
Análisis estadístico con Excel
Most relevant
Más que química
Most relevant
Introducción al mantenimiento de activos físicos
Most relevant
Introducción a la analítica de negocios
Most relevant
Our mission

OpenCourser helps millions of learners each year. People visit us to learn workspace skills, ace their exams, and nurture their curiosity.

Our extensive catalog contains over 50,000 courses and twice as many books. Browse by search, by topic, or even by career interests. We'll match you to the right resources quickly.

Find this site helpful? Tell a friend about us.

Affiliate disclosure

We're supported by our community of learners. When you purchase or subscribe to courses and programs or purchase books, we may earn a commission from our partners.

Your purchases help us maintain our catalog and keep our servers humming without ads.

Thank you for supporting OpenCourser.

© 2016 - 2024 OpenCourser