Acerca del programa:
El Diplomado en Big Data y Cloud Computing está orientado a enseñar conceptos y herramientas de Big Data y Machine Learning en el contexto de la clara tendencia de migración de este tipo de servicios a la nube.
Dirigido a:
- Profesionales, especialmente del área tecnológica, que estén involucrados o planeen participar en proyectos de Big Data y Machine Learning de sus organizaciones, con el interés de ampliar sus herramientas e incorporar las soluciones basadas en la nube, con ventajas tanto desde el punto de vista técnico como económico.
Jefe de Programa
Equipo Docente
keyboard_arrow_downHernán Valdivieso
Magíster en Ciencias de la Ingeniería e Ingeniero Civil en Computación, UC. Profesor Instructor del Departamento de Ciencia de la Computación de la Escuela de Ingeniería UC. Su área principal de trabajo es la docencia y el desarrollo de técnicas de visualización.
Gabriel Sepúlveda
Ingeniero Civil Electrónico, con Mención en Control Automático, Mención Complementaria Computadores, Universidad Técnica Federico Santa María. Candidato a Doctor en Ciencias de la Ingeniería en el área de Ciencias de la Computación, UC. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, UC.
Iván Lillo
Doctor en Ciencias de la Ingeniería, UC. Magíster en Ciencias de la Ingeniería, UC. Ingeniero Civil Electricista, UC. Profesor Instructor, Departamento de Ciencia de la Computación, Escuela de Ingeniería, UC.
Mauricio Gamboa
Consultor en Diseño, Desarrollo e Implementación de Aplicaciones en Entornos Microsoft. La Salle Campus Madrid. Ingeniería en Informática, Analista Programador, INACAP. Microsoft MVP Business Applications. MCSE: Data Management and Analytics - Certified 2019. MCSA: SQL 2016. Business Intelligence Development - Certified 2019. Microsoft Certified Solutions Developer: Web Applications.
Stefanni Cavaletto
Ingeniería Matemática U. Santiago de Chile. Postítulo de Inteligencia de Negocios, Universidad de Chile. MSc Artificial Intelligence UAI. Actualmente es Senior Customer Engineer (ML & AI) en Google. Su línea de investigación es la ciencia de datos. Ha trabajado en diversas industrias en sus 8 años de experiencia, tales como Microsoft, Banca, Telecomunicaciones, Retail y Salud. Es miembro activo de 2 organizaciones sin fines de lucro, «Analytics & Python» y «R-Ladies», las cuales buscan fomentar el uso de herramientas y técnicas para todas las personas, en particular R-Ladies además busca disminuir la brecha de género en este rubro técnico donde la participación de mujeres no es tan equilibrada.
* EP (Educación Profesional) de la Escuela de Ingeniería se reserva el derecho de reemplazar, en caso de fuerza mayor, a él o los profesores indicados en este programa; y de asignar al docente que dicta el programa según disponibilidad de los profesores.
Descripción
keyboard_arrow_downLa disponibilidad de servicios de cómputo y almacenamiento de datos en la nube ha ocasionado profundos cambios en la forma en que se diseñan los sistemas, capaces de incorporar "inteligencia" a través del uso de técnicas de Machine Learning (ML) sobre volúmenes muy grandes de datos (Big Data). Tradicionalmente, el construir este tipo de soluciones requería, por una parte, de hardware costoso y difícil de dimensionar a priori, y, por otra parte, de expertos en ingeniería de datos capaces de implementarlos. Gracias a la oferta de servicios cognitivos y de Big Data en la nube, totalmente administrados, la barrera ha disminuido muy significativamente. Por un lado, se reduce la necesidad de expertise y por otro, la elasticidad inherente de las soluciones en la nube permite partir pequeño e ir creciendo solo en la medida que se requiera.
Este programa incluye dos cursos que abordan las temáticas tradicionales de Big Data y Machine Learning y otros dos cursos que abordan este nuevo escenario de la nube, especialmente en cuanto a oportunidades para proyectos de Ciencia de Datos y Machine Learning.
Al finalizar diplomado el estudiante será capaz de sacar el máximo valor de los datos disponibles desarrollando aplicaciones que usen técnicas de minería de datos y aprendizaje de máquina que estén enteramente basadas en servicios en la nube.
El formato de estudio es 100% en línea y se estructura sobre técnicas metodológicas activas, mediante las cuales el participante puede interactuar con sus pares y tutor a través de los recursos tecnológicos que provee la plataforma educativa virtual. Se contempla el ejercicio práctico de los conocimientos adquiridos a través de mini proyectos de aplicación.
Requisitos de Ingreso
keyboard_arrow_downA responsabilidad del estudiante, se sugiere contar con:
- Grado de Licenciatura en Computación o en Tecnologías de Información, Ingenieros Civiles o de Ejecución en Computación o equivalente o bien un grado de licenciatura en otras carreras que incluyan competencias de programación a nivel intermedio
- Conocimiento en sistema operativo Windows y la disponibilidad de un PC con una versión de este sistema operativo actualizado.
Objetivos de Aprendizaje
keyboard_arrow_down- Utilizar herramientas y servicios disponibles en la nube para construir soluciones que incorporen big data e inteligencia artificial.
Desglose de cursos
keyboard_arrow_downCurso 1 Introducción a minería de datos y Machine Learning
keyboard_arrow_downDocente: Hernán Valdivieso
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción del curso:
El curso comienza abordando la problemática de la obtención, preparación y limpieza de datos, para luego adentrarse en las técnicas y algoritmos asociados a la Minería de Datos, como clasificación, clustering, entre otros. Además, se exploran algoritmos, técnicas y herramientas de Machine Learning.
Los estudiantes de este curso adquirirán conocimientos fundamentales sobre Minería de Datos, comprendiendo las diversas fuentes de información a utilizar, revisando el preprocesamiento de datos y aplicando técnicas de extracción de conocimiento. Esto incluye el uso de reglas de asociación, árboles de decisión, algoritmos de clasificación y la evaluación de clasificadores, junto con una introducción al aprendizaje de máquina.
El enfoque del curso es práctico, privilegiando la experimentación mediante herramientas y entornos que permiten ejecutar y analizar ejemplos preconfigurados. Los estudiantes modificarán parámetros, observarán los efectos de dichos cambios y reflexionarán sobre su impacto en la calidad del modelo y la extracción de conocimiento.
Al finalizar el curso, los estudiantes comprenderán los principios teóricos y prácticos que sustentan las principales técnicas utilizadas en la minería de datos y el aprendizaje de máquina, pudiendo analizar sus resultados, evaluar su aplicabilidad en distintos contextos y reconocer sus potencialidades y limitaciones sin necesidad de programar directamente los algoritmos.
El desarrollo de estos aprendizajes se realizará a través de estudios de casos, mini proyectos prácticos, y el acceso a recursos especializados, lo que permitirá a los estudiantes experimentar, analizar y aplicar directamente los conceptos adquiridos.
La metodología de enseñanza y aprendizaje para este curso en línea se basa en técnicas metodológicas activas, permitiendo que el participante interactúe con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.
Resultados de aprendizaje:
- Reconocer las principales teorías y prácticas de la Minería de Datos.
- Identificar relaciones interesantes en un conjunto de transacciones mediante el uso de reglas de asociación.
- Distinguir técnicas como árboles de decisión, clustering y otras, aplicándolas en escenarios prácticos reales.
- Evaluar la calidad y pertinencia de los resultados obtenidos, reconociendo las potencialidades y limitaciones de cada técnica.
Contenidos:
- Introducción a Minería de Datos y conceptos sobre Data Warehouse
- Procesamiento, selección y transformación de datos.
- Reglas de asociación
- Clasificación
- Árbol de decisión
- KNN
- Random Forest
- Clustering
- K-Means
- Clustering jerárquico
- Introducción al Machine Learning
- Modelo de entrenamiento
- Métricas de evaluación
Estrategias metodológicas:
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas:
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 2: Técnicas de Big Data para Machine Learning
keyboard_arrow_downDocente: Gabriel Sepúlveda e Iván Lillo
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción del curso:
Grandes repositorios de datos han comenzado a surgir en diversos ámbitos de nuestra sociedad. Estos corresponden a fuentes de información masiva, diversa y distribuida, cuyo análisis efectivo ofrece la oportunidad de obtener valiosa información en distintos ámbitos del quehacer social. Sin embargo, esta gran oportunidad presenta también grandes desafíos debido a la incapacidad de las aplicaciones tradicionales para el manejo de grandes volúmenes de datos.
El presente curso está diseñado para abordar la problemática de Big Data desde la perspectiva del uso de herramientas de manipulación de grandes cantidades de datos y en la aplicación de técnicas de Machine Learning y sistemas computacionales de alto rendimiento sobre grandes fuentes de datos distribuidos.
La metodología de enseñanza y aprendizaje para este curso online consiste en técnicas metodológicas activas, donde el participante puede interactuar con sus pares y el profesor-tutor a través de los recursos tecnológicos proporcionados por la plataforma educativa virtual destinada para el curso.
Resultados de aprendizaje:
- Identificar la problemática y particularidades del manejo de grandes volúmenes de dato en diferentes contextos.
- Distinguir los principios, bases técnicas y herramientas del ecosistema Hadoop.
- Utilizar las herramientas del ecosistema Hadoop para el manejo de volúmenes gigantescos de datos.
- Reconocer el esquema de trabajo Apache Spark para el procesamiento de datos de propósito general.
- Utilizar las principales herramientas del framework Spark para análisis de datos y aplicación de técnicas de Machine Learning.
- Aplicar herramientas de visualización que faciliten la interpretación de resultados.
Contenidos:
- Ecosistema Hadoop
- Introducción a Big Data
- Instalación de herramientas Hadoop
- Herramientas de Ecosistema Hadoop
- Hadoop MapReduce
- Apache Hive
- Apache Pig
- Apache Spark
- Programación en Apache Spark
- Data Analytics con Apache Spark
- Apache Flume
- Spark Streaming
- Spark SQL
- Machine Learning con Apache Spark
- Spark MLLIB: Algoritmos supervisados
- Spark MLLIB: Algoritmos no supervisados
- Técnicas de visualización
- Reducción de dimensionalidad
Estrategias metodológicas:
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas:
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 3: Introducción al Cloud Computing
keyboard_arrow_downDocente: Mauricio Gamboa
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción del curso:
En este curso el estudiante analizará los conceptos fundamentales asociados a computación en la nube, tipo de servicios, forma de entrega de los servicios, elección de un proveedor, la seguridad y la gobernanza, etc. Realizará un trabajo práctico consistente en hacer algunas tareas simples como instalar un servidor o recursos de almacenamiento masivo usando alguno de los proveedores más conocidos.
Resultados de aprendizaje:
- Identificar las principales categorías disponibles en las grandes plataformas de computación en la nube.
- Discutir ventajas y riesgos de una solución tecnológica genérica basada en computación en la nube.
- Describir las principales tecnologías habilitantes relacionadas con computación en la nube.
- Utilizar servicios básicos de cómputo y almacenamiento en la nube
Contenidos:
- Introducción: Qué es Cloud Computing, características principales, tipos de servicio, tipos de nube
- Tecnologías habilitantes (máquinas virtuales, arquitecturas orientadas a servicio, etc.)
- Virtualización
- Principales plataformas de servicios en la nube: Amazon AWS, Google Cloud, Microsoft Azure
- Tipos de servicios en la nube: desde el fierro virtual a los servicios cognitivos
- Tipos de Almacenamiento en la nube
- Aspectos de seguridad
Estrategias metodológicas:
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas:
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Curso 4: Servicios Cloud para ciencia de datos y Machine Learning
keyboard_arrow_downDocente: Stefanni Cavaletto
Unidad académica responsable: Escuela de Ingeniería
Requisitos: sin prerrequisitos
Créditos: 4
Horas totales: 75 | Horas directas: 35 | Horas indirectas: 40
Descripción del curso:
Hasta hace poco tiempo un proyecto de inteligencia artificial requería el poder disponer de máquinas muy potentes (clusters de máquinas con GPU's) y complejas infraestructuras para manejar los datos en un contexto de Big Data. Gracias a los servicios totalmente administrados que ofrecen los principales proveedores de servicios Cloud, cualquier persona, empresa u organización puede armar un proyecto incluso sin tener un ingeniero de datos a disposición. Es posible incluso acceder a modelos de reconocimiento de imágenes o video ya entrenados y listos para ser utilizados.
El estudiante aprenderá algunos de los principales servicios totalmente administrados desde la nube que le permitirán armar una solución que incorpore inteligencia artificial sin necesidad de contar ni con infraestructura propia ni con capacidades propias de ingeniería de datos. Se realizarán miniproyectos que permitirán experimentar con algunas de las herramientas disponibles desde dos de los principales proveedores de servicios Cloud: Azure y GCP.
Resultados de aprendizaje:
- Identificar las soluciones tecnológicas disponibles en los principales proveedores de Cloud que incorporan aprendizaje de máquina.
- Desarrollar aplicaciones de Machine Learning usando servicios de Azure y de GCP
- Construir aplicaciones que incorporen los servicios cognitivos de imágenes, texto o voz disponibles en las grandes plataformas de servicios Cloud
Contenidos:
- Introducción a Big data y ML
- Modelos de Regresión y Clasificación
- Preparación de Datos, el pipeline de datos
- Manejo de Big Data en la nube
- Servicios para ML en Azure
- Azure machine learning studio
- ML automatizado (Azure AML)
- Servicios cognitivos en Azure
- AutoML en GCP
- Introducción a Vertex AI en GCP
- Servicios cognitivos en GCP
Estrategias metodológicas:
- Aprendizaje autónomo asincrónico estructurado en 6 módulos
- Clases expositivas
- Foros
- Estudio de caso
Estrategias evaluativas:
- 3 controles individuales – 40%
- 3 mini proyectos individuales – 60%
Requisitos Aprobación
keyboard_arrow_downLa nota final del diplomado se calculará de acuerdo a la siguiente ponderación de los cursos:
- Curso: Introducción a Minería de Datos y Machine Learning – 25%
- Curso: Técnicas de Big Data para Machine Learning – 25%
- Curso: Introducción al Cloud Computing – 25%
- Curso: Servicios Cloud para ciencia de datos y Machine Learning – 25%
Los alumnos deberán ser aprobados de acuerdo a los siguientes criterios:
- Calificación mínima de 4.0 en cada uno de los cursos.
Los resultados de las evaluaciones serán expresados en notas, en escala de 1,0 a 7,0 con un decimal, sin perjuicio que la Unidad pueda aplicar otra escala adicional.
Para aprobar un Diplomado, se requiere la aprobación de todos los cursos que lo conforman y, en los casos que corresponda, de otros requisitos que indique el programa académico.
El estudiante será reprobado en un curso o actividad del Programa cuando hubiere obtenido como nota final una calificación inferior a cuatro (4,0).
Los alumnos que aprueben las exigencias del programa recibirán un certificado de aprobación digital otorgado por la Pontificia Universidad Católica de Chile.
Además, se entregará una insignia digital por diplomado. Sólo cuando alguno de los cursos se dicte en forma independiente, además, se entregará una insignia por curso.
Proceso de Admisión
keyboard_arrow_downLas personas interesadas deberán completar la ficha de postulación que se encuentra al costado derecho de esta página web y enviar los siguientes documentos al momento de la postulación o de manera posterior a la coordinación a cargo:
- Fotocopia simple del carnet de identidad por ambos lados.
Cualquier información adicional o inquietud podrás escribir al correo programas.ing@uc.cl
Con el objetivo de brindar las condiciones y asistencia adecuadas, invitamos a personas con discapacidad física, motriz, sensorial (visual o auditiva) u otra, a dar aviso de esto durante el proceso de postulación.
El postular no asegura el cupo, una vez inscrito o aceptado en el programa se debe pagar el valor completo de la actividad para estar matriculado.
No se tramitarán postulaciones incompletas.
Puedes revisar aquí más información importante sobre el proceso de admisión y matrícula
¿Te parece interesante este programa?
Sí No