Datos del Curso
Sesiones Online los martes en los horarios: 14:30 -19:20 (hora local Alemania) en las siguientes fechas:
- 29 marzo
- 5, 12 y 26 de abril.
- 3 , 10, 24 y 31 de mayo.
- 7, 14, 21 y 28 de junio.
- Las sesiones online serán interactivas incluyendo salas para grupos pequeños.
- Como preparación para las sesiones en línea, los estudiantes deberán trabajar a través de cursos en línea de autoaprendizaje gratuitos en DataCamp.com y / o capítulos seleccionados en libros de texto (que se proporcionarán detalles).
- Se recomienda asistir a todas las sesiones online.
- Los casos de estudios serán organizados entre los grupos de estudiantes internacionales de manera auto organizada fuera de las clases.
- Las clases serán completamente impartidas en Inglés.
- Se recomienda a los estudiantes comenzar una fase de aprendizaje autónomo a mediados de marzo.
- Este curso podrá ser homologado por un electivo de la malla nueva, inscrito en el primer semestre 2022.
Prerrequisitos
Este curso está diseñado para estudiantes con bachillerato o equivalente en el área de Negocios y administración. Sin embargo, también son bienvenidos los estudiantes en disciplinas como la ingeniería y las ciencias de la computación. El Data Science es interdisciplinario y puede ser aplicado a diferentes tipos de problemas.
Se espera que los participantes tengan un conocimiento básico en matemáticas, estadística y dominio medio avanzado en Excel.
También se recomienda tener algunos conocimientos previos en programación. Para quienes no los tengan podrán igualmente tomar el curso, pero con mucho aprendizaje autónomo previo y durante las sesiones ya que la dedicación de tiempo para enseñar tópicos, será reducida.
Finalmente, se recomienda encarecidamente empezar con los cursos de DataCamp mucho antes de la primera clase. Todos los materiales e información detallada se proporcionarán con suficiente antelación.
Carga de Trabajo
Carga total de trabajo esperada: 10 ECTS / 200-300 horas.
Parte 1: Introducción al Data Science con Python (5 ECTS / 150 horas)
Parte 2: Machine Learning con Python (5 ECTS / 100-150 horas)
Forma de evaluación
- 10% cursos para aprendizaje autónomo en DataCamp.com
- 40% Tareas Online
- 50% estudio de casos
Material de preparación del curso
- Google Colaboratory(free Google account required) https://colab.research.google.com/
- Optional: JupyterNotebookhttps://www.anaconda.com/products/individual
- Textbooks (available in library of FH Dortmund, partner students to check own libraries)
- McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. O'Reilly Media.https://ebookcentral.proquest.com/lib/fh-dortmund/detail.action?docID=5061179
- Müller, A. C., & Guido, S. (2016). Introduction to machine learning with Python. O'Reilly Media.http://ebookcentral.proquest.com/lib/fh-dortmund/detail.action?docID=4698164
- Courses on DataCamp.com (free access available for participants between Mar-Aug 2022)
- Introduction to Python https://learn.datacamp.com/courses/intro-to-python-for-data-science
- Intermediate Python https://learn.datacamp.com/courses/intermediate-python
- Supervised learning https://learn.datacamp.com/courses/supervised-learning-with-scikit-learn
- Unsupervised learning https://learn.datacamp.com/courses/unsupervised-learning-in-python
- ILIAS learning platform at FH Dortmund (registration via TAN for partner students)
Idioma
El curso es impartido en Inglés. (Entrevista en la selección)
Tópicos
Part 1: Data Science Basics |
Part 2: Machine Learning |
||||
Sesion |
Date |
Topics covered |
Sesion |
Date |
Topics covered |
1 |
Mar 29th |
How to use Google ColaboratoryPython types and lists |
7 |
May 24th |
(Un-)supervised learning in scikit-learn k-Nearest Neighbors Linear regression(ridgeandlasso) |
2 |
Apr 5th |
Loops, if/else, functions Tuples, lists, dictionaries |
8 |
May 31st |
Linear classificationmodels Ensembles of decisiontrees |
3 |
Apr 12th |
Numpy basics and operations Image processing |
9 |
Jun 7th |
Kernel supportvectormachines Neuralnetworks |
4 |
Apr 26th |
PandasSeries, DataFrame Import/export files |
10 |
Jun 14th |
Preprocessing and scaling Dimensionalityreduction Principalcomponentanalysis |
5 |
May 3rd |
Principles of data visualization Data cleaning and preparation Join, combine and reshape data |
11 |
Jun 21st |
k-means, hierarchical clustering, DBSCAN |
6 |
May 10th |
Data visualization in Python How to write Data Science reports Data aggregation and grouping |
12 |
Jun 28th |
Representingdata, engineering features Model evaluationandimprovement Text dataanalysis |
Profesor
Stephan Weyers profesor de Matemáticas, estadística y gestión de la cadena de suministro en Fachhochschule Dortmund desde marzo de 2019. Desde el 2014 al 2019 fue profesor de Matemáticas y Didáctica en el Technische Hochschule Mittelhessen en Gießen. En su carrera profesional trabajó como Analista Especialista Senior en McKinsey & Company entre 2007-2014.
Stephan Weyers es el Director del proyecto InduTwin.
Conferencias invitadas y datos reales de empresas.
Probablemente habrá contribuciones de empresas alemanas en forma en modo conferencias invitadas, trabajos y estudios de casos. Además, existen conversaciones con Volkswohl Bund, una compañía de seguros con sede en Dortmund, y GEA Group, un proveedor para industrias de procesos con sede en Düsseldorf a modo de obtener colaboración de ellos.
Proceso de selección y fecha límite
La convocatoria coordinada por la Escuela de Industrial se abre desde el 24 de enero al 28 de febrero a las 18:00hrs
Proceso de selección: desde el 7 al 9 de marzo (entrevistas en inglés)
Resultados de la selección: 10 de marzo
Confirmación de los estudiantes con acuerdo de compromiso de participación activa en el curso: 11 de marzo.
Envío de lista de seleccionados preliminares al coordinador Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.: 14 de marzo.
Cupos limitados: 10 estudiantes
Consultas Generales: miércoles 26 enero de 12:00 a 13:00 hrs.
https://reuna.zoom.us/j/87181683553
Requisitos de Postulación a la convocatoria
- Estudiante con cuarto año aprobado
- Haber aprobado las asignaturas de la línea de TICs
- Promedio general de todos los cursos realizados (aprobados y reprobados): 5,0 o superior
- Estar en condiciones de inscribir un electivo de la malla nueva en el presente semestre en caso de optar por la homologación.
- Nivel de idioma inglés avanzado (B2).
- Postulaciones hacerlas a través del formulario:
https://docs.google.com/forms/d/1nm0spKvCrm7iJMB8tUIdKwhfvxCf-A4Q82ToK3-MeTA/prefill
- En total, se espera una participación de más de 100 estudiantes en el curso. Esto se proyecta a que cada 6 Universidades partenarias de América Latina podrían seleccionar de 5 a 10 estudiantes. La selección final será comunicada lo antes posible, probablemente a mediados de Marzo 2022.