Clase 1 - La necesidad de Información en la Industria 4.0

¡Les damos la bienvenida! ¿Comenzamos? Esta clase va a ser grabada COMISIÓN N°29805 Presentación del equipo ✔ Prof

Views 147 Downloads 1 File size 4MB

Report DMCA / Copyright

DOWNLOAD FILE

Recommend stories

Citation preview

¡Les damos la bienvenida! ¿Comenzamos?

Esta clase va a ser grabada

COMISIÓN N°29805

Presentación del equipo ✔

Profesor responsable: José López



Tutores: ○ ○ ○ ○

Jorge Ruiz David Silvera Franklin Zhunio Juan Demaestri

Presentación de estudiantes Por encuestas de Zoom 1. 2. 3.

País Conocimientos previos ¿Por qué elegiste este curso?

¿Dudas sobre el onboarding? Míralo aquí

!

Lo que debes saber antes de empezar

Acuerdos y compromisos

ACUERDOS Y COMPROMISOS

Convivencia ✓

Conoce aquí nuestro código de conducta y ayúdanos a generar un ambiente de clases súper ameno.



Ten en cuenta las normas del buen hablante y del buen oyente, que nunca están de más.



Durante las clases, emplea los medios de comunicación oficiales para canalizar tus dudas, consultas y/o comentarios: chat Zoom público y privado, y por el chat de la plataforma.



Verifica el estado de la cámara y/o el micrófono (on/off) de manera que esto no afecte la dinámica de la clase.

ACUERDOS Y COMPROMISOS

Distractores ✓

Encuentra tu espacio y crea el momento oportuno para disfrutar de aprender



Evita dispositivos y aplicaciones que puedan robar tu atención



Mantén la mente abierta y flexible, los prejuicios y paradigmas no están invitados

ACUERDOS Y COMPROMISOS

Herramientas ✓

Mantén a tu alcance agua, mate o café





Si lo necesitas, ten a mano lápiz y papel para que no se escapen las ideas. Pero recuerda que en Google Drive tienes archivos que te ayudarán a repasar, incluidas las presentaciones.

Conéctate desde algún equipo (laptop, tablet) que te permita realizar las actividades sin complicaciones.



Todas las clases quedarán grabadas y serán compartidas tanto en la plataforma de Coderhouse como por Google Drive.

ACUERDOS Y COMPROMISOS

Equipo ✓

¡Participa de los After Class! Son un gran espacio para atender dudas y mostrar avances.



Intercambia ideas por el chat de la plataforma.



Siempre interactúa respetuosamente.



No te olvides de valorar tu experiencia educativa y de contarnos cómo te va.

Interacciones en clase

INTERACCIONES EN CLASE

Mientras el profesor explica Para mantener una comunicación clara y fluida a lo largo de la clase, te proponemos mantener 2 reglas:

1.

Si tienes dudas durante la explicación, debes consultarle directamente por privado a tu tutor por el chat de Zoom.

INTERACCIONES EN CLASE

Espacios para consultas 2.

Entre contenido y contenido, se abrirán breves espacios de consulta. Allí puedes escribir en el chat tu pregunta. ¡Tu duda puede ayudar a otras personas! No olvides seleccionar “todos” para que todos puedan leerte (y no solo tu tutor).

INTERACCIONES EN CLASE

Funcionalidades Para evitar saturar el chat de mensajes, utiliza los signos que figuran en el apartado Participantes, dentro de Zoom.**

Por ejemplo: si se pregunta si se escucha correctamente, debes seleccionar la opción “Sí” o “No”.

**Para quitar el signo, presiona el mismo botón nuevamente o la opción “clear all”.

After Class

AFTER CLASS

¿Qué son? Te acompañamos para resolver tus consultas sobre el contenido en estos espacios. Si hay temas que no se entendieron o necesitan refuerzo se trabajarán en una clase de 1 hs que opera como espacio de consulta. No son obligatorias ni se toma asistencia, pero son el espacio uno a uno con tu profesor/a** para responder dudas puntuales o reforzar conceptos.

Tu profesor/a está comprometido con tu educación, por lo tanto: ✓

Se responderán dudas puntuales que hayan quedado sobre los temas dados. ¡Vení preparado, queremos escucharte!



Se verán temas de conocimientos básicos para la nivelación de saberes.

**Los/as tutores/as también serán protagonistas, liderando 5 veces este espacio en todo el curso.

Desafíos y entregables

DESAFÍOS Y ENTREGABLES

¿Qué son? Actividades en clase Ayudan a poner en práctica los conceptos y la teoría vista en clase. No deben ser subidos a la plataforma.

Desafíos entregables Relacionados completamente con el proyecto final. Deben ser subidos a la plataforma hasta 7 días luego de la clase, para que sean corregidos.

DESAFÍOS Y ENTREGABLES

¿Qué son? Desafíos complementarios Desafíos que complementan a los entregables. Son optativos, pero de ser subidos a la plataforma a tiempo, y habiendo sido aprobados, suman puntos para el top 10.

Entregas del Proyecto final Entregas con el estado de avance del proyecto final, que deberán ser subidas a la plataforma hasta 7 días luego de la clase para ser corregidas cada tutor/a.

DESAFÍOS Y ENTREGABLES

Proyecto final El Proyecto final se construye a partir de los desafíos que se realizan clase a clase. Se va creando a medida que el estudiante sube los desafíos entregables a nuestra plataforma. El objetivo es que cada estudiante pueda utilizar su Proyecto final como parte de su portfolio personal.

Se debe subir a la plataforma la ante-última o última clase del curso. En caso de no hacerlo tendrás 20 días a partir de la finalización del curso para cargarlo en la plataforma. Pasados esos días el botón de entrega se inhabilitará.

¿Cuál es nuestro Proyecto final?

PROYECTO FINAL

Proyecto final en DS Consigna: El proyecto final consiste en tres entregas, donde de manera secuencial irán resolviendo un problema para una industria, negocio o proyecto personal. El proyecto final debe plasmar cada una de las fases de un proyecto de Data Science: Data Acquisition, Data Wrangling, Exploratory Data Analysis, Modelamiento, Evaluación y Despliegue. Se deberá entregar un notebook en formato jupyter notebook (.ipynb) y una presentación (PDF, ppt o Google Slides)

PROYECTO FINAL

Proyectos de nuestros estudiantes En este link podrán ver los Proyectos finales de diferentes estudiantes de este curso de comisiones anteriores. ¡Esperamos que les resulten inspiradores!

PROYECTO FINAL Entrega

Requisito

Fecha

1° entrega

Elección de potenciales datasets para importe con la librería Pandas

Clase 5 - DS I

2° entrega

Visualizaciones en Python

Clase 8 - DS I

3° entrega

Estructurando un proyecto de DS- Parte I

Clase 12 - DS I

4° entrega

Estructurando un proyecto de DS- Parte II

Clase 17 - DS I

5° entrega

Estructurando un proyecto de DS- Parte III

Clase 19 - DS I

Primera Pre-entrega

Análisis de datos con Python

Clase 21 - DS I

PROYECTO FINAL Entrega

Requisito

Fecha

7° entrega

Descarga de datos desde APIs públicas

Clase 5 - DS II

8° entrega

Data Wrangling

Clase 7 - DS II

9° entrega

Data StoryTelling

Clase 11 - DS II

10° entrega

Obtención de Insights

Clase 14 - DS II

Segunda Pre-entrega

Obtención de insights a partir de visualizaciones

Clase 16 - DS II

PROYECTO FINAL Entrega

Requisito

Fecha

12° entrega

Entrenando un algoritmo de Machine Learning

Clase 3 - DS III

13° entrega

Evaluando modelos de Machine Learning

Clase 6 - DS III

14° entrega

Ingeniería de atributos y selección de variables

Clase 8 - DS III

Entrega final

Entrenamiento y optimización de Modelos de Machine Learning

Clase 16 - DS III

¡Importante! Los desafíos y entregas se deben cargar hasta siete días después de finalizada la clase. Te sugerimos llevarlos al día.

Completa con éxito el programa Kick Off

Clase 0

Desafíos Desafíos Desafíos

Entrega intermedia

Desafíos Desafíos Desafíos

Proyecto final

Certificado

Recuerda que el primer requisito para finalizar con éxito es asistir a las clases.

Top 10

Clase 01. DATA SCIENCE

La necesidad de información en la Industria 4.0

Temario 00

01

02

Introducción a la ciencia de Datos

La necesidad de Información en la Industria 4.0

Introducción a librería científica Python: Pandas (Parte 1)





Proyectos en Data Science



¿Por qué es importante la Ciencia de Datos?

✓ ✓ ✓



Cuarta Revolución Industrial El Ambiente de la Industria 4.0 Transformación Digital Ciclo de vida de un proyecto de ciencia de datos Valor y retorno de la Ciencia de Datos



Nociones básicas de Pandas



Operaciones en Pandas



Práctica integradora

Objetivos de la clase Identificar los componentes importantes de una estrategia de Data & Analytics. Comprender el rol de los datos en la organización desde una perspectiva de Transformación Digital y en la Industria 4.0 Facilitar la identificación de oportunidades del uso de los datos para la transformación digital y la estrategia de negocios.

MAPA DE CONCEPTOS

Industria 4.0 Cuarta Revolución Industrial Industria 4.0

Transformación Digital Necesidad de la información en la industria 4.0

Ciclo de vida de un proyecto de ciencia de datos Valor y retorno de la ciencia de datos

Estrategia Data Driven

El ambiente de la industria 4.0 Características de la industria 4.0

Transformación Digital e Industria 4.0

Cuarta Revolución Industrial

Cuarta Revolución Industrial A partir de esta nueva denominación se transformó la mirada sobre la industria de las revoluciones anteriores: Industria 1.0, Industria 2.0 e Industria 3.0.

🤔 ¿Escuchaste hablar de la Primera y Segunda Revolución Industrial en la escuela? Bueno, ya vamos por la 4ta.

Fuente: Mixtrategy.com

REEMPLAZAR POR IMAGEN

Cuarta Revolución Industrial REEMPLAZAR POR IMAGEN

El Banco Interamericano de Desarrollo (BID) identifica la particularidad de esta Revolución Industrial en la convivencia de una gran variedad de tecnologías que se fusionan borrando los límites entre lo físico, lo digital y lo biológico. Sin duda, esto implica un gran cambio de paradigma, en todos los ámbitos de la vida.

¿Quieres saber más? Consulta el material ampliado de la clase

Cuarta Revolución Industrial Entendemos la cuarta Revolución Industrial como la transición hacia nuevos sistemas ciber-físicos que operan en forma de complejas redes como salto cualitativo a sólo 50 años de la Revolución digital (Industria 3.0).

Industria 4.0

¿Por qué hablamos de Industria 4.0? El término “Industria 4.0” surge de un conjunto de especialistas multidisciplinarios convocados por el gobierno alemán a comienzos de la década de 2010 enfocados en re-diseñar un programa de mejoras para la industria manufacturera.

El fundamento de la Industria 4.0 está en el desarrollo de sistemas tipo SCADA con fácil supervisión y sustentabilidad así como estructuras IIoT que permiten utilizar el poder de las máquinas inteligentes y el análisis en tiempo real.

Supervisory Control and Data Acquisition (SCADA)

Sistemas IIoT

El ambiente de la Industria 4.0

El ambiente de la industria 4.0

El ambiente de la industria 4.0 está enmarcado en cuatro grandes pilares: 👉 Internet of Things (IoT) 👉 Internet of Services (IoS) 👉 Internet of Data (IoD) 👉 Internet of People (IoP) Estos componentes conforman lo que se conoce como Smart Factory

Internet of Things (IoT) ✔

Describe la conectividad entre objetos físicos como tostadores, refrigeradores, TV al Internet permitiendo la comunicación entre dispositivos.



Se requiere de diversos factores como una infraestructura de conectividad con alta velocidad y protocolos de comunicación (e.j Machine to Machine M2M) para la correcta implementación del IoT.

Industrial Internet of Things (IIoT) REEMPLAZAR POR IMAGEN



Se refiere a sensores interconectados, instrumentos y otros dispositivos industriales enlazados entre sí con aplicaciones computacionales para mejorar procesos industriales y de manufactura.

Internet of Services (IoS) ✔

✔ ✔

Se refiere a un marketplace global de aplicaciones y software basado en internet que se ofrecen como servicios. IoS incluye los servicios de Blockchain que es importante en cadenas de suministros. IoT facilitado por IoS crea innovación disruptiva.

Internet of Data (IoD) ✔ ✔

IoD se fundamenta en los los billones de datos extensivos generados por dispositivos del IoT Estos volúmenes de información tienen el potencial para generar $ cuando las tecnicas Analiticas de Big Data descubren patrones en ellos.

Internet of People (IoP) ✔





Un nuevo paradigma del internet donde los humanos y sus dispositivos personales no son considerados como usuarios finales sino como elementos activos. IoP se desarrolla de forma descentralizada como Blockchain donde los datos no están bajo el control de una sola entidad. El lema del IoP es ser un internet “de y para las personas” en vez de ser uno donde se sacrifica su privacidad.

Características de la Industria 4.0

Características de la Industria 4.0 La Industria 4.0 se caracteriza por tener nueve características principales: ✔ Big Data ✔ Simulación ✔ Internet of Services ✔ Realidad aumentada ✔ Sistemas ciber-físicos ✔ Manufactura automática ✔ IoT (Internet of Things) ✔ Sistemas de cómputo en la nube ✔ Sistemas de robótica autónomos Fuente: Tay, S. et al. (2018). An Overview of Industry 4.0: Definition, Components, and Government Initiatives

Características de la Industria 4.0 ✔ ✔ ✔



Industria 1.0: Mecanización del trabajo que solía realizarse de forma manual. Industria 2.0: Transformación que se produjo con la introducción de la electricidad en procesos. Industria 3.0: Llegada de la informática y la automatización a la escena industrial. (Uso de controladores lógicos programables, robots, etc). Industria 4.0: Era de Cyber Physical Systems (CPS). Máquinas inteligentes, sistemas de almacenamiento e instalaciones de producción capaces de intercambiar información de forma autónoma,

Fuente: Tay, S. et al. (2018). An Overview of Industry 4.0: Definition, Components, and Government Initiatives

Transformación digital

La transformación digital es el fomento de evolución y nuevos modelos de negocio incorporando la digitalización de archivos e incorporando lo digital a todas las áreas de negocio. -

Harvard Business Review, 2021

Blockchain

Realidad virtual

Near Field Communications (NFC)

Cloud

Robótica

Ways of working

IA

Tecnología móvil

Transformación Digital La transformación digital es el proceso mediante el cual se realizan cambios integrales en la estrategia, modelos operativos, personas, cultura y procesos. Problemas nuevos, exigen soluciones innovadoras 🚀

Deseamos ver mejoras dramáticas en el desempeño y cambiar las rutas para lograr el éxito. Las amenazas para las organizaciones hoy en día son más resistentes y más robustas.

Como muestra el siguiente cuadro, existe un movimiento constante en el top de empresas líderes…

Top 10 Compañías 2021

Top 10 Compañías 2011

Top 10 Compañías 2001

Wallmart

Wallmart

Exxon Mobil

State Grid

Exxon Mobil

Wallmart

Amazon

Chevron

General Motors

China National Petroleum

CoconoPhillips

Ford Motor

Sinopec Group China

Fannie Mae

General Electric

Apple

General Electric

Citigroup

CVS Health

Berkshire Hathaway

Enron

UnitedHealth Group

General Motors

Intl. Business Machines

Toyota Motor Company

Bank of America.

AT&T

Volkswagen

Ford Motor

Verizon Communications

Fuente: https://fortune.com/global500/search/

¿Por qué datos y por qué ahora?

¿Por qué datos y por qué ahora?

Según Forbes (2021) “Ahora más que nunca, los datos, la analítica y la experiencia son de importancia existencial. No es simplemente una cuestión de opinión. Se ha convertido en un asunto público y social de vida o muerte.” Los datos impulsan las decisiones que tomamos y los riesgos que asumimos hoy día.

¿Por qué datos y por qué ahora?

En un contexto de Pandemia, por ejemplo, las respuestas a preguntas como: ¿Abrimos negocios y escuelas? ¿Abrimos establecimientos públicos? ¿Qué nos dicen los datos? ¿La curva sube o se aplana? ¿Se volverá a emplear a la gente? ¿Volverá el negocio? Solo se pueden responder con el uso de datos.

Tendencias en Data & Analytics 2021-2022 ✔

IA más inteligente, rápida y responsable



Decisión Intelligence



X Analytics: Data No Estructurada



Gestión de datos aumentada



Cloud es una realidad



Choques entre mundos de datos y analytics



Data Marketplaces e Intercambios



Blockchain en data & analytics



MLOps (Machine Learning Operations)



Modelos de lenguaje avanzados (e.j. BERT)

Dinámica de pares ¡Formemos equipos! En esta clase conformaremos nuestros equipos de trabajo. Para esto, nos dividiremos en Breakout Rooms con nuestros tutores y allí realizaremos una dinámica de agrupación. Duración: 10 minutos

DINÁMICA DE PARES

¡Algunas cosas importantes! Presencia ✓

Nos comprometemos a estar presentes en el trabajo junto a nuestro compañero.

Colaboración ✓

Ambos colaboraremos en los entregables, pre entregas y en la construcción de nuestro Proyecto Final.

Apertura al aprendizaje ✓

Es importante, al trabajar en equipo, a escuchar las ideas y la voz de nuestro o nuestra compañera. ¡Las ideas nos enriquecen!

Compromisos y acuerdos ✓

Es importante, una vez que tengamos un compañero, pautar horarios y modos de trabajo que sean funcionales a ambos.

DINÁMICA DE PARES

Ahora sí… ¡A formar grupo! Consigna: Nos dividiremos en breakout rooms por tutorías. Una vez estemos en el room correspondiente nuestro tutor nos compartirá un archivo docs. El tutor nos mostrará diferentes ejemplos de proyectos asociados a diferentes tópicos.

En él encontraremos un cuadro según diferentes intereses, anotaremos nuestro nombre en la columna que corresponda. Luego, armaremos los pares.

NOTA: usaremos los breakouts rooms. El tutor/a tendrá el rol de facilitador/a.



Break ¡10 minutos y volvemos!

Ciclo de vida de un proyecto de Ciencia de Datos

Ciclo de vida de un proyecto de Ciencia de datos Momento 1: Definir el objetivo Momento 2: Recolección de la data Momento 3: Preparar la data Momento 4: Elección del Algoritmo

Ciclo de vida de un proyecto de Ciencia de datos Momento 5: Entrenar el modelo Momento 6: Validación del modelo Momento 7: Deployment del modelo

1. Definir el objetivo Es vital entender el problema a resolver y cuáles son nuestros objetivos dado las características de la empresa, así como de la data que tendremos a disposición. Las siguientes preguntas son típicas en esta etapa: ✔ ✔ ✔

¿Qué exactamente deseamos hacer? ¿Cómo exactamente podremos hacerlo? ¿Es posible lo que deseo dada la data que tengo?

2. Recolección de data ✔ ✔ ✔

Data First Party: Data propia de la empresa (ERP,CRM,BD, etc). Data Second Party: Suele ser data que comparte una organización con sus aliados estratégicos. Data Third Party: Datos de tercero que podemos obtener ya sea de forma gratuita o incurriendo en algún tipo de costo asociado.

3. Preparar la data Normalmente lo conocemos como la limpieza de los datos o el formateo del dato. El objetivo de esta etapa es manipular y convertir la data en formas que produzcan mejores resultados. Algunos ejemplos serían: Eliminar o inferir datos perdidos, categorizar los valores de las variables, normalizar los valores numéricos o escalarlos para que puedan ser comparables.

4. Elección del Algoritmo

Una vez que ya hemos preprocesado la data, nos corresponde elegir el algoritmo más adecuado en relación al problema que deseamos resolver. En este punto tenemos que decidir por el Tipo de Aprendizaje que vamos a implementar. En las próximas clases de: Modelos Analíticos para Ciencia de Datos II y III se abordarán los Tipos de Aprendizaje en ML con mucho mayor detalle y profundidad.

4. Elección del Algoritmo

Tipos de aprendizaje Aprendizaje Supervisado: Son entrenados utilizando ejemplos etiquetados, como una entrada donde se conoce el resultado deseado.

El mismo recibe un conjunto de entradas junto con los resultados correctos correspondientes, y el algoritmo aprende comparando su resultado real con resultados correctos para encontrar errores. Luego modifica el modelo en consecuencia es decir, la salida de este algoritmo es conocida.

Tipos de aprendizaje Aprendizaje No Supervisado: Se utiliza contra datos que no tienen etiquetas históricas. No se da la "respuesta correcta" al sistema. El objetivo es explorar los datos y encontrar alguna estructura en su interior.

Por ejemplo: identificar segmentos de clientes con atributos similares que después puedan ser tratados de manera semejante en campañas de marketing o bien puede encontrar los atributos principales que separan los segmentos de clientes.

Tipos de aprendizaje Aprendizaje por Refuerzo: el algoritmo descubre a través de ensayo y error qué acciones producen las mayores recompensas.

Este tipo de aprendizaje tiene tres componentes principales: el agente (el que aprende o toma decisiones), el entorno (todo con lo que interactúa el agente) y acciones (lo que el agente puede hacer). Se utiliza a menudo en robótica, juegos y navegación.

5. Entrenar el modelo

Este paso tiene una relación directa con conceptos que abordaremos más adelante en el curso (Training y Test). Sin embargo, el proceso de entrenamiento de un modelo de ML, consiste en proporcionarle al modelo datos de entrenamiento de los cuales pueda aprender.

6. Validar el modelo Se realizará con la data de validación y procederemos a ¨correr” el algoritmo y a evaluar los resultados obtenidos. En el caso de que los resultados no sean satisfactorios, deberemos volver a la etapa 5 hasta que nuestro modelo se ajuste bien a las dos particiones (data de entrenamiento y data de validación).

7. Deployment del modelo

Implementación en producción de nuestro modelo. Generalmente, solemos ayudarnos de la nube a través de los tres vendors más conocidos que existen actualmente: ✔

AWS



Azure



GCP

Ejemplo en vivo ¡Vamos a trabajar con datos! ¿Qué conceptos de Data Science conocen o han escuchado nombrar?

¿Qué conceptos han escuchado antes? Por encuestas de Zoom: ✔ ✔ ✔ ✔

✔ SQL Exploratory Data Analysis ✔ Estadística inferencial Data Wrangling ✔ Machine Learning Minería de datos ✔ Deep Learning Limpieza de datos ✔ Inteligencia artificial

¡Vamos a trabajar con datos!

Miremos en el notebook Clase 1.ipynb cómo crear un gráfico igual a este.

Valor y retorno de la ciencia de Datos

Valor y retorno de la Ciencia de Datos Así como cualquier inversión, la factibilidad de un proyecto de ciencia de datos ocurre cuando genera más valor que costos. Para esto se puede utilizar el índice ROI (Return of Investment)

¿Qué queda del valor generado después de los costos se contabiliza el costo de los errores?

Valor y retorno de la Ciencia de Datos Retorno= valor -(1-accuracy)*Costo del error Retorno: Lo que se genera o el profit por cada predicción. Valor: El valor generado por cada predicción (e.g antes demoramos 5 minutos en obtener una predicción manual, con el algoritmo ahora toma 0.01 s)

Accuracy: Métrica de performance del modelo. Costo del error: Costos adicionales por un error (e.g nos demoramos 10 min corrigiendo un error en el sistema)

Valor y retorno de la Ciencia de Datos Si hacemos que el Retorno =0 entonces: 0= valor -(1-accuracy)*Costo del error accuracy= 1- (valor/Costo del error) A esto se le conoce como Break Even Accuracy

Ejemplo: Si cada predicción ahorra 5 min de trabajo pero arreglar errores te cuesta 20 min el Break Even Accuracy sería: 1- (5/20) = 0.75 (75%) Tu modelo debe tener al menos 75% de accuracy para que valga la pena usarlo

Valor y retorno de la Ciencia de Datos Ejemplo: Si tenemos un algoritmo que tiene un accuracy de 78%, donde cada predicción ahorra 5 min de trabajo y arreglar errores cuesta 10 min, entonces: Retorno= valor -(1-accuracy)*Costo del error Retorno = 5- (1-0.78)*10=2.8 Entonces, usar el algoritmo nos ahorra 2.8 minutos (168 seg) de trabajo.

Si estamos hablando de un call center que puede recibir 10000 llamadas al mes ahorramos 467 horas de trabajo manual 🚀Nada mal 🚀

Estrategia data-driven

Data Driven REEMPLAZAR POR IMAGEN

Es una disciplina que utiliza diversas técnicas y herramientas de análisis para aprovechar los datos generados dentro de un ámbito o empresa para su beneficio y el de sus clientes. Dicho de otro modo, se trata de sacar valor a los millones de datos de los que hoy disponemos para tomar mejores decisiones basadas en ellos.

Organización Data-Driven

Datos

Refinamiento

Uso

Organización Data-Driven

Datos Los clientes compran el producto de datos una vez y continúan usándolo tal como está.

Refinamiento

Uso

Un producto de datos es una aplicación informática que toma entradas de datos y genera salidas, devolviéndole al entorno.

Un producto de datos es información digital que se puede comprar y usar.

Datos

Refinamiento

Usos

Ejemplo de caso de uso Detección de fraude en una compañía de póliza de seguros: Su tarea es responder si existen patrones particulares en los grupos de reclamos presentados que puedan ser indicativos de fraude.



Estrategia: Análisis exploratorio de datos, metodología de agrupamiento (clustering), obtención de conclusiones



Funcionamiento: La información recolectada por parte de la aseguradora es el insumo del algoritmo de segmentación que permitirá detectar fraude en posibles reclamos de los usuarios



Oportunidades: Combinar con datos de ventas e información sociodemográfica para ofrecer nuevos productos de pólizas para los clientes de la empresa

Objetivos específicos: ✔

Comprender el comportamiento de los reclamos por parte de los usuarios.



Identificar grupos de acuerdo a su condición sociodemográfica.



Identificar posibles grupos problemáticos posiblemente asociados a eventos fraudulento.



Brindar ofertas promocionales, cupones y ofertas en pólizas a diferentes usuarios.



Actualizar servicios.

Datos y análisis del caso: Fuentes de Datos: Es donde podemos capturar la información, que puede ser de tres tipos: estructurada, semi-estructurada o no estructurada. Tipo de Análisis: Es la metodología que usamos para resolver el problema. nos podemos preguntar por: Descriptivo (¿Qué pasó?), Diagnóstico (¿Por qué paso?),Predictivo (¿Qué pasará?), Prescriptivo (¿Cómo hacer que suceda?)

Actividad colaborativa Optimizando el stock para una PYME Ayudamos a optimizar el stock de nuestra heladería de barrio Realizaremos la actividad en la sala general. Duración: 15-20 minutos

ACTIVIDAD COLABORATIVA

Optimizando el stock para una PYME Consigna: En la heladería de Pedro se lleva mucho tiempo trabajando sin ningún tipo de estrategia enfocada al uso de los datos como oportunidad de mejora y manejo de stocks. Recientemente, debido a la crisis sanitaria, el dueño ha cambiado su perspectiva y piensa que su empresa debería hacer un mejor uso de los datos históricos recolectados.



¿Cómo piensan que esta información puede ayudar a tener un mejor control del stock de la heladería?



¿Qué nivel de madurez tendría esta empresa según el modelo Data Management Maturity Model?

¿Preguntas?

¿Quieres saber más? Te dejamos material ampliado de la clase

MATERIAL AMPLIADO

Recursos multimedia ✓

Industria 4.0: Fabricando el futuro | Unión industrial Argentina, BID e INTAL



Ciclo de vida de un proyecto de Data Science | Analytics Vidhya



Transformación Digital | Salesforce

Disponible en nuestro repositorio.

CLASE N°1

Glosario Industria 4.0: que permiten utilizar el poder de las máquinas inteligentes y el análisis en tiempo real por medio de la interacción con sistemas ciber-físicos IoT (Internet of Things): conectividad entre dispositivos a la Internet IoS (Internet of Services): conectividad entre dispositivos a escala industrial

Ciclo de vida de un proyecto de DS: 7 fases que describen cómo resolver un problema analitico (Definir objetivo, Recolectar datos, Limpiar y preparar datos, Elección de algoritmo, Evaluación de algoritmos y Despliegue) Valor de retorno de un proyecto de DS: costo (tiempo o $) que se pierde o gana con la implementación de cualquier algoritmo en un proceso productivo

IoD (Internet of Data): manejo de volúmenes de datos gigantes interconectados

Estrategia Data Driven: uso de técnicas y herramientas para mejorar la toma de decisiones con el fin de extraer el valor de los datos

IoP (Internet of People): interacciones mucho más eficientes entre personas

Transformación digital: uso de tecnología en todas las áreas del negocio para mejorar productividad.

Muchas gracias.

Resumen de la clase hoy ✓

Cuarta Revolución Industrial



El Ambiente de la Industria 4.0



Transformación Digital



Ciclo de vida de un proyecto de ciencia de datos



Valor y retorno de la Ciencia de Datos