Pablo Guzzi se desempeña como líder de equipos de Data Science desde 2015. Actualmente, ocupa el rol de Chief Data & Analytics Officer en Naranja, la entidad financiera virtual más importante de Argentina. En esta entrevista comparte su visión acerca del auge de la incorporación de ciencia de datos en las organizaciones.
Cuéntanos de tu carrera profesional ¿Cómo nació el amor por la estadística y la ciencia de datos?
Soy Licenciado en Estadística. En su momento cuando estaba buscando carrera, me llamaba la atención el Data Mining. No existían carreras, hoy tenemos la fortuna de que la UBA tenga una carrera de ese estilo, por ejemplo.
La estadística era lo que más se asociaba a eso de alguna forma y yo creo que Data Science es estadística con un poder computacional muy distinto al que la estadística clásica tiene, pero en cuanto a lo más inherente de la disciplina me parece que comparten muchas cosas.
Después hice una maestría en Data Mining justamente para poder profundizar en el hecho concreto, aprendí a programar por mi cuenta y siempre me pasó que me enojaba un poco (y lo digo así a propósito) que las áreas de data generalmente eran manejadas por personas que no sabían de data, porque hacían gestión de equipos (y lo hacían muy bien), pero de repente había que traducir o ser una especie de fusible entre el negocio y la data.
Es muy difícil que esas personas generen la conexión necesaria para entender qué era lo necesario con sus colaboradores y también de cara a la mesa ejecutiva. Es decir, tener que mantener una visión de data que naturalmente no se tiene, en un ambiente donde nadie más tampoco lo tiene y eso hacía que los proyectos terminaran estancados o sin tener la pata de datos bien fuerte.
Un poco persiguiendo ese objetivo empecé a liderar equipos, me considero “hands on” cuando tengo tiempo me pongo a hacer cosas de este estilo… es mi gimnasio.
Ahora hay gente que se preparó más, ya tiene más experiencia, incluso han incursionado en temas de gestión y viene de manejar data. Ahora tienen la oportunidad de liderar equipos, no deja de ser una demanda constante y algo que el mercado sigue necesitando de forma contundente.
Es impresionante la cantidad de líderes que hay gestionando equipos de data sin necesariamente saber de data que no quita el mérito (se puede hacer), pero si te pones a comparar resultados, creo que hay una diferencia notable.
Es una realidad que es dual, a veces el que sabe de data peca de tener un sesgo de visión de negocio y ahí radica el balance o el equilibrio que hay que tener de esto.
Tomando en cuenta que actualmente son cada vez los líderes que quieren ser Data Driven ¿Cuál crees es el punto de equilibrio entre la data/visión negocio?
Yo considero que el equilibrio está en saber de data y tener la visión del negocio porque justamente la mayoría de los problemas que hoy tiene el mundo data provienen de ahí ¿Por qué digo esto? Porque en general hay mucha ansiedad alrededor del tema, hay mucha gente haciendo cursos y con ganas de innovar todo el tiempo, de estar en la cresta de la ola, y eso tiene consecuencias graves a veces.
Lo que suele suceder en momentos como este es que todos se quieren subir a “la moda” sin tener un caso de negocio por detrás y eso también es pecar por ilusos porque en definitiva todos estamos corriendo atrás de lo mismo que es el negocio. Entonces, muchas veces hay que saber mantener (y creo que ahí está la clave) los proyectos y quienes sepan permanecer al mismo tiempo que evolucionan serán quienes logren mantener el equilibrio entre hacer-innovar impulsado por un caso de uso por detrás.
Analítica no está exento de esto, e incluso en ocasiones es usual que se contrate a un experto externo sin un objetivo concreto, lo cual termina en pan para hoy y hambre para mañana.
Y en el mismo plano, pero desde el punto de vista de la tecnología, pasa exactamente lo mismo. Hoy en Naranja, por ejemplo, estamos viendo casos de uso innovadores como speech recognition, computer vision, audio to text, etc. Y de repente uno se da cuenta de que están buenísimos esos temas, pero aun suponiendo que están conectados a un caso de uso, es conveniente estudiar qué conviene más: si desarrollar un algoritmo propio o utilizar los de las grandes Tech (AWS, Azure, Google, etc).
Me parece que lo más importante es conseguir una capacidad analítica distintiva del resto, porque si no vamos a terminar todos estandarizados. Hoy ya está pasando un poco, los modelos de churn, de attrition, de cross-selling, upselling son modelos básicos que las empresas cada vez incorporan más.
Hay que hacer hincapié para revolucionar algún punto distintivo que tenga que ver con el core del negocio; y en algunos otros casos, utilizar servicios que los grandes vendors ofrecen.
También es un tema de datos, no descubro nada diciendo que muchos modelos son mucho mejores no por su algoritmo en sí mismo sino por la data que contiene. Cuando ya existen grandes players (como Amazon y Google) que tienen modelos preparados con volúmenes de datos muy diferenciales que puedes utilizar en tu call center para hacer speech to text por ejemplo, es muy probable que utilizar esos modelos sea más conveniente si tu business core no está ahí.
¿Tiene sentido ponerse a competir con eso? Muchas veces no y es ahí cuando pecamos por no saber discernir cuando sí y cuando no. Me parece que es una gran clave a tener en cuenta si queremos ser los mejores en términos de data.
Nos cuentas un poco sobre tu actualidad ¿Cuáles han sido algunos de los desafíos y oportunidades de desempeñarte como Chief Data & Analytics Officer en Naranja?
Te diría que los grandes desafíos tienen que ver con esto que venimos conversando, el hecho de vincular al negocio con la parte más técnica es clave, es algo que cuesta mucho y creo que es porque existe un gap que se estrecha desde dos lugares distintos:
1) Hacer que la gente técnica hable de negocio. Esto es válido y atiende justamente a la transformación de los perfiles, sin embargo, es complicado. La gente técnica hoy por hoy quiere desafíos técnicos y no se puede hacer la vista gorda tomando en cuenta la guerra por el talento que existe.
2) Hacer que la gente de negocio se culturice en términos de data. Acá entra lo que es cultura Data Driven. Hoy en Naranja, para estrechar la brecha por este lado, hicimos una academia de datos y analítica que tiene más de 1000 inscriptos. Son diplomaturas de 6 meses en los que sales con un entendimiento diferencial de lo que es data y tiene tres niveles distintos.
Me parece que este tipo de iniciativas hacen la diferencia porque acerca al público en el lugar donde convive todo el tiempo y al mismo tiempo también obtienen una beta más de desarrollo a quienes tengan la inquietud sobre todo en este contexto tan acechado por el tema data en general.
Por otro lado, la oportunidad es saber monetizar los datos, que también de vuelta, tiene que ver con el vínculo con el negocio. Tanto a nivel data como a nivel analítica es necesario aceitar esos engranajes y para eso es necesario generar una cultura Data Driven en toda la empresa, que cuando un líder tome una decisión lo haga basándose en datos y no en el estómago. Puede sonar cliché, pero hay un montón de sinsabores en el medio hasta que eso pase.
En Naranja, más allá de la academia que creamos, también nos esforzamos por explicitar el flujo de los datos adentro de la empresa, tenemos un framework alrededor de los datos para que haya claridad acerca de cómo se usan, sugerimos y damos guide lines sobre cuáles son los mejores momentos para tomar decisiones basándose en datos.
La idea es poner a disposición de una forma práctica la información que requieren cada una de las personas en Naranja. Hay un sinfín de cosas que terminan haciendo que esto sea posible; estamos construyendo ese camino, mentiría si digo que ya lo tenemos hecho, pero tenemos la claridad de saber que lo estamos persiguiendo y de comprometernos con ese camino.
¿Cómo es tu equipo?
Mi equipo está conformado por cinco áreas:
1) Data Analytics (donde están todos los Data Analyst) que son la primera capa analítica, hacen un primer manejo de datos de cara al negocio, se encarga de los reportes, experimentos con datos, enriquecimiento de la base de datos, etc.
2) Data Science que se encarga principalmente de machine learning desarrollando modelos que apuntalen el negocio.
3) Data Management que se encarga de la gestión de datos (todo lo que tiene que ver con política de datos, gobierno de datos).
4) Big Data que desarrolla la tecnología necesaria para hacer todo esto posible.
5) Data Engineering que se encarga de hacer la ingesta de datos al data lake y evolucionar la práctica. Estamos reconfigurándonos ahora, pero de eso no te puedo contar aún.
Somos alrededor de 65 personas y cada equipo cuenta con un líder. Existen distintos niveles y gamas de profundidad técnica adentro del área.
Se ha hablado de que todos los perfiles profesionales admiten la aplicación de ciencia de datos y que se puede aprender haciendo ¿Qué consideras debe tener en cuenta cualquier persona que quiera emprender en este sector?
Yo creo que si estás en cero hay que arrancar por un caso de uso con un objetivo bien concreto por atrás y bien apuntalado en el negocio. Para eso, considero que cada proyecto o cada caso de uso necesita perfiles distintos dependiendo inherentemente del caso de uso.
Si puedo resumir la mayoría de los perfiles que se necesitan en tres clásicos diría: Data Analyst, Data Engineering y Data Scientist. Tomando en cuenta esto, para arrancar puede que un científico de datos (que suele ser el más completo de todos) sirva de muleta para los otros dos.
Después hay una realidad, a todos nos gustaría contratar al Data Scientist que entiende de negocio, que sabe de ingeniería de datos y al mismo tiempo puede sentarse a hablar con un comercial; pero es difícil encontrar a alguien así, son unicornios.
Por tanto, es un perfil relativamente nuevo y que todavía está en definición. El mercado no se da abasto con los perfiles, hay una oferta muy por debajo de la demanda.
En vista de esto, es importante empezar a encontrar las oportunidades que se tienen respecto a los distintos perfiles. Es decir que, si encontraste a alguien que técnicamente en sólido, pero que tiene un pequeño gap en cierto tópico puntual en machine learning, que no sabe comunicarse asertivamente o que no tiene una buena visión del negocio, podes desarrollar esta persona para perfeccionarla. Creo que es la clave en la retención de talento, el desarrollo de las personas.
La idea es poder tomar en cuenta todo, primero para detectar si hay una posibilidad de desarrollo en la persona, pero después también para entender cómo está el mercado.
¿Cómo vislumbras el futuro de las organizaciones en la cultura de datos?
Es complejo, pero desde mi punto vista, considero que los grandes ganadores de esto van a ser quienes mejor lo adopten y se me viene el ejemplo de cuando Deep Blue le ganó al gran maestro de ajedrez Garri Kaspárov en 1996.
Kaspárov frustrado por la situación inventó lo que para mí fue una genialidad: creó un juego de ajedrez en el que compiten un humano y una máquina vs un humano y una máquina, Advanced Chess. Cada jugador humano utiliza un programa de ajedrez informático para explorar los posibles resultados de los movimientos candidatos. A pesar de esta ayuda de la computadora, es el jugador humano quien controla y decide el juego.
Me parece que esto representa un aprendizaje abismal porque habla muy bien de la capacidad de adaptación, que es lo que requiere la sociedad entera hoy en día.
El valor agregado va a seguir existiendo, pero en nuevos lugares. Lo realmente relevante es saber de qué manera adaptarse. La idea es ir encontrando las oportunidades en el medio de la adaptación.
En este sentido, también considero que van a haber distintos niveles de adaptabilidad desde la supervivencia hasta la superación. Se abren nuevas oportunidades, no solo se trata de que se están reemplazando cosas, sino que también se está abriendo la ventana para lo nuevo y depende de cada uno de nosotros el poder verla.
¿Qué expectativas tienes para tu área en 2021?
Yo siempre digo lo mismo, estoy acá para poner a Naranja en el titular del diario en términos de data & analytics. Somos caso de éxito en AWS (Amazon Web Services), tenemos H20 que es una plataforma de automl que tienen un puñado de empresas en la región, tenemos un equipo super sólido y tenemos una cultura que enamora.
Me parece que tenemos todas las condiciones dadas para ser los jugadores en el mercado y básicamente esa es la expectativa que tengo, ponernos en lugar de privilegio.
No es fácil, pero la realidad es que tenemos un montón de desarrollos en los que somos punta de lanza y estamos desafiándonos continuamente. Tenemos un hambre por los desafíos grande y mi apuesta es utilizar eso para generar una innovación continua en el mercado.
¿Cuál es tu mensaje para los líderes que quieren promover la cultura de datos en sus organizaciones y no saben cómo empezar?
Hay que empezar de a poco, con baby steps. No hay que volverse locos, hay que tener uno o dos casos de uso concretos con objetivos concretos, sobre todo. Olvidarse de empezar montando todo un data lake, aplicando las más estrictas buenas prácticas en visualización de datos, o iniciar con Deep learning.
Pasa más por ir a uno o dos casos de uso que pueden surgir desde cualquier área, donde por ahí esté sembrada la semilla de hacer un forecast de ventas y mejorar algún proceso de supply termina originando un caso de uso con una monetización atrás después el resto camina solo.
No hacen falta áreas de data al comienzo, hacen falta áreas core o algún área inquieta que tenga un caso de uso, que recoja bien las evidencias y que después salga a contarlo.
Pablo Guzzi | Chief Data & Analytics Officer en Naranja