Cover Photo for 🗣️ GenAI en español con RigoChat y migración de Spark a Polars

🗣️ GenAI en español con RigoChat y migración de Spark a Polars

Primary Photo for PyData Madrid

Hosted by

PyData Madrid

In-Person

Address available to attendees

Online

Link available to attendees

We missed you this time around!

PyData Madrid vuelve en Marzo para hablar de Python, Datos, Visualización, Inteligencia Artificial, ¡Y lo que surja!

Este mes el evento se realizará en Utopicus Príncipe de Vergara (C. del Príncipe de Vergara, 112) gracias a que Affirm nos cede generosamente el espacio.

Tendremos el placer de contar con dos charlas:

  • Álvaro Clemente (19:15-19:45) Senior Machine Learning Engineer en Affirm, nos contará por qué migraron una pipeline legacy de PySpark a Polars, las trampas en las que cayeron y las lecciones que aprendieron en el camino (en español).
  • Gonzalo Santamaría, Carmen Muñoz y Álvaro Barbero (20:00-20:30), Cientifíco de Datos, Lingüista Computacional y Director de IA respectivamente en el Instituto de Ingeniería del Conocimiento (IIC), hablarán de RigoChat-2, un modelo generativo focalizado en el español que han construido "en casa", haciendo uso de modelos abiertos ya disponibles y de datos de alta calidad creados o curados en su equipo (en español).

Después de la reunión, nos quedaremos haciendo networking en las instalaciones de Affirm.

Recomendaciones generales:

  • ¿Sabes mucho de Python y Datos? ¿Sabes poco y quieres saber más? ¡En ambos casos, te damos la bienvenida!
  • Aplica "la regla del comecocos": si estás en un círculo, deja siempre un hueco para que otra persona se pueda unir.
  • Puede haber asistentes que no hablen bien español y que se manejen mejor en inglés. Sé paciente y ¡No dejes que se aburran!
  • En los eventos PyData rige un Código de Conducta https://pydata.org/code-of-conduct/ el resumen traducido: sé amable, abstente de insultar y de hacer bromas sexistas, racistas, o excluyentes en general, y nada de insinuaciones sexuales a otras personas.

***
Important ⚠️ We need your full name, do not forget to enter it in the registration form.

PyData Madrid returns in March to talk about Python, Data, Visualization, Artificial Intelligence, and whatever else comes up!

This month, the event will take place at Utopicus Príncipe de Vergara (C. del Príncipe de Vergara, 112) thanks to Affirm generously providing us with the space.

This time, we are excited to present these two talks:

  • Álvaro Clemente (19:15-19:45), Senior Machine Learning Engineer at Affirm, will tell us why they migrated a legacy pipeline from PySpark to Polars, the pitfalls they fell into, and the lessons they learned along the way (in Spanish).
  • Gonzalo Santamaría, Carmen Muñoz y Álvaro Barbero (20:00-20:30), Data Scientist, Computational Linguist and AI Director at Instituto de Ingeniería del Conocimiento (IIC) respectively, will talk about RigoChat-2, a Spanish-focused generative model they built in-house, leveraging already available open models and high-quality data created or curated by their team (in Spanish).

After the meeting, we will stay for networking at Affirm's facilities.

General recommendations:

  • Are you an expert in Python and Data? Are you a beginner and want to learn more? In both cases, you are very welcome!
  • Apply the "Pac-man rule": if you're in a circle, leave a gap so that someone else can join.
  • If you don't speak good Spanish, we will do our best to make you feel comfortable. But be mindful that other attendees might want to use their native language in larger conversations. Use this opportunity to practice your Spanish! If you are bored, feel free to approach the organizers and say «Hi!»
  • At PyData events there is a Code of Conduct https://pydata.org/code-of-conduct/ Super short version: be kind (all else is details), abstain from insulting others or making sexist, racist, or other exclusionary jokes, and do absolutely not make sexual advances to other attendees.

🗣️ GenAI en español con RigoChat y migración de Spark a Polars

Primary Photo for PyData Madrid

Hosted by

PyData Madrid

In-Person

Address available to attendees

Online

Link available to attendees

PyData Madrid vuelve en Marzo para hablar de Python, Datos, Visualización, Inteligencia Artificial, ¡Y lo que surja!

Este mes el evento se realizará en Utopicus Príncipe de Vergara (C. del Príncipe de Vergara, 112) gracias a que Affirm nos cede generosamente el espacio.

Tendremos el placer de contar con dos charlas:

  • Álvaro Clemente (19:15-19:45) Senior Machine Learning Engineer en Affirm, nos contará por qué migraron una pipeline legacy de PySpark a Polars, las trampas en las que cayeron y las lecciones que aprendieron en el camino (en español).
  • Gonzalo Santamaría, Carmen Muñoz y Álvaro Barbero (20:00-20:30), Cientifíco de Datos, Lingüista Computacional y Director de IA respectivamente en el Instituto de Ingeniería del Conocimiento (IIC), hablarán de RigoChat-2, un modelo generativo focalizado en el español que han construido "en casa", haciendo uso de modelos abiertos ya disponibles y de datos de alta calidad creados o curados en su equipo (en español).

Después de la reunión, nos quedaremos haciendo networking en las instalaciones de Affirm.

Recomendaciones generales:

  • ¿Sabes mucho de Python y Datos? ¿Sabes poco y quieres saber más? ¡En ambos casos, te damos la bienvenida!
  • Aplica "la regla del comecocos": si estás en un círculo, deja siempre un hueco para que otra persona se pueda unir.
  • Puede haber asistentes que no hablen bien español y que se manejen mejor en inglés. Sé paciente y ¡No dejes que se aburran!
  • En los eventos PyData rige un Código de Conducta https://pydata.org/code-of-conduct/ el resumen traducido: sé amable, abstente de insultar y de hacer bromas sexistas, racistas, o excluyentes en general, y nada de insinuaciones sexuales a otras personas.

***
Important ⚠️ We need your full name, do not forget to enter it in the registration form.

PyData Madrid returns in March to talk about Python, Data, Visualization, Artificial Intelligence, and whatever else comes up!

This month, the event will take place at Utopicus Príncipe de Vergara (C. del Príncipe de Vergara, 112) thanks to Affirm generously providing us with the space.

This time, we are excited to present these two talks:

  • Álvaro Clemente (19:15-19:45), Senior Machine Learning Engineer at Affirm, will tell us why they migrated a legacy pipeline from PySpark to Polars, the pitfalls they fell into, and the lessons they learned along the way (in Spanish).
  • Gonzalo Santamaría, Carmen Muñoz y Álvaro Barbero (20:00-20:30), Data Scientist, Computational Linguist and AI Director at Instituto de Ingeniería del Conocimiento (IIC) respectively, will talk about RigoChat-2, a Spanish-focused generative model they built in-house, leveraging already available open models and high-quality data created or curated by their team (in Spanish).

After the meeting, we will stay for networking at Affirm's facilities.

General recommendations:

  • Are you an expert in Python and Data? Are you a beginner and want to learn more? In both cases, you are very welcome!
  • Apply the "Pac-man rule": if you're in a circle, leave a gap so that someone else can join.
  • If you don't speak good Spanish, we will do our best to make you feel comfortable. But be mindful that other attendees might want to use their native language in larger conversations. Use this opportunity to practice your Spanish! If you are bored, feel free to approach the organizers and say «Hi!»
  • At PyData events there is a Code of Conduct https://pydata.org/code-of-conduct/ Super short version: be kind (all else is details), abstain from insulting others or making sexist, racist, or other exclusionary jokes, and do absolutely not make sexual advances to other attendees.

Guild

Get in touch!

hi@guild.host