#23 ¿Que son los LLM? | Como ChatGPT se volvio lo que es hoy y más

Inteligencia Artificial para los Negocios - Un pódcast de EvoAcademy - Domingos

Categorías:

En el siguiente podcast, Jonathan Vásquez le explica a Eduardo Fica e Ignacio Alarcón qué son exactamente los LLM o Large Language Models, la historia de cómo llegaron a lo que son hoy, cómo funcionan a nivel técnico y cómo hoy son la base técnica de algunas de las herramientas más populares de Inteligencia Artificial como ChatGPT y Midjourney. Videos mencionados: Extensiones de Google Bard: https://www.youtube.com/watch?v=Y-oAAFcHleg ¿Qué IA está pasando? Es nuestro podcast de Inteligencia Artificial y Tecnología, escúchalo todas las semanas en tu plataforma de podcast favorita. --- Capítulos 00:00 Intro 00:44 El tema de hoy: Los Large Language Models 02:55 Redes neuronales - Capas, funciones, y más 07:25 Cómo pasamos de redes neuronales a los modelos modernos 09:40 Modelos pre-entrenados 12:41 ¿De donde vienen las bases de entrenamientos? 15:01 Cómo las máquinas pueden generar más datos 16:01 Cómo funciona la Attention 20:00 Paralelo con los lenguajes humanos 20:30 ¿Qué soluciona el Attention? 22:05 Arquitectura Coder, Encoder 23:05 BERT 26:17 Aplicación en Google Search 27:55 ¿Qué significa BERT? 30:55 ¿Es mejor como funciona BERT o GPT? 32:10 BERT para tareas nuevas y específicas 35:00 ¿Estos modelos “entienden”? 37:19 ¿Esto viene de los datos etiquetados? 38:40 Prompting 39:35 ¿Cómo entiende esto el lenguaje? 40:38 ¿Por qué son LARGOS? 43:10 ¿Cómo se miden estos modelos? 44:25 ¿Qué tanto importa el tamaño? ( ͡° ͜ʖ ͡°) 46:20 LLMs como motor de procesamiento 47:13 ¿Cómo funcionaría si todos trabajaran juntos? 49:20 LLMs como primera capa para comprender 52:38 ¿Es lo mismo con DALL-E? 56:00 Ejemplo: Copilot de Microsoft 57:04 La magia de entender el lenguaje: humanos vs máquinas 59:50 Sobre las alucinaciones 1:04:00 ¿Se puede verificar? Fake news 1:06:00 ¿Pueden ser estas herramientas proactivas? 1:07:50 Cierre