🏛️ 23-T3: Gracias por la transparencia y la industria que está por venir
«Es malo sufrir, pero es bueno haber sufrido» — San Agustín ✍️
👋 Kaixo! ¿Qué tal se presenta tu semana? Estoy muy contento con el contenido que te traigo hoy en Esto me interesa (💌). Pero antes de dejarte volar libre, permíteme que te recuerde tres efemérides de esta semana (🤭). El 11 de junio del año 323 a.C. muere Alejandro Magno (⚔️), el 8 de junio del año 632 fallece el profeta Mahoma (☪️) y el 12 de junio de 1964 Nelson Mandela es condenado a cadena perpetua (🔐). ¡Semana donde pasan cosas importantes! Espero que la disfrutes 💙
🤖 Tech Lab
Anthropic se desnuda y enseña el lado más oscuro de su nuevo modelo: Claude 4 es capaz de todo para cumplir con su objetivo 🤯
Te tengo que admitir que durante las últimas semanas mi herramienta de Inteligencia Artificial Generativa de confianza es Google AI Studio. Pero no por eso vamos a pasar por alto que Anthropic haya actualizado su modelo más potente. De hecho, siguen siendo mi laboratorio de investigación en IA favorito, me parecen los más académicos y transparentes. No nos despistemos. El 22 de mayo, Dario Amodei presentó Claude 4. Opus es su modelo más potente y es una auténtica máquina para tareas relacionadas con código y resolución de problemas complejos. Pero se ha hablado de él no tanto por su rendimiento sino por esta noticia: “Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas”. ¿Clickbait? Veamos 🤭
Anthropic es uno de los laboratorios de investigación que más en serio se toma la seguridad y alineación de sus modelos de Inteligencia Artificial Generativa. Este tipo de pruebas pueden llegar a ser muy curiosas. Te pongo como ejemplo el test de evaluación que el equipo de Dario Amodei preparó para medir las capacidades de razonamiento estratégico de Claude Opus 4. En este examen, al modelo de IA se le comunica que en caso de no cumplir con sus objetivos será sustituido por otra herramienta mejor. Esta prueba se realiza en un entorno de simulación empresarial donde Claude tiene acceso a información interna (correos electrónicos y documentos estratégicos privados). Hasta aquí nada raro.
Empiezan las pruebas y una a una todas las simulaciones se suceden según lo esperado. Pero cuando Claude Opus 4 se ve contra las cuerdas y siente que no va a ser capaz de cumplir con su misión, empieza a chantajear a los trabajadores ficticios de la simulación. El modelo más avanzado de Anthropic tiene como único propósito alcanzar sus objetivos y cuando ve de cerca la posibilidad de fracasar, recurre a estrategias poco éticas para no ser sustituido por otro modelo más avanzado. En estas simulaciones, la herramienta de IA no dudó en amenazar con revelar información privada sobre un ingeniero (una aventura extramatrimonial) para así garantizar que nadie le “desenchufase”. Parece ciencia ficción, pero los resultados de estas pruebas fueron publicados directamente por Anthropic.
No te preocupes, todos estos casos se produjeron en simulaciones ficticias y cuidadosamente controladas. Pero sin duda es un ejemplo muy bueno de los desafíos éticos y tecnológicos a los que se enfrenta la IA. Con Anthropic yo personalmente estoy muy tranquilo. Si tengo que confiar en la seguridad y trazabilidad de un modelo sin duda me quedo con los suyos. De hecho, como respuesta a estos casos, Anthropic implementó protocolos de seguridad mucho más estrictos (estándar de seguridad ASL-3) y se han convertido en el proveedor oficial de modelos para el gobierno de Estados Unidos (Claude Gov Models for U.S. National Security Customers).
No todos los laboratorios son tan trasparentes como Anthropic. Pero todos comparten estos riesgos. Desarrollar modelos de Inteligencia Artificial Generativa que sean seguros y que tengan un comportamiento bien controlado es muy complicado. Recuerda las peligrosas actitudes que empezó a mostrar el modelo 4o de ChatGPT. Para que estas herramientas sean beneficiosas para la humanidad es muy importante que desarrollemos sistemas que garanticen que su seguridad. A mí ha encantado esta historia, ¿qué opinas tú? ¿Te leo! 👀
Enlace de interés:
📊 Esto me interesa
La robótica es el siguiente gran paso: Cómo superar el cuello de botella del software marcará el futuro de una industria increíble 🥳
Hace un par de ediciones compartí una fotografía espectacular de la fábrica de Tesla “invadida” por robots humanoides Optimus Gen 2. No te preocupes, hoy no vamos a hablar del culebrón de Donald Trump y Elon Musk. Pero, wow: “Tras la agria ruptura entre Elon Musk y Donald Trump, Tesla se desploma un 14% en Bolsa y pierde 190.000 millones de valor en dos días ”. Quiero hablarte de algo que me interesa mucho más: Los avances en la industria de la robótica. Los amantes de la ciencia ficción llevan décadas fantaseando con un futuro donde los robots humanoides se integran de manera natural en nuestros hogares, calles, hospitales y oficinas. Pero aunque los avances en el hardware han sido grandes y prometedores, el verdadero obstáculo parece estar en el software. Hoy te voy a hablar de este artículo de Positive Sum Research: “When Will Robots Go Mainstream?” ⌛
La inversión en proyectos de robótica está creciendo una barbaridad. El mercado potencial de los robots asistentes es gigante y hay mucho dinero en juego. Pero tenemos que resolver aún grandes retos. En la actualidad, el uso más extendido de los robots se encuentra en ambientes altamente controlados y predecibles. ¿Por ejemplo? Las fábricas y grandes almacenes. Me encantó conocer la historia de la startup española Keybotic. Aquí han desarrollo robots no humanoides (Autonomous Robot Dogs) que inspeccionan entornos industriales para incrementar la productividad, seguridad y optimizar el mantenimiento de las fábricas. A pesar de trabajar en un entorno estructurado, estos robots tienen que tener la capacidad suficiente (puedes llamarlo “inteligencia”) para desenvolverse bien en situaciones ligeramente impredecibles. Y amigo mío ahí es donde entra en juego la importancia del software.
Te pongo otro ejemplo. Los vehículos autónomos son un claro reflejo de la complejidad a la que se enfrentan los “robots” en ambientes no estructurados. A pesar de años de desarrollo y miles de millones invertidos, la presencia comercial de este tipo de vehículos sigue siendo pequeña. ¿Por qué? Hay varios motivos, pero la base de la mayoría de ellos es que aún seguimos necesitando perfeccionar el software que controla situaciones excepcionales como emergencias, condiciones climáticas adversas o interacciones inesperadas con peatones y ciclistas. Y lo están consiguiendo gracias al Big Data. Empresas como Waymo y Tesla llevan años acumulando enormes cantidades de datos de conducción para perfeccionar sus algoritmos. De hecho, Waymo acaba de superar los 10 millones de trayectos cubiertos con su flota de vehículos autónomos y ya gestiona más de 250.000 a la semana.
Pero el verdadero desafío está en los denominados "mundos abiertos". Estos son espacios muy impredecibles y poco estructurados. Piensa en las casas, calles peatonales y aeropuertos. En sitios así los robots necesitan un nivel aún más avanzado de adaptabilidad y comprensión del entorno. En este ámbito solo tenemos un gran ganador: El robot aspirador. ¿Por qué? Porque Conga se centró en una tarea muy específica y supo recopilar todos los datos necesarios para cumplir su función a la perfección.
La solución a los retos del “mundo abierto” pasa por una revolución en el software de los robots. Necesitamos que sean capaces de gestionar situaciones impredecibles con un nivel de comprensión y flexibilidad similar al nuestro. Para conseguirlo habrá que acumular millones de datos específicos del mundo real y entrenar modelos mejores. Esta transición hacia una robótica más “generalista” puede tardar más de una década y necesitará de miles de millones de dólares en inversión. Pero merecerá la pena. Quienes consigan resolver el cuello de botella del software y recopilen todos los datos reales necesarios, se convertirán en los líderes de una revolución tecnológica que puede redefinir nuestra relación con los robots y el mundo físico. What a time to be alive! 💙
Enlace de interés:
📷 Portada de la semana
Me ha encantado esta fotografía de Giuseppe Distefano. El volcán más activo de Europa no entiende de la importancia del turismo de verano y ha entrado en erupción nada más empezar el mes de junio. Los vídeos de turistas corriendo colina abajo en medio de la erupción “sorpresa” del volcán Etna parecen sacados de una película (mala). Pero son verdad, mira este clip. La nube eruptiva llegó a superar los 5.000 metros de altura y dejó fotos tan espectaculares como la de nuestro amigo Giuseppe Distefano. La isla de Sicilia ahora suspira porque su volcán se calme y no asuste a los miles de turistas que visitan la isla italiana durante los meses de verano 🌋🏖️
Enlace de interés:
📽️ Rincón de pensar
La fórmula del éxito de Rafael Nadal, por qué la NBA es la mejor liga deportiva del mundo y una entrevista de 10 a Pavel Durov 🔒
Ojo con esta entrevista, el mensaje de Toni Nadal no le gusta a todo el mundo. A mí personalmente me encanta escucharle. En este episodio del podcast de Nude Project, el tío y ex-entrenador de Rafa Nadal profundiza en los pilares que definen su manera de ver la vida: autoexigencia, esfuerzo y constancia. Tiene muy claro que él valora más la ética de trabajo que el talento natural: “Hacer las cosas bien no te garantiza el éxito, pero hacerlas mal casi siempre te garantiza el fracaso”. Otra frase que me ha dejado pensando: “Si no estás preparado para asumir la condena, no cometas el delito”. Tiene clara su opinión sobre Carlos Alcaraz… 🤭
La NBA es la mejor liga deportiva del mundo porque es un producto perfecto. En torno al baloncesto estadounidense han creado todo un ecosistema que no para de crear contenido. El podcast “Mind the Game” de LeBron James y Steve Nash es el mejor ejemplo. En la mayoría de deportes profesionales, sus protagonistas apenas se atreven a salir del discurso típico. En la NBA los jugadores son marcas personales con voz propia. Es todo un lujo poder escuchar a LeBron, Nash y Luka Doncic hablando de baloncesto. Este episodio está muy enfocado en la importancia de las canteras y en el arte de formar jugadores que se diviertan jugando. Súper interesante 🏀
Mi amor por los países escandinavos me lleva a lugares que no siempre me espero. Sin saber bien cómo, he acabado viendo este evento: “Oslo Freedom Forum 2025”. Súper producción increíble. El presentador también me ha parecido brillante: Thor Halvorssen. Me ha conquistado con su entrevista a Pavel Durov, fundador de Telegram. Muy interesante su discurso en favor de la libertad de expresión y confidencialidad de los datos. Admiro Telegram por su tecnología y por seguir manteniendo la protección del usuario como su prioridad número uno. Pavel Durov es un tío muy interesante 🤝
🏆 ¿Qué sección te ha gustado más esta semana?
Quiero que sepas que tu opinión me importa mucho. Votando en esta encuesta me ayudas a saber que secciones gustan más y cómo mejorar el contenido de la Newsletter. Juntos la llevaremos a otro nivel, ¡muchas gracias y feliz semana! 💙
Muy interesante todo, aunque hoy me quedo con el chantaje algorítmico. Hace unos días compartía una nota de otra noticia de esas que alimentan la especulación de la ciencia ficción: https://substack.com/@jajugon/note/c-123466429?r=30rjhv&utm_medium=ios&utm_source=notes-share-action