Saltar al contenido
CristianTala_

blog de un founder

Construyo, invierto y automatizo.
Conocimiento empírico, no de textbook.

Tecnología, startups e inversión — navegando sin un mapa desde 2011.

Cristian Tala Sánchez

último post

Kimi K2: medí 4 variantes y la más vieja gana [2026]
IA y Automatización

Kimi K2: medí 4 variantes y la más vieja gana [2026]

Medí 4 variantes de Kimi en mi benchmark de 89 modelos: la mejor es la más vieja (K2, #50) y una queda última de toda la tabla. Los números y la explicación.

16 jun 2026

posts recientes

IA y Automatización 15 jun 2026

Claude Fable 5 duró 72 horas: qué pasó realmente

Claude Fable 5 duró 72 horas: el gobierno de EE.UU. lo hizo apagar el 12 de junio. Qué pasó de verdad, qué dice Anthropic y qué reveló mi benchmark.

IA y Automatización 15 jun 2026

¿Qué es Claude Code? La guía para emprendedores (sin programar)

Qué es Claude Code y cómo usarlo sin programar: la IA que sale del chat a trabajar en tu computador. Explicado para emprendedores, con casos reales.

IA y Automatización 15 jun 2026

GLM-5.1: el open source del hype, medido [2026]

GLM-5.1 presume benchmarks de élite, pero en el mío queda #62 de 89 (5.30). La calidad es real; la velocidad y el precio no acompañan. Los números y el porqué.

IA y Automatización 15 jun 2026

llms.txt: qué es y cómo agregarlo en WordPress

Qué es llms.txt, por qué importa para que la IA cite tu sitio y cómo agregarlo en WordPress: a mano o automático con un plugin.

IA y Automatización 14 jun 2026

Qwen3-Coder-Next: análisis con benchmark propio [2026]

Qwen3-Coder-Next es el #4 de mi benchmark (8.10 sobre 10, 89 modelos): 80B parámetros que activan solo 3B. Qué hace bien, dónde falla y cómo correrlo barato.

IA y Automatización 13 jun 2026

DeepSeek V4 Flash: 800K de contexto real, medido [2026]

DeepSeek V4 Flash: #3 de mi benchmark con 89 modelos, 8.13 sobre 10 y 800K tokens de contexto usable verificado. Dónde brilla, dónde falla y cómo usarlo barato.

Negocios 12 jun 2026

La tecnología correcta vs optimizar la que tienes [2026]

15 años haciendo plugins para WordPress y el problema nunca fue eficiencia. 3 preguntas para saber si la tecnología le corresponde a tu problema.

IA y Automatización 12 jun 2026

Claude Fable 5: análisis con benchmark propio [2026]

Medí Claude Fable 5 en mi benchmark: top 10 en calidad pura, #38 de 89 cuando metes el precio. Qué es, cuánto cuesta y cuándo se justifica pagar el doble.

IA y Automatización 12 jun 2026

Devstral Small: análisis con benchmark propio de 89 modelos [2026]

Devstral Small es el #1 de mi benchmark con 89 modelos: 8.28 sobre 10 por $0.48 cada 1.000 llamadas. Qué hace bien, dónde falla y cómo correrlo gratis.

Navegando Sin Un Mapa

Lo que estoy aprendiendo sobre tecnología, startups e inversión. Un email a la semana, sin humo.