↓Ir al contenido

Delfín: Análisis de Imágenes de Documentos mediante Prompting de Anclas Heterogéneas

12 agosto 2025·421 palabras·2 mins

GitHub Open Source Image Generation

Articoli Interessanti - Este artículo es parte de una serie.

Parte : Por que tu empresa necesita IA privada (y no ChatGPT)

Parte : Keycloak

Parte : GitHub - zai-org/GLM-OCR: GLM-OCR: Preciso × Rápido × Completo

Parte : GitHub - EricLBuehler/mistral.rs: Inferencia rápida y flexible de LLM

Parte : GitHub - alexziskind1/llama-throughput-lab: Lanzador interactivo y arnés de referencia para el rendimiento del servidor llama.cpp, con pruebas, barridos y herramientas de carga en ronda.

Parte : GitHub - qwibitai/nanoclaw: Una alternativa ligera a Clawdbot / OpenClaw que se ejecuta en contenedores de Apple para seguridad. Conectar

Parte : GitHub - moltbot/moltbot: Tu propio asistente de IA personal. Cualquier SO. Cualquier plataforma. A la manera del langosta. 🦞

Parte : GitHub - aiming-lab/SimpleMem: SimpleMem: Memoria Eficiente de Por Vida para Agentes LLM

Parte : GitHub - mikekelly/claude-sneakpeek: Obtén una compilación paralela del código de Claude que desbloquea capacidades con bandera de características como el modo enjambre.

Parte : GitHub - virattt/fondo-de-cobertura-ia: Un equipo de fondo de cobertura de IA

Parte : moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face

Parte : ¡Bienvenido - Documentación de Poke

Parte : Memoria Condicional a través de Búsqueda Escalable: Un Nuevo Eje de Esparcidad para Modelos de Lenguaje Grandes

Parte : NVIDIA PersonaPlex: IA Conversacional Natural con Cualquier Rol y Voz - NVIDIA ADLR

Parte : GitHub - different-ai/openwork: Una alternativa de código abierto a Claude Cowork, impulsada por OpenCode

Parte : GitHub - google/langextract: Una biblioteca de Python para extraer información estructurada de texto no estructurado utilizando LLMs con precisión.

Parte : GitHub - memodb-io/Acontext: Plataforma de datos para la ingeniería de contexto. Plataforma de datos de contexto que almacena, observa y aprende. Únete

Parte : GitHub - rberg27/doom-coding: Una guía sobre cómo usar tu smartphone para programar en cualquier lugar y en cualquier momento.

Parte : GitHub - bolt-foundry/gambit: Marco de trabajo para agentes para construir, ejecutar y verificar flujos de trabajo de LLM.

Parte : GitHub - eigent-ai/eigent: Eigent: El escritorio de coworking de código abierto para desbloquear tu productividad excepcional.

Parte : Pregunta en HN: ¿Cuál es la mejor manera de proporcionar contexto continuo a los modelos?

Parte : Modelos de Lenguaje Recursivos

Parte : Reimaginando la Memoria de LLM: Utilizar el Contexto como Datos de Entrenamiento Desbloquea Modelos que Aprenden en Tiempo de Prueba

Parte : Muestra HN: Agent-of-empires: Gestor de sesiones de código OpenCode y Claude

Parte : Deberías Escribir un Agente · El Blog de la Mosca

Parte : Empezando - Documentación de SWE-agent

Parte : Cómo construir un agente - Amp

Parte : Audio SAM

Parte : Logramos que Claude afinara un modelo de lenguaje abierto de código fuente.

Parte : Usa Claude Code con Chrome (beta) - Documentación de Claude Code

Parte : GitHub - microsoft/VibeVoice: Inteligencia Artificial de Voz de Frontera de Código Abierto

Parte : GitHub - GVCLab/PersonaLive: ¡PersonaLive! : Animación de Imágenes de Retrato Expresivo para Transmisión en Vivo

Parte : GitHub - NevaMind-AI/memU: Infraestructura de memoria para LLMs y agentes de IA

Parte : GitHub - VibiumDev/vibium: Automatización de navegadores para agentes de IA y humanos

Parte : GitHub - yichuan-w/LEANN: RAG en Todo con LEANN. Disfruta de un ahorro de almacenamiento del 97% mientras ejecutas una aplicación RAG rápida, precisa y 100% privada en tu dispositivo personal.

Parte : GitHub - DGoettlich/history-llms: Centro de información para nuestro proyecto de entrenamiento de los LLMs históricos más grandes posibles.

Parte : LLMRouter - LLMRouter

Parte : Todo como Código: Cómo gestionamos nuestra empresa en un monorepo | Kasava

Parte : GitHub - Buscar código, repositorios, usuarios, problemas, solicitudes de extracción...: 🔥 Una herramienta para analizar la preparación de tu sitio web para la IA, impulsada por Firecrawl.

Parte : Fundamentos de la Construcción de Agentes Autónomos LLM Este documento se basa en un informe técnico de seminario del curso Tendencias en Agentes Autónomos: Avances en Arquitectura y Práctica ofrecido en la TUM.

Parte : Introducción | Caja de Herramientas MCP para Bases de Datos

Parte : GitHub - Tencent-Hunyuan/HunyuanOCR

Parte : Arneses efectivos para agentes de larga duración Anthropic

Parte : GitHub - pixeltable/pixeltable: Pixeltable — Infraestructura de datos que proporciona un enfoque declarativo e incremental para cargas de trabajo de IA multimodal.

Parte : AI Explicado - Artículo de Investigación de Stanford.pdf - Google Drive

Parte : Presentamos Olmo 3, nuestra próxima familia de modelos de lenguaje completamente abiertos y líderes.

Parte : A2UI se traduce como "A2UI".

Parte : Nano Banana Pro está haciendo que millones de diseñadores de interiores sean obsoletos. Subo mi plano de planta y me diseña toda la casa, e incluso genera imágenes reales para cada habitación basadas en las dimensiones.

Parte : Cómo segmentar videos con Segment Anything 3 (SAM3)

Parte : Presentando MagicPath, un lienzo infinito para crear, refinar y explorar con IA.

Parte : Nano Banana Pro es salvaje

Parte : A continuación… Presentaciones de diapositivas. ¡Transforma tus fuentes en una presentación detallada para leer o en un conjunto de diapositivas listas para presentar!

Parte : Presentaciones — Benedict Evans

Parte : Nano Banana Pro: Modelo de imagen Gemini 3 Pro de Google DeepMind

Parte : Google Antigraviedad

Parte : GitHub - GibsonAI/Memori: Motor de Memoria de Código Abierto para Modelos de Lenguaje Grande, Agentes de IA y Sistemas Multiagente

Parte : GitHub Projects Community (@GithubProjects) en X

Parte : Estoy empezando a adquirir el hábito de leer todo (blogs, artículos, capítulos de libros, ...) con modelos de lenguaje grandes.

Parte : ¡Me encanta este enfoque! Esto es exactamente lo que estamos construyendo en Weco: - escribes un script de evaluación (tu verificador) - Weco itera sobre el código para optimizarlo en función de esa evaluación Software 1

Parte : Supercarga tus pipelines de OCR con modelos abiertos

Parte : Resolver una tarea de LLM de un millón de pasos sin errores

Parte : Gemini 3: Presentando el último modelo de IA Gemini de Google

Parte : [2511.10395] AgentEvolver: Hacia un Sistema de Agentes Autoevolutivo Eficiente

Parte : GitHub - rbalestr-lab/lejepa

Parte : Casos de Uso | Claude

Parte : Mejorando el diseño frontend a través de habilidades | Claude

Parte : Sim: Plataforma de código abierto para construir y desplegar flujos de trabajo de agentes de IA

Parte : Recuperación de Contexto para Agentes de IA en Aplicaciones y Bases de Datos

Parte : dijeron que deberíamos eliminar los tokenizadores

Parte : Deberías Escribir un Agente · El Blog de la Mosca

Parte : ¡Hola, Kimi K2 Thinking! ¡El Modelo de Agente de Pensamiento de Código Abierto está aquí!

Parte : Enlace al repositorio de Strix en GitHub: (¡no olvides darle una estrella 🌟!)

Parte : Gracias y Bharat por mostrarle al mundo que en realidad se puede...

Parte : Este prompt de código Claude convierte literalmente a Claude Code en ultrathink.

Parte : Wren AI | Blog Oficial

Parte : Tongyi DeepResearch: Una Nueva Era de Investigadores de IA de Código Abierto | Tongyi DeepResearch

Parte : Syllabi – IA agentica de código abierto con herramientas, RAG y despliegue multicanal

Parte : Habilidades Abiertas

Parte : MiniMax-M2

Parte : Plataforma Única de Información del Reglamento de IA | Servicio de Atención del Reglamento de IA

Parte : eurollm.io Traducción: eurollm.io

Parte : Presentando Mistral AI Studio. | Mistral AI

Parte : OpenSnowcat - Plataforma de datos conductuales de grado empresarial.

Parte : Dr. Milan Milanović (@milan_milanovic) en X

Parte : Teoría de Juegos | Cursos Abiertos de Yale

Parte : DeepSeek-OCR Búsqueda profunda-OCR

Parte : Airbyte: La Plataforma Líder de Integración de Datos para Pipelines ETL/ELT

Parte : Investigación Profunda Empresarial

Parte : Me gusta bastante el nuevo artículo de DeepSeek-OCR.

Parte : olmOCR 2: Recompensas de pruebas unitarias para OCR de documentos | Ai2

Parte : Utilizamos DeepSeek OCR para extraer cada conjunto de datos de tablas/gráficos ac...

Parte : Scripts que escribí y que uso todo el tiempo

Parte : DeepSeek OCR - Más que OCR - YouTube

Parte : Cómo obtener clasificación consistente de modelos de lenguaje grandes inconsistentes?

Parte : Producción RAG: lo que aprendí al procesar más de 5 millones de documentos

Parte : Cursos TOTALEMENTE GRATUITOS de Stanford [2024 & 2025] ❯ CS230 - Aprendizaje Profundo...

Parte : Programa de estudios

Parte : Hacer que cualquier aplicación sea buscable para agentes de IA

Parte : PaddleOCR-VL: Mejorando el análisis de documentos multilingües mediante un modelo de visión-lenguaje ultra-compacto de 0.9B

Parte : Delfín: Análisis de Imágenes de Documentos mediante Prompting de Anclas Heterogéneas

Parte : nanochat

Parte : ROMA: Agentes Meta-Recursivos Abiertos

Parte : NeuTTS Air

Parte : Cua: Infraestructura de código abierto para Agentes de Uso de Computadoras

Parte : Plataforma de Análisis y Autenticación MCP

Parte : Mi truco para obtener una clasificación consistente de los LLMs

Parte : Si llegas tarde al tema de la "memoria en agentes de IA" como yo, te recomiendo invertir 43 minutos en ver este video.

Parte : DeepLearning.AI: Comienza o Avanza tu Carrera en IA

Parte : Claude Code mejores prácticas | Codificar con Claude - YouTube

Parte : TildeOpen LLM, financiado por la UE, logra un avance europeo en IA para la innovación multilingüe | Moldeando el futuro digital de Europa

Parte : El obituario RAG: Asesinado por agentes, enterrado por ventanas de contexto

Parte : Anthropic lanza Claude Sonnet 4.5 en su última apuesta por la supremacía de los agentes de IA y la codificación.

Parte : RAG-Cualquier Cosa: Marco Integral de RAG

Parte : Convierte la Base de Código en un Tutorial Fácil con IA

Parte : Volver a fallar en entender lo exponencial

Parte : Paquetes de Prompts | Academia de OpenAI

Parte : Investigador de IA: Innovación Científica Autónoma

Parte : Ingeniería de Contexto para Agentes de IA: Lecciones de la Construcción de Manus

Parte : AgenticSeek: Alternativa Privada y Local a Manus

Parte : Aprende a tu manera

Parte : Qwen-Image-Edit-2509: Soporte para múltiples imágenes, consistencia mejorada.

Parte : Qwen-Imagen

Parte : Presentando Tongyi Deep Research

Parte : 💾🎉 fiestacopia

Parte : Centro de Ingeniería de IA

Parte : Charla profunda

Parte : ibm-granite/granite-docling-258M · Hugging Face

Parte : Google acaba de lanzar una guía de 64 páginas sobre la construcción de agentes de IA.

Parte : opcode - El Elegante Compañero de Escritorio para Claude Code

Parte : NocoDB Cloud

Parte : Una Implementación Paso a Paso de la Arquitectura Qwen 3 MoE desde Cero

Parte : MemoRAG: Avanzando Hacia el Próximo Generación de RAG a Través del Descubrimiento de Conocimiento Inspirado en la Memoria

Parte : Activar la IA para controlar tu navegador 🤖

Parte : Distancia mensual total recorrida por pasajeros en los taxis sin conductor de California - Our World in Data

Parte : Un imprescindible para los programadores de vibra

Parte : Enorme oportunidad de mercado en IA para 2025

Parte : El Índice Económico Antropogénico

Parte : dots.ocr: Análisis de Diseño de Documentos Multilingües en un Solo Modelo de Visión-Lenguaje

Parte : PaddleOCR

Parte : DeepSite v2 - un Espacio de Hugging Face por enzostvs

Parte : Cómo usar subagentes de código Claude para paralelizar el desarrollo

Parte : Muestra HN: CLAVIER-36 – Un entorno de programación para música generativa

Parte : Los pequeños modelos son el futuro de la IA agente.

Parte : Kimi K2: Inteligencia Agente Abierta

Parte : Presentando Qwen3-Max-Preview (Instruct)

Parte : Agente de Artículo Científico con LangGraph

Parte : Tutorial interactivo de ingeniería de prompts de Anthropic

Parte : RAGFlow

Parte : swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 ·

Parte : Crear una fuente con mi letra · Chameth.com

Parte : SurfSense se traduce como "Sentido de Surf" o "Detección de Surf" en español.

Parte : LoRAX: Servidor de inferencia Multi-LoRA que se escala a miles de LLMs ajustados finamente

Parte : PróximoChat

Parte : El Marco de Trabajo de Red Teaming para LLM

Parte : Colette - nos recuerda mucho a Kotaemon

Parte : VibeVoice: Un Modelo de Texto a Voz de Código Abierto de Vanguardia

Parte : [2502.12110] A-MEM: Memoria Agente para Agentes de LLM

Parte : [2504.19413] Construcción de Agentes de IA Listos para Producción con Memoria a Largo Plazo Escalable

Parte : Apertus 70B: Verdaderamente Abierto - LLM Suizo por ETH, EPFL y CSCS

Parte : Capa Humana

Parte : Índice de Página: Índice de Documentos para RAG Basado en Razonamiento

Parte : Despliegue de DeepSeek en 96 GPUs H100

Parte : Claude Code: Un Asistente de Codificación Altamente Agentivo - DeepLearning.AI

Parte : DyG-RAG: Generación Aumentada por Recuperación de Grafos Dinámicos con Razonamiento Centrado en Eventos

Parte : [2508.15126] aiXiv: Un ecosistema de acceso abierto de próxima generación para el descubrimiento científico generado por científicos de IA

Parte : Alexander Kruel - Enlaces para 2025-08-24

Parte : Agentes de IA para Principiantes - Un Curso

Parte : Transformando a Claude Code en mi mejor socio de diseño

Parte : Cómo construir un agente de codificación

Parte : Tiledesk Design Studio

Parte : Construye un Modelo de Lenguaje Grande (Desde Cero)

Parte : Formulador de Datos: Crea Visualizaciones Ricas con IA

Parte : navegador/uso/interfaz de usuario

Parte : Casper Capital - 100 Herramientas de IA que No Puedes Ignorar en 2025...

Parte : Hablando

Parte : Agentes de Modelos de Lenguaje Grande CS294/194-196 | Agentes de Modelos de Lenguaje Grande CS 194/294-196

Parte : Muestra HN: Whispering – Dictado de código abierto, primero local, en el que puedes confiar

Parte : Fallinorg v1.0.0-beta

Parte : dokieli

Parte : papelera

Parte : Anotar automáticamente artículos utilizando LLMs

Parte : Mi IA ya había arreglado el código antes de que yo lo viera.

Parte : Llama-Scan: Convierte PDFs a Texto con LLMs Locales

Parte : Claudia – Compañera de escritorio para el código de Claude

Parte : Muestra HN: Fallinorg - Aplicación de Mac offline que organiza archivos por significado

Parte : Focalboard

Parte : Elysia: Marco de Agencia Impulsado por Árboles de Decisión

Parte : LangExtract se traduce como "Extracción de Lenguaje".

Parte : Uso de MCP

Parte : +1 por "ingeniería de contexto" sobre "ingeniería de indicaciones".

Parte : La carrera por el núcleo cognitivo de LLM

Parte : Trabajando con IA: Medición de las implicaciones ocupacionales de la IA generativa

Parte : Este artículo

Parte : Prava - Enseñando a GPT‑5 a usar una computadora

Parte : InstaVM - Plataforma de Ejecución de Código Seguro

Parte : Litestar merece una mirada

Parte : Trabajos en Kaizen | Y Combinator

Parte : Lanzamiento de HN: Lucidic (YC W25) – Depurar, probar y evaluar agentes de IA en producción

Parte : Presentando el pago por rastreo: Permitiendo a los propietarios de contenido cobrar a los rastreadores de IA por el acceso.

Parte : Patrones de Diseño Agentivos - Documentos de Google

Parte : Rutina: Un Marco de Planificación Estructural para un Sistema de Agentes LLM en la Empresa

Parte : Codificación agentica en el mundo

Parte : Plataforma FutureHouse

Parte : Voxtral | Mistral AI Se traduce como: Voxtral | Mistral IA

Parte : Agente de Investigación con Gemini 2.5 Pro y LlamaIndex | API de Gemini | Google AI para Desarrolladores

Parte : Ley de IA, código de conducta para un enfoque responsable y facilitado para las PYME - Cyber Security 360

Parte : Tecnologías de Sacudida: Aceleración Superexponencial en las Capacidades de IA y sus Implicaciones para la IA General

Parte : MindsDB, una solución de datos de IA - MindsDB

Parte : Backlog.md – Gestor de tareas nativo de Markdown y visualizador Kanban para cualquier repositorio Git

Parte : Opencode: Agente de codificación de IA, construido para la terminal

Parte : La nueva habilidad en IA no es el uso de indicaciones, es la ingeniería de contexto.

Parte : SymbolicAI: Una perspectiva neuro-simbólica sobre los LLMs

Parte : Guía de Prompting 101 para Gemini en Google Workspace

Parte : Juez dictamina que el entrenamiento de IA en obras con derechos de autor es uso justo, la biología agentiva evoluciona y más...

Parte : MCP se está comiendo el mundo—y ha llegado para quedarse

Parte : Cómo Dataherald Hace Fácil la Conversión de Lenguaje Natural a SQL

Parte : Notas de Campo Sobre el Envío de Código Real con Claude

Parte : ¡Genial! ¡Mi charla sobre la escuela de startups de IA ya está disponible!

Parte : ¡Genial! ¡Mi charla sobre la escuela de startups de IA ya está disponible! Capítulos: 0:00 Creo que es justo decir que el software está cambiando bastante fundamentalmente otra vez.

Parte : Automatizó el 73% de su trabajo remoto utilizando herramientas básicas de automatización, le contó todo a su gerente y obtuvo un ascenso.

Parte : Construcción de Agentes de IA Efectivos

Parte : Cómo los equipos de Anthropic utilizan el código Claude

Parte : Esnifando la IA con el código de Claude

Parte : Nanonets-OCR-s – Modelo de OCR que transforma documentos en markdown estructurado

Parte : La ilusión de pensar

Parte : Tendencias – Inteligencia Artificial | BOND

Parte : Claude Code es Mi Computadora | Peter Steinberger

Parte : [2505.24863] AlphaOne: Modelos de Razonamiento Pensando Lento y Rápido en el Momento de la Prueba

Parte : [2505.24864] ProRL: El Aprendizaje por Refuerzo Prolongado Expande los Límites del Razonamiento en Modelos de Lenguaje Grandes

Parte : Mis amigos escépticos de la IA están todos locos · El Blog de The Fly

Parte : Diseño de flujos de trabajo de GenAI óptimos de Pareto con syftr

Parte : BillionMail 📧 Un Servidor de Correo, Boletín Informativo, Solución de Marketing por Correo Electrónico de Código Abierto para Campañas Más Inteligentes

Parte : Pregunta HN: ¿Cuál es el mejor LLM para hardware de consumo?

Parte : [2411.06037] Contexto Suficiente: Una Nueva Perspectiva sobre los Sistemas de Generación Aumentada por Recuperación

Parte : Muestra HN: Onlook – Cursor de código abierto, visual primero para diseñadores

Parte : Kit de Desarrollo de Agentes (ADK)

Parte : Agentes de Estrías

Parte : Muestra HN: AutoThink – Mejora el rendimiento de LLM local con razonamiento adaptativo

Parte : Introducción - Documentación del Proyecto IntelOwl

Parte : Muestra HN: Mi herramienta CLI de LLM puede ejecutar herramientas ahora, desde código de Python o plugins.

Parte : [2505.03335v2] Cero Absoluto: Razonamiento de Autojuego Reforzado con Cero Datos

Parte : El equipo de desarrollo de robots de Codex, la fijación de Grok en Sudáfrica, la jugada de poder de Arabia Saudita en IA, y más...

Parte : Consultar bases de datos con llamadas a funciones

Parte : Cómo Entrenar un LLM con Tus Datos Personales: Guía Completa con LLaMA 3.2

Parte : Fondo de cobertura de IA

Parte : Troy Hunt: ¡Have I Been Pwned 2.0 ya está en vivo!

Parte : Una Vista Previa de Investigación de Codex

Parte : [2505.06120] Los LLM se pierden en conversaciones de múltiples turnos

Parte : El nuevo motor de Ollama para modelos multimodales

Parte : Visión Ahora Disponible en Llama.cpp

Parte : [2505.03335] Cero Absoluto: Razonamiento de Autojuego Reforzado con Cero Datos

Parte : Solicitudes para Startups | Y Combinator

Parte : Token & Uso de Tokens | Documentación de la API de DeepSeek

Parte : Cua es Docker para agentes de IA de uso en computadoras.

Parte : [2504.07139] Informe del Índice de Inteligencia Artificial 2025

Parte : Modelos QAT de Gemma 3: Llevando la IA de vanguardia a las GPUs de consumo

Parte : GitHub - HandsOnLLM/Hands-On-Large-Language-Models: Repositorio oficial de código para el libro de O'Reilly - 'Hands-On Large Language Models'

Parte : GitHub - humanlayer/12-factor-agents: ¿Cuáles son los principios que podemos utilizar para construir software impulsado por LLM que realmente sea lo suficientemente bueno como para poner en producción?

Parte : DeepSeek-R1 incentiva el razonamiento en los modelos de lenguaje mediante el aprendizaje por refuerzo | Nature

Parte : Un modelo de fundación para predecir y capturar la cognición humana | Nature

Parte : Los grandes modelos de lenguaje son competentes en resolver y crear pruebas de inteligencia emocional | Psicología de la Comunicación

Parte : Todo sobre Transformers

Imagen destacada

#### Fuente

Tipo: Repositorio GitHub Enlace original: https://github.com/bytedance/Dolphin?tab=readme-ov-file Fecha de publicación: 2025-09-04

Resumen
#

QUÉ - Dolphin es un modelo de análisis de imágenes documentales multimodal que sigue un paradigma de análisis y luego análisis. Este repositorio contiene el código de demostración y los modelos preentrenados para Dolphin.

POR QUÉ - Es relevante para el negocio de IA porque aborda los desafíos del análisis de imágenes documentales complejas, mejorando la eficiencia y la precisión en el tratamiento de documentos con elementos interconectados como textos, figuras, fórmulas y tablas.

QUIÉNES - Los actores principales son ByteDance, la empresa que desarrolló Dolphin, y la comunidad de investigación de IA que ha contribuido al proyecto.

DÓNDE - Dolphin se posiciona en el mercado de soluciones de análisis de imágenes documentales, integrándose en el ecosistema de IA como una herramienta avanzada para el análisis de documentos.

CUÁNDO - Dolphin es un proyecto relativamente nuevo, con lanzamientos y actualizaciones continuas a partir de 2025. La tendencia temporal indica una rápida evolución y mejora de sus capacidades.

IMPACTO EN EL NEGOCIO:

Oportunidades: Dolphin puede integrarse en el stack existente para mejorar el procesamiento de documentos complejos, ofreciendo soluciones más eficientes y precisas.
Riesgos: La competencia podría desarrollar soluciones similares, reduciendo la ventaja competitiva.
Integración: Dolphin puede integrarse fácilmente con sistemas de gestión de documentos existentes, aprovechando sus capacidades de análisis avanzado.

RESUMEN TÉCNICO:

Pila tecnológica principal: Python, TensorRT-LLM, vLLM, Hugging Face, configuraciones YAML.
Escalabilidad y limitaciones arquitectónicas: Dolphin está diseñado para ser ligero y escalable, soportando el procesamiento de documentos multipágina y la inferencia acelerada.
Diferenciadores técnicos clave: Uso de anchor prompting heterogéneos y análisis paralelo, que mejoran la eficiencia y la precisión del análisis de documentos complejos.

Casos de uso
#

Private AI Stack: Integración en pipelines propietarias
Soluciones para clientes: Implementación para proyectos de clientes
Aceleración del desarrollo: Reducción del tiempo de comercialización de proyectos
Inteligencia estratégica: Entrada para la hoja de ruta tecnológica
Análisis competitivo: Monitoreo del ecosistema de IA

Recursos
#

Enlaces Originales
#

Dolphin: Document Image Parsing via Heterogeneous Anchor Prompting - Enlace original

Artículo recomendado y seleccionado por el equipo Human Technology eXcellence elaborado mediante inteligencia artificial (en este caso con LLM HTX-EU-Mistral3.1Small) el 2025-09-04 19:28 Fuente original: https://github.com/bytedance/Dolphin?tab=readme-ov-file

Artículos Relacionados
#

dots.ocr: Análisis de Diseño de Documentos Multilingües en un Solo Modelo de Visión-Lenguaje - Foundation Model, LLM, Python
PaddleOCR-VL: Mejorando el análisis de documentos multilingües mediante un modelo de visión-lenguaje ultra-compacto de 0.9B - Computer Vision, Foundation Model, LLM
[DeepSeek-OCR

Búsqueda profunda-OCR](posts/2025/10/deepseek-ocr/) - Python, Open Source, Natural Language Processing

Articoli Interessanti - Este artículo es parte de una serie.

Parte : Por que tu empresa necesita IA privada (y no ChatGPT)

Parte : Keycloak

Parte : GitHub - zai-org/GLM-OCR: GLM-OCR: Preciso × Rápido × Completo

Parte : GitHub - EricLBuehler/mistral.rs: Inferencia rápida y flexible de LLM

Parte : GitHub - alexziskind1/llama-throughput-lab: Lanzador interactivo y arnés de referencia para el rendimiento del servidor llama.cpp, con pruebas, barridos y herramientas de carga en ronda.

Parte : GitHub - qwibitai/nanoclaw: Una alternativa ligera a Clawdbot / OpenClaw que se ejecuta en contenedores de Apple para seguridad. Conectar

Parte : GitHub - moltbot/moltbot: Tu propio asistente de IA personal. Cualquier SO. Cualquier plataforma. A la manera del langosta. 🦞

Parte : GitHub - aiming-lab/SimpleMem: SimpleMem: Memoria Eficiente de Por Vida para Agentes LLM

Parte : GitHub - mikekelly/claude-sneakpeek: Obtén una compilación paralela del código de Claude que desbloquea capacidades con bandera de características como el modo enjambre.

Parte : GitHub - virattt/fondo-de-cobertura-ia: Un equipo de fondo de cobertura de IA

Parte : moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face moonshotai/Kimi-K2.5 · Hugging Face

Parte : ¡Bienvenido - Documentación de Poke

Parte : Memoria Condicional a través de Búsqueda Escalable: Un Nuevo Eje de Esparcidad para Modelos de Lenguaje Grandes

Parte : NVIDIA PersonaPlex: IA Conversacional Natural con Cualquier Rol y Voz - NVIDIA ADLR

Parte : GitHub - different-ai/openwork: Una alternativa de código abierto a Claude Cowork, impulsada por OpenCode

Parte : GitHub - google/langextract: Una biblioteca de Python para extraer información estructurada de texto no estructurado utilizando LLMs con precisión.

Parte : GitHub - memodb-io/Acontext: Plataforma de datos para la ingeniería de contexto. Plataforma de datos de contexto que almacena, observa y aprende. Únete

Parte : GitHub - rberg27/doom-coding: Una guía sobre cómo usar tu smartphone para programar en cualquier lugar y en cualquier momento.

Parte : GitHub - bolt-foundry/gambit: Marco de trabajo para agentes para construir, ejecutar y verificar flujos de trabajo de LLM.

Parte : GitHub - eigent-ai/eigent: Eigent: El escritorio de coworking de código abierto para desbloquear tu productividad excepcional.

Parte : Pregunta en HN: ¿Cuál es la mejor manera de proporcionar contexto continuo a los modelos?

Parte : Modelos de Lenguaje Recursivos

Parte : Reimaginando la Memoria de LLM: Utilizar el Contexto como Datos de Entrenamiento Desbloquea Modelos que Aprenden en Tiempo de Prueba

Parte : Muestra HN: Agent-of-empires: Gestor de sesiones de código OpenCode y Claude

Parte : Deberías Escribir un Agente · El Blog de la Mosca

Parte : Empezando - Documentación de SWE-agent

Parte : Cómo construir un agente - Amp

Parte : Audio SAM

Parte : Logramos que Claude afinara un modelo de lenguaje abierto de código fuente.

Parte : Usa Claude Code con Chrome (beta) - Documentación de Claude Code

Parte : GitHub - microsoft/VibeVoice: Inteligencia Artificial de Voz de Frontera de Código Abierto

Parte : GitHub - GVCLab/PersonaLive: ¡PersonaLive! : Animación de Imágenes de Retrato Expresivo para Transmisión en Vivo

Parte : GitHub - NevaMind-AI/memU: Infraestructura de memoria para LLMs y agentes de IA

Parte : GitHub - VibiumDev/vibium: Automatización de navegadores para agentes de IA y humanos

Parte : GitHub - yichuan-w/LEANN: RAG en Todo con LEANN. Disfruta de un ahorro de almacenamiento del 97% mientras ejecutas una aplicación RAG rápida, precisa y 100% privada en tu dispositivo personal.

Parte : GitHub - DGoettlich/history-llms: Centro de información para nuestro proyecto de entrenamiento de los LLMs históricos más grandes posibles.

Parte : LLMRouter - LLMRouter

Parte : Todo como Código: Cómo gestionamos nuestra empresa en un monorepo | Kasava

Parte : GitHub - Buscar código, repositorios, usuarios, problemas, solicitudes de extracción...: 🔥 Una herramienta para analizar la preparación de tu sitio web para la IA, impulsada por Firecrawl.

Parte : Fundamentos de la Construcción de Agentes Autónomos LLM Este documento se basa en un informe técnico de seminario del curso Tendencias en Agentes Autónomos: Avances en Arquitectura y Práctica ofrecido en la TUM.

Parte : Introducción | Caja de Herramientas MCP para Bases de Datos

Parte : GitHub - Tencent-Hunyuan/HunyuanOCR

Parte : Arneses efectivos para agentes de larga duración Anthropic

Parte : GitHub - pixeltable/pixeltable: Pixeltable — Infraestructura de datos que proporciona un enfoque declarativo e incremental para cargas de trabajo de IA multimodal.

Parte : AI Explicado - Artículo de Investigación de Stanford.pdf - Google Drive

Parte : Presentamos Olmo 3, nuestra próxima familia de modelos de lenguaje completamente abiertos y líderes.

Parte : A2UI se traduce como "A2UI".

Parte : Nano Banana Pro está haciendo que millones de diseñadores de interiores sean obsoletos. Subo mi plano de planta y me diseña toda la casa, e incluso genera imágenes reales para cada habitación basadas en las dimensiones.

Parte : Cómo segmentar videos con Segment Anything 3 (SAM3)

Parte : Presentando MagicPath, un lienzo infinito para crear, refinar y explorar con IA.

Parte : Nano Banana Pro es salvaje

Parte : A continuación… Presentaciones de diapositivas. ¡Transforma tus fuentes en una presentación detallada para leer o en un conjunto de diapositivas listas para presentar!

Parte : Presentaciones — Benedict Evans

Parte : Nano Banana Pro: Modelo de imagen Gemini 3 Pro de Google DeepMind

Parte : Google Antigraviedad

Parte : GitHub - GibsonAI/Memori: Motor de Memoria de Código Abierto para Modelos de Lenguaje Grande, Agentes de IA y Sistemas Multiagente

Parte : GitHub Projects Community (@GithubProjects) en X

Parte : Estoy empezando a adquirir el hábito de leer todo (blogs, artículos, capítulos de libros, ...) con modelos de lenguaje grandes.

Parte : ¡Me encanta este enfoque! Esto es exactamente lo que estamos construyendo en Weco: - escribes un script de evaluación (tu verificador) - Weco itera sobre el código para optimizarlo en función de esa evaluación Software 1

Parte : Supercarga tus pipelines de OCR con modelos abiertos

Parte : Resolver una tarea de LLM de un millón de pasos sin errores

Parte : Gemini 3: Presentando el último modelo de IA Gemini de Google

Parte : [2511.10395] AgentEvolver: Hacia un Sistema de Agentes Autoevolutivo Eficiente

Parte : GitHub - rbalestr-lab/lejepa

Parte : Casos de Uso | Claude

Parte : Mejorando el diseño frontend a través de habilidades | Claude

Parte : Sim: Plataforma de código abierto para construir y desplegar flujos de trabajo de agentes de IA

Parte : Recuperación de Contexto para Agentes de IA en Aplicaciones y Bases de Datos

Parte : dijeron que deberíamos eliminar los tokenizadores

Parte : Deberías Escribir un Agente · El Blog de la Mosca

Parte : ¡Hola, Kimi K2 Thinking! ¡El Modelo de Agente de Pensamiento de Código Abierto está aquí!

Parte : Enlace al repositorio de Strix en GitHub: (¡no olvides darle una estrella 🌟!)

Parte : Gracias y Bharat por mostrarle al mundo que en realidad se puede...

Parte : Este prompt de código Claude convierte literalmente a Claude Code en ultrathink.

Parte : Wren AI | Blog Oficial

Parte : Tongyi DeepResearch: Una Nueva Era de Investigadores de IA de Código Abierto | Tongyi DeepResearch

Parte : Syllabi – IA agentica de código abierto con herramientas, RAG y despliegue multicanal

Parte : Habilidades Abiertas

Parte : MiniMax-M2

Parte : Plataforma Única de Información del Reglamento de IA | Servicio de Atención del Reglamento de IA

Parte : eurollm.io Traducción: eurollm.io

Parte : Presentando Mistral AI Studio. | Mistral AI

Parte : OpenSnowcat - Plataforma de datos conductuales de grado empresarial.

Parte : Dr. Milan Milanović (@milan_milanovic) en X

Parte : Teoría de Juegos | Cursos Abiertos de Yale

Parte : DeepSeek-OCR Búsqueda profunda-OCR

Parte : Airbyte: La Plataforma Líder de Integración de Datos para Pipelines ETL/ELT

Parte : Investigación Profunda Empresarial

Parte : Me gusta bastante el nuevo artículo de DeepSeek-OCR.

Parte : olmOCR 2: Recompensas de pruebas unitarias para OCR de documentos | Ai2

Parte : Utilizamos DeepSeek OCR para extraer cada conjunto de datos de tablas/gráficos ac...

Parte : Scripts que escribí y que uso todo el tiempo

Parte : DeepSeek OCR - Más que OCR - YouTube

Parte : Cómo obtener clasificación consistente de modelos de lenguaje grandes inconsistentes?

Parte : Producción RAG: lo que aprendí al procesar más de 5 millones de documentos

Parte : Cursos TOTALEMENTE GRATUITOS de Stanford [2024 & 2025] ❯ CS230 - Aprendizaje Profundo...

Parte : Programa de estudios

Parte : Hacer que cualquier aplicación sea buscable para agentes de IA

Parte : PaddleOCR-VL: Mejorando el análisis de documentos multilingües mediante un modelo de visión-lenguaje ultra-compacto de 0.9B

Parte : Delfín: Análisis de Imágenes de Documentos mediante Prompting de Anclas Heterogéneas

Parte : nanochat

Parte : ROMA: Agentes Meta-Recursivos Abiertos

Parte : NeuTTS Air

Parte : Cua: Infraestructura de código abierto para Agentes de Uso de Computadoras

Parte : Plataforma de Análisis y Autenticación MCP

Parte : Mi truco para obtener una clasificación consistente de los LLMs

Parte : Si llegas tarde al tema de la "memoria en agentes de IA" como yo, te recomiendo invertir 43 minutos en ver este video.

Parte : DeepLearning.AI: Comienza o Avanza tu Carrera en IA

Parte : Claude Code mejores prácticas | Codificar con Claude - YouTube

Parte : TildeOpen LLM, financiado por la UE, logra un avance europeo en IA para la innovación multilingüe | Moldeando el futuro digital de Europa

Parte : El obituario RAG: Asesinado por agentes, enterrado por ventanas de contexto

Parte : Anthropic lanza Claude Sonnet 4.5 en su última apuesta por la supremacía de los agentes de IA y la codificación.

Parte : RAG-Cualquier Cosa: Marco Integral de RAG

Parte : Convierte la Base de Código en un Tutorial Fácil con IA

Parte : Volver a fallar en entender lo exponencial

Parte : Paquetes de Prompts | Academia de OpenAI

Parte : Investigador de IA: Innovación Científica Autónoma

Parte : Ingeniería de Contexto para Agentes de IA: Lecciones de la Construcción de Manus

Parte : AgenticSeek: Alternativa Privada y Local a Manus

Parte : Aprende a tu manera

Parte : Qwen-Image-Edit-2509: Soporte para múltiples imágenes, consistencia mejorada.

Parte : Qwen-Imagen

Parte : Presentando Tongyi Deep Research

Parte : 💾🎉 fiestacopia

Parte : Centro de Ingeniería de IA

Parte : Charla profunda

Parte : ibm-granite/granite-docling-258M · Hugging Face

Parte : Google acaba de lanzar una guía de 64 páginas sobre la construcción de agentes de IA.

Parte : opcode - El Elegante Compañero de Escritorio para Claude Code

Parte : NocoDB Cloud

Parte : Una Implementación Paso a Paso de la Arquitectura Qwen 3 MoE desde Cero

Parte : MemoRAG: Avanzando Hacia el Próximo Generación de RAG a Través del Descubrimiento de Conocimiento Inspirado en la Memoria

Parte : Activar la IA para controlar tu navegador 🤖

Parte : Distancia mensual total recorrida por pasajeros en los taxis sin conductor de California - Our World in Data

Parte : Un imprescindible para los programadores de vibra

Parte : Enorme oportunidad de mercado en IA para 2025

Parte : El Índice Económico Antropogénico

Parte : dots.ocr: Análisis de Diseño de Documentos Multilingües en un Solo Modelo de Visión-Lenguaje

Parte : PaddleOCR

Parte : DeepSite v2 - un Espacio de Hugging Face por enzostvs

Parte : Cómo usar subagentes de código Claude para paralelizar el desarrollo

Parte : Muestra HN: CLAVIER-36 – Un entorno de programación para música generativa

Parte : Los pequeños modelos son el futuro de la IA agente.

Parte : Kimi K2: Inteligencia Agente Abierta

Parte : Presentando Qwen3-Max-Preview (Instruct)

Parte : Agente de Artículo Científico con LangGraph

Parte : Tutorial interactivo de ingeniería de prompts de Anthropic

Parte : RAGFlow

Parte : swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 · Hugging Face swiss-ai/Apertus-70B-2509 ·

Parte : Crear una fuente con mi letra · Chameth.com

Parte : SurfSense se traduce como "Sentido de Surf" o "Detección de Surf" en español.

Parte : LoRAX: Servidor de inferencia Multi-LoRA que se escala a miles de LLMs ajustados finamente

Parte : PróximoChat

Parte : El Marco de Trabajo de Red Teaming para LLM

Parte : Colette - nos recuerda mucho a Kotaemon

Parte : VibeVoice: Un Modelo de Texto a Voz de Código Abierto de Vanguardia

Parte : [2502.12110] A-MEM: Memoria Agente para Agentes de LLM

Parte : [2504.19413] Construcción de Agentes de IA Listos para Producción con Memoria a Largo Plazo Escalable

Parte : Apertus 70B: Verdaderamente Abierto - LLM Suizo por ETH, EPFL y CSCS

Parte : Capa Humana

Parte : Índice de Página: Índice de Documentos para RAG Basado en Razonamiento

Parte : Despliegue de DeepSeek en 96 GPUs H100

Parte : Claude Code: Un Asistente de Codificación Altamente Agentivo - DeepLearning.AI

Parte : DyG-RAG: Generación Aumentada por Recuperación de Grafos Dinámicos con Razonamiento Centrado en Eventos

Parte : [2508.15126] aiXiv: Un ecosistema de acceso abierto de próxima generación para el descubrimiento científico generado por científicos de IA

Parte : Alexander Kruel - Enlaces para 2025-08-24

Parte : Agentes de IA para Principiantes - Un Curso

Parte : Transformando a Claude Code en mi mejor socio de diseño

Parte : Cómo construir un agente de codificación

Parte : Tiledesk Design Studio

Parte : Construye un Modelo de Lenguaje Grande (Desde Cero)

Parte : Formulador de Datos: Crea Visualizaciones Ricas con IA

Parte : navegador/uso/interfaz de usuario

Parte : Casper Capital - 100 Herramientas de IA que No Puedes Ignorar en 2025...

Parte : Hablando

Parte : Agentes de Modelos de Lenguaje Grande CS294/194-196 | Agentes de Modelos de Lenguaje Grande CS 194/294-196

Parte : Muestra HN: Whispering – Dictado de código abierto, primero local, en el que puedes confiar

Parte : Fallinorg v1.0.0-beta

Parte : dokieli

Parte : papelera

Parte : Anotar automáticamente artículos utilizando LLMs

Parte : Mi IA ya había arreglado el código antes de que yo lo viera.

Parte : Llama-Scan: Convierte PDFs a Texto con LLMs Locales

Parte : Claudia – Compañera de escritorio para el código de Claude

Parte : Muestra HN: Fallinorg - Aplicación de Mac offline que organiza archivos por significado

Parte : Focalboard

Parte : Elysia: Marco de Agencia Impulsado por Árboles de Decisión

Parte : LangExtract se traduce como "Extracción de Lenguaje".

Parte : Uso de MCP

Parte : +1 por "ingeniería de contexto" sobre "ingeniería de indicaciones".

Parte : La carrera por el núcleo cognitivo de LLM

Parte : Trabajando con IA: Medición de las implicaciones ocupacionales de la IA generativa

Parte : Este artículo

Parte : Prava - Enseñando a GPT‑5 a usar una computadora

Parte : InstaVM - Plataforma de Ejecución de Código Seguro

Parte : Litestar merece una mirada

Parte : Trabajos en Kaizen | Y Combinator

Parte : Lanzamiento de HN: Lucidic (YC W25) – Depurar, probar y evaluar agentes de IA en producción

Parte : Presentando el pago por rastreo: Permitiendo a los propietarios de contenido cobrar a los rastreadores de IA por el acceso.

Parte : Patrones de Diseño Agentivos - Documentos de Google

Parte : Rutina: Un Marco de Planificación Estructural para un Sistema de Agentes LLM en la Empresa

Parte : Codificación agentica en el mundo

Parte : Plataforma FutureHouse

Parte : Voxtral | Mistral AI Se traduce como: Voxtral | Mistral IA

Parte : Agente de Investigación con Gemini 2.5 Pro y LlamaIndex | API de Gemini | Google AI para Desarrolladores

Parte : Ley de IA, código de conducta para un enfoque responsable y facilitado para las PYME - Cyber Security 360

Parte : Tecnologías de Sacudida: Aceleración Superexponencial en las Capacidades de IA y sus Implicaciones para la IA General

Parte : MindsDB, una solución de datos de IA - MindsDB

Parte : Backlog.md – Gestor de tareas nativo de Markdown y visualizador Kanban para cualquier repositorio Git

Parte : Opencode: Agente de codificación de IA, construido para la terminal

Parte : La nueva habilidad en IA no es el uso de indicaciones, es la ingeniería de contexto.

Parte : SymbolicAI: Una perspectiva neuro-simbólica sobre los LLMs

Parte : Guía de Prompting 101 para Gemini en Google Workspace

Parte : Juez dictamina que el entrenamiento de IA en obras con derechos de autor es uso justo, la biología agentiva evoluciona y más...

Parte : MCP se está comiendo el mundo—y ha llegado para quedarse

Parte : Cómo Dataherald Hace Fácil la Conversión de Lenguaje Natural a SQL

Parte : Notas de Campo Sobre el Envío de Código Real con Claude

Parte : ¡Genial! ¡Mi charla sobre la escuela de startups de IA ya está disponible!

Parte : ¡Genial! ¡Mi charla sobre la escuela de startups de IA ya está disponible! Capítulos: 0:00 Creo que es justo decir que el software está cambiando bastante fundamentalmente otra vez.

Parte : Automatizó el 73% de su trabajo remoto utilizando herramientas básicas de automatización, le contó todo a su gerente y obtuvo un ascenso.

Parte : Construcción de Agentes de IA Efectivos

Parte : Cómo los equipos de Anthropic utilizan el código Claude

Parte : Esnifando la IA con el código de Claude

Parte : Nanonets-OCR-s – Modelo de OCR que transforma documentos en markdown estructurado

Parte : La ilusión de pensar

Parte : Tendencias – Inteligencia Artificial | BOND

Parte : Claude Code es Mi Computadora | Peter Steinberger

Parte : [2505.24863] AlphaOne: Modelos de Razonamiento Pensando Lento y Rápido en el Momento de la Prueba

Parte : [2505.24864] ProRL: El Aprendizaje por Refuerzo Prolongado Expande los Límites del Razonamiento en Modelos de Lenguaje Grandes

Parte : Mis amigos escépticos de la IA están todos locos · El Blog de The Fly

Parte : Diseño de flujos de trabajo de GenAI óptimos de Pareto con syftr

Parte : BillionMail 📧 Un Servidor de Correo, Boletín Informativo, Solución de Marketing por Correo Electrónico de Código Abierto para Campañas Más Inteligentes

Parte : Pregunta HN: ¿Cuál es el mejor LLM para hardware de consumo?

Parte : [2411.06037] Contexto Suficiente: Una Nueva Perspectiva sobre los Sistemas de Generación Aumentada por Recuperación

Parte : Muestra HN: Onlook – Cursor de código abierto, visual primero para diseñadores

Parte : Kit de Desarrollo de Agentes (ADK)

Parte : Agentes de Estrías

Parte : Muestra HN: AutoThink – Mejora el rendimiento de LLM local con razonamiento adaptativo

Parte : Introducción - Documentación del Proyecto IntelOwl

Parte : Muestra HN: Mi herramienta CLI de LLM puede ejecutar herramientas ahora, desde código de Python o plugins.

Parte : [2505.03335v2] Cero Absoluto: Razonamiento de Autojuego Reforzado con Cero Datos

Parte : El equipo de desarrollo de robots de Codex, la fijación de Grok en Sudáfrica, la jugada de poder de Arabia Saudita en IA, y más...

Parte : Consultar bases de datos con llamadas a funciones

Parte : Cómo Entrenar un LLM con Tus Datos Personales: Guía Completa con LLaMA 3.2

Parte : Fondo de cobertura de IA

Parte : Troy Hunt: ¡Have I Been Pwned 2.0 ya está en vivo!

Parte : Una Vista Previa de Investigación de Codex

Parte : [2505.06120] Los LLM se pierden en conversaciones de múltiples turnos

Parte : El nuevo motor de Ollama para modelos multimodales

Parte : Visión Ahora Disponible en Llama.cpp

Parte : [2505.03335] Cero Absoluto: Razonamiento de Autojuego Reforzado con Cero Datos

Parte : Solicitudes para Startups | Y Combinator

Parte : Token & Uso de Tokens | Documentación de la API de DeepSeek

Parte : Cua es Docker para agentes de IA de uso en computadoras.

Parte : [2504.07139] Informe del Índice de Inteligencia Artificial 2025

Parte : Modelos QAT de Gemma 3: Llevando la IA de vanguardia a las GPUs de consumo

Parte : GitHub - HandsOnLLM/Hands-On-Large-Language-Models: Repositorio oficial de código para el libro de O'Reilly - 'Hands-On Large Language Models'

Parte : GitHub - humanlayer/12-factor-agents: ¿Cuáles son los principios que podemos utilizar para construir software impulsado por LLM que realmente sea lo suficientemente bueno como para poner en producción?

Parte : DeepSeek-R1 incentiva el razonamiento en los modelos de lenguaje mediante el aprendizaje por refuerzo | Nature

Parte : Un modelo de fundación para predecir y capturar la cognición humana | Nature

Parte : Los grandes modelos de lenguaje son competentes en resolver y crear pruebas de inteligencia emocional | Psicología de la Comunicación

Parte : Todo sobre Transformers