Intranet Transafety 馃彔 Inicio Gu铆a Comercial Dev Playbook Onboarding Metodolog铆a IA

Manual de Metodolog铆a de Desarrollo H铆brido: Humanos y Agentes IA (2026)

Esta gu铆a establece el est谩ndar operativo para los desarrolladores de la startup. Su objetivo central es maximizar la eficiencia y seguridad en la escritura de c贸digo, integrando herramientas de Inteligencia Artificial sin perder el control sobre la arquitectura del producto.


1. Gesti贸n Cognitiva: Thinking Levels y Orquestaci贸n

Para maximizar la productividad sin disparar los costos ni los tiempos de respuesta de la API, debemos entender c贸mo administrar el esfuerzo cognitivo de los modelos.

Thinking Levels (Budget Thinking)

Los modelos avanzados (como Claude Opus 4.8 o GPT-5.5) permiten configurar su "Esfuerzo de Razonamiento" (Low, Medium, High). * Default (Low Thinking): Para el 80% de las tareas diarias (ej. escribir un test unitario, hacer un refactor mec谩nico, leer un log de error), debes usar el modo de bajo esfuerzo. Es r谩pido, econ贸mico y suficiente. * High Thinking (Incremento de Budget): Cuando te enfrentes a un problema arquitect贸nico duro, un bug sutil de concurrencia que no logras encontrar, o al planificar la implementaci贸n de una nueva feature desde cero, vale totalmente la pena aumentar el budget. El modelo gastar谩 m谩s tiempo y tokens "pensando" (Chain of Thought interno) antes de emitir la primera l铆nea de c贸digo, garantizando un dise帽o mucho m谩s robusto.

Buena Pr谩ctica por Testear: Orquestaci贸n Asim茅trica

No necesitas que el modelo m谩s caro y lento del mundo escriba cada l铆nea de c贸digo. Una estrategia emergente a probar es la Orquestaci贸n Asim茅trica: 1. El Arquitecto (GPT-5.5 High / Opus 4.8 High): Se usa exclusivamente para analizar el problema, trazar el plan en un archivo implementation_plan.md y dividir el trabajo en tareas peque帽as (DAG). 2. Los Agentes Ejecutores (Modelos m谩s baratos/r谩pidos): El arquitecto delega las tareas aisladas a agentes que corren en paralelo usando modelos m谩s econ贸micos (ej. Claude Sonnet, GPT-5.5 Low, Gemini Flash). Estos agentes escriben el c贸digo de bajo nivel y ejecutan los tests. 3. Optimizaci贸n de Suscripciones: Esto permite aprovechar distintas cuotas y l铆mites (rate limits) de tus suscripciones sin bloquearte, reservando la "inteligencia cara" solo para las tareas que realmente necesitan modelos m谩s caros.


2. El Problema del "Context Rot" (Pudrici贸n del Contexto)

驴Qu茅 es el Context Rot?

Los Modelos de Lenguaje Grandes (LLMs) modernos tienen ventanas de contexto enormes. Sin embargo, el "Context Rot" ocurre cuando inyectamos un exceso de informaci贸n (todo el repositorio, decenas de reglas globales, miles de l铆neas de logs) en un solo chat. El mecanismo de "atenci贸n" del modelo se diluye, provocando amnesia de reglas de seguridad, alucinaciones aumentadas y p茅rdida de eficiencia.

Estrategias Profundas para Evitarlo

  1. Micro-Sesiones (Rotaci贸n de Chats): Debes iniciar un chat nuevo para tareas no relacionadas, feature o bugfix espec铆fico. No mantener un chat "infinito".
  2. Carga Bajo Demanda: Nunca pegues archivos enteros "por si acaso". Si el agente necesita leer un archivo, que use sus herramientas.
  3. Uso del patr贸n handoff: Al cambiar de chat, el agente actual genera un archivo resumen_traspaso.md con lo que logr贸 y lo que falta. Es importante revisar y corregir errores de conceptos u objetivos. El nuevo agente lee ese archivo y retoma exactamente donde qued贸, reiniciando la memoria de la ventana de contexto a cero, pero conservando la direcci贸n. Esto es parecido a lo que hacen los agentes cuando se les acaba la ventana de contexto y automaticamente compactan el contexto(crean un resumen) pero creando un archivo modificable podemos ver y corregir errores de los modelos.

3. Herramientas de Estandarizaci贸n: Reglas, Linters, RuleSync y Skillshare

Para gobernar un equipo donde coexisten humanos y m煤ltiples agentes de IA (Cursor, Antigravity, Claude Code), necesitamos centralizar el conocimiento.

Reglas Globales y RuleSync

Las "Skills" y Skillshare

Profundizaci贸n: Onboarding Interactivo con teach

En el desarrollo de software tradicional, cuando un Dev ingresa al equipo, un desarrollador con experiencia debe detener su trabajo productivo durante horas para explicarle c贸mo est谩 estructurada la base de datos o el sistema de autenticaci贸n. Al invocar la skill teach, el agente IA asume el rol de ese Senior, pero bajo un m茅todo socr谩tico. El flujo funciona as铆: 1. El nuevo desarrollador ejecuta la skill en un archivo complejo, por ejemplo: /teach auth.ts. 2. En lugar de devolver un resumen aburrido, el agente le pide al desarrollador que lea un bloque de c贸digo y le hace una pregunta: "Veo que usamos tokens opacos almacenados en Redis en lugar de JWTs convencionales. Mirando el c贸digo, 驴puedes deducir por qu茅 tomamos esta decisi贸n de seguridad?". 3. El desarrollador responde. El agente valida, corrige o profundiza usando como contexto los PRs hist贸ricos y los ADRs (Architecure Decision Records). Esto permite un onboarding as铆ncrono, profundo y sin interrumpir a los ingenieros clave.

Profundizaci贸n: Validaci贸n Arquitect贸nica con grill-with-docs

Esta es una skill de fricci贸n intencional. Antes de que cualquier desarrollador escriba una sola l铆nea de c贸digo para un feature grande, debe enfrentarse a esta habilidad, donde el agente asume el rol de un Staff Engineer hostil y minucioso. 1. El desarrollador presenta un borrador inicial: "Voy a agregar RabbitMQ para encolar la validaci贸n de archivos de los clientes". 2. El agente lee la documentaci贸n del repositorio (docs/architecture/) e inmediatamente bombardea al desarrollador buscando vulnerabilidades l贸gicas y casos borde: "驴Qu茅 pasa si el worker de RabbitMQ falla en medio del archivo? 驴C贸mo vas a asegurar la idempotencia? Seg煤n el ADR-004, nuestro stack est谩ndar de colas es AWS SQS, 驴por qu茅 quieres introducir una nueva dependencia como RabbitMQ?". 3. El desarrollador debe defender su dise帽o o ajustarlo a las reglas del proyecto. 4. Solo cuando el agente est谩 "satisfecho" de que no hay cabos sueltos ni deudas t茅cnicas injustificadas, procede a redactar el implementation_plan.md final y actualiza el ADR oficial con la nueva decisi贸n.


4. Entendimiento Sem谩ntico con Graphify - Herramienta por validar, reduce costo de cuota de planes/tokens y aumenta calidad del output de modelos.

Para evitar el Context Rot de inyectar archivos ciegamente en el chat, usamos Graphify como servidor MCP de extracci贸n de contexto.

Funcionalidad

Graphify lee el c贸digo fuente utilizando Tree-sitter (an谩lisis est谩tico abstracto). Extrae la declaraci贸n de clases, funciones (Nodos) y c贸mo se llaman entre s铆 (Aristas), delegando a un modelo peque帽o la generaci贸n de un resumen para cada bloque. Con esto, construye un Knowledge Graph (Grafo de Conocimiento) interactivo almacenado en NetworkX.

Beneficios para los Desarrolladores y Agentes

  1. Ahorro Masivo de Tokens: Cuando un agente necesita entender un proyecto gigante, en vez de tragarse 50 archivos fuente enteros, le hace una consulta a Graphify: "驴Qu茅 m贸dulos dependen de auth.ts?". Graphify le devuelve exactamente los nombres y firmas de las dependencias.
  2. Detecci贸n de God Nodes: Revela arquitecturas acopladas al mostrar visualmente qu茅 archivos concentran demasiada l贸gica, facilitando refactors quir煤rgicos.
  3. Reducci贸n Cr铆tica de Alucinaciones: Ning煤n sistema es infalible, pero Graphify permite que el agente escriba c贸digo nuevo bas谩ndose en un mapa arquitect贸nico real y preciso de dependencias, reduciendo dr谩sticamente las alucinaciones por contexto perdido.

5. TDD Riguroso y Calibraci贸n de Confianza (DoD)

TDD como "Cerca El茅ctrica"

El TDD es un m茅todo donde escribes la prueba automatizada antes de escribir el c贸digo real. Los agentes sufren de no saber "cu谩ndo detenerse", arreglando cosas que no estaban rotas. 1. Escribes el test estricto. 2. El agente usa la skill verifying-completion para ejecutar las pruebas, leer el error y reescribir en bucle hasta que pase (Verde).

Definition of Done (DoD) y Calibraci贸n

Los agentes tienden a hablar con extrema seguridad afirmando haber resuelto el problema, incluso si no compila. Por lo tanto, el TDD unitario no es suficiente. El DoD para un agente debe incluir obligatoriamente: * Typecheck Exitoso: Ejecutar tsc, mypy, etc., sin errores. * Calibraci贸n Expl铆cita: El agente debe listar en su respuesta qu茅 valid贸 emp铆ricamente (ej. "Ejecut茅 el test y pas贸") vs. qu茅 est谩 asumiendo (ej. "Asumo que el puerto 8080 est谩 libre en el entorno staging"). Las suposiciones ciegas son inaceptables en producci贸n.


6. Deuda de Plataforma y Reproducibilidad del Entorno

Los agentes de IA interact煤an con el c贸digo a trav茅s de la terminal. Si el agente no puede levantar el proyecto ejecutando comandos documentados y est谩ndar, el problema no es del agente, es de deuda t茅cnica de plataforma.


7. Prevenci贸n de Conflictos F铆sicos: Git Worktrees

Si un humano y un agente clonan y trabajan en la rama main de una misma carpeta al mismo tiempo, los checkouts de rama o instalaci贸n de dependencias se romper谩n mutuamente. * La Soluci贸n: Git Worktrees. En lugar de clonar el repo dos veces (lo cual desincroniza el historial), git worktree crea una segunda carpeta "f铆sica" atada a la misma base de datos oculta .git. El agente puede aislar su entorno e instalar dependencias sin que el c贸digo del humano sufra alteraciones en su editor local.


8. Revisi贸n Asistida en CI/CD: CodeRabbit y Riesgo Humano

Dado que la IA puede generar Pull Requests (PRs) de 500 l铆neas en un segundo, los humanos no pueden revisar todo manualmente en el pipeline de Integraci贸n Continua (CI/CD).

CodeRabbit como Filtro Auxiliar

CodeRabbit es un Agente de Revisi贸n de C贸digo impulsado por IA. Lee los PRs autom谩ticamente y ejecuta: * Comentarios L铆nea por L铆nea: Sugerencias contextuales sobre seguridad o rendimiento en los diffs. * Res煤menes Ejecutivos: Explicaci贸n en lenguaje natural de la intenci贸n del PR.

Pol铆tica de Revisi贸n Basada en Riesgo

CodeRabbit es NO una Autoridad. Para evitar cuellos de botella sin sacrificar seguridad, establecemos una matriz de riesgo: * Bajo Riesgo (Auto-Aprobaci贸n as铆ncrona permitida): Cambios en CSS, refactors mec谩nicos de variables, actualizaciones de dependencias menores, documentaci贸n. * Alto Riesgo (Revisi贸n Humana Obligatoria): Modificaciones a la l贸gica de autenticaci贸n (auth), acceso a bases de datos, permisos, pagos, o arquitecturas clave. En estos casos, la aprobaci贸n de un desarrollador senior es legalmente requerida sin importar el visto bueno de la IA.