Anthropic Lanza Claude 3.5 Sonnet: La IA Puede Controlar Computadoras

Presentando Claude 3.5 Sonnet AI: Revolucionando la Interacción con Computadoras

Anthropic ha lanzado recientemente su modelo Claude 3.5 Sonnet AI, que presenta una adición innovadora: la capacidad de controlar una computadora simplemente observando la pantalla. Esta capacidad, denominada uso de computadora, está actualmente en beta pública y está disponible a través de API, lo que permite a los desarrolladores dirigir a Claude para realizar tareas en una computadora como lo haría un humano.

Comparación con Otras Herramientas de AI

Esta nueva función coloca a Claude 3.5 en un campo de juego similar con herramientas de IA de competidores importantes como Microsoft y OpenAI. Copilot Vision de Microsoft y la aplicación de escritorio ChatGPT de OpenAI utilizan la capacidad de interpretar información de la pantalla. Además, la aplicación Gemini de Google en teléfonos Android presenta capacidades análogas, pero ninguna de ellas ha lanzado aún herramientas totalmente funcionales que puedan realizar acciones de clic de manera autónoma e interactuar profundamente con los sistemas.

Fase Experimental y Limitaciones

Aunque la función de uso de computadora es innovadora, Anthropic ha advertido a los usuarios que todavía es experimental. La compañía describe las capacidades actuales como "engorrosas y propensas a errores," instando a los desarrolladores a proporcionar comentarios para mejorar su funcionalidad. Algunas limitaciones notables incluyen:

Claude aún no puede realizar acciones complejas como arrastrar o acercar.
El enfoque de "libro desplegable" que utiliza Claude—tomando capturas de pantalla en lugar de video continuo—significa que puede perder eventos rápidos o notificaciones.
Hay medidas proactivas en marcha para limitar la interacción de Claude con las redes sociales y ciertas actividades sensibles como elecciones.

Mejoras de Rendimiento en Codificación y Uso de Herramientas

El modelo Claude 3.5 Sonnet también muestra avances significativos en varios indicadores de rendimiento. Específicamente:

Codificación Agencial: El rendimiento en la métrica verificada SWE-bench mejoró significativamente del 33.4% al 49.0%, superando todos los modelos de codificación disponibles públicamente.
Tareas de Uso de Herramientas: En el TAU-bench, las puntuaciones de Claude aumentaron del 62.6% al 69.2% en aplicaciones minoristas y del 36.0% al 46.0% en el más complicado dominio de las aerolíneas.

Precios Competitivos y Estrategia de Precios

A pesar de estas mejoras, Anthropic ha mantenido la misma estructura de precios y velocidad para el modelo Claude 3.5 Sonnet que su predecesor, asegurando accesibilidad para los clientes actuales y potenciales.

Perspectiva Futura

Con los desarrolladores invitados a probar la función de uso de computadora, las perspectivas de mejora rápida y aumentos en la eficiencia son prometedoras. A medida que se acumulen los comentarios, es probable que futuras iteraciones mejoren la capacidad de Claude para comprender y ejecutar una gama más amplia de tareas de manera efectiva.

Conclusión

El modelo Claude 3.5 Sonnet AI de Anthropic representa un avance fundamental en la tecnología de IA, particularmente en su potencial para mejorar la productividad y la interacción del usuario con las computadoras. Aunque aún se encuentra en sus primeras etapas, los comentarios de desarrolladores y partes interesadas serán cruciales para optimizar sus capacidades en el futuro.

Para más actualizaciones sobre tendencias en tecnología de IA, siga nuestra serie de artículos donde exploramos varias herramientas de IA y su impacto en la computación moderna.