La Inteligencia Artificial Ahora Puede ‘Ver’: Descubre Cómo Grok AI Transforma la Visión Computarizada

Grok Vision ya está disponible en Modo Voz.


Actualmente, la inteligencia artificial generativa está experimentando múltiples tendencias. Por un lado, están los modelos de razonamiento como o3 de OpenAI, que «piensan» cada paso de un problema antes de responder. Además, existen características de «investigación profunda» que pueden recopilar información de toda la web para elaborar informes.

Sin embargo, quizás la tendencia más «futurista» sea el Modo Voz. Este es el futuro que la película de 2013 Her nos prometió: un chatbot con el que puedes hablar como si fuera una persona más. El chatbot no dice nada diferente a lo que diría si estuvieras chateando por texto; sin embargo, responde con una voz «realista» y «natural», lo que podría crear la ilusión de que estás hablando con una persona, no con un robot.

Personalmente, nunca he encontrado esta característica particularmente atractiva, incluso en grandes nombres como ChatGPT. La tecnología es impresionante, claro, pero aún es demasiado evidente para mi oído que estoy hablando con un bot. Las compañías de IA no han podido eliminar estas peculiaridades identificativas, pero eso no ha impedido que las personas formen «relaciones» con chatbots, llegando incluso a enamorarse de ellos.

Lo que me parece más impresionante es el componente de «visión» de la característica. Algunos chatbots no solo pueden responder, sino que también pueden acceder a tu cámara para ver lo que tú ves e incorporar esa información en sus respuestas. Tanto ChatGPT como Gemini ofrecen estas características, y ahora, también Grok.

Grok puede ver

En su Modo Voz, Grok es el último chatbot en adquirir esta habilidad. El desarrollador de xAI, Ebby Amir, anunció la función, denominada «Grok Vision», el martes en X, señalando que Grok Vision admite audio multilingüe y búsqueda en tiempo real. Sin embargo, estas últimas características son exclusivas para los suscriptores de SuperGrok.

La función ya está activa por mi parte. Puedes acceder a ella tocando la opción de Modo Voz existente. Si aún no has usado esta función, necesitarás otorgar permiso a Grok para acceder al micrófono de tu dispositivo. Después de esto, podrás comenzar a chatear de inmediato.

Lea también  Descubre el Mejor Freidora de Aire con un 40% de Descuento: Solo en la Gran Venta de Primavera de Amazon




¿Qué piensas hasta ahora?

Sin embargo, para acceder a Vision, necesitarás tocar el icono de la cámara en la esquina inferior izquierda. Aquí, permite que Grok acceda a tu cámara. Una vez que la transmisión esté activa, puedes comenzar a preguntarle a Grok sobre lo que ve.

No estoy muy entusiasmado con enviar mi transmisión de video en vivo directamente a xAI, así que dejé mi teléfono sobre la mesa, por lo que la transmisión de video estaba toda negra. Grok, haciendo honor a su crédito, intentó sinceramente ayudarme a resolver el problema, sugiriendo que podría haber algo mal con la cámara o que mi entorno estaba demasiado oscuro. Cuando le informé que en realidad había llevado mi teléfono al espacio exterior conmigo, «rió» y concluyó que ese tenía que ser el problema: «¿Ah, el espacio exterior, eh? Esa transmisión negra ahora tiene sentido, no hay luz allá afuera y la cámara probablemente no está diseñada para ese ambiente. Podrías necesitar un dispositivo de grado espacial para obtener una transmisión adecuada».

Este es el segundo gran lanzamiento de funciones para Grok este mes. La semana pasada, xAI implementó una función de memoria para el bot, que le permite acceder a conversaciones pasadas para respuestas más relevantes.

Artículos similares

Lea también  Brecha de datos de salud supera estimaciones: millones afectados

Califica este artículo

Deja un comentario

Share to...