Menurut sebuah tweet yang dibagikan oleh Musk, mode suara Grok sekarang mendukung akses kamera untuk identifikasi konten. Ini memungkinkan pengguna untuk mengarahkan ponsel mereka ke sesuatu dan bertanya, "Apa yang saya lihat?". Fitur visual di iOS memungkinkan chatbot untuk menganalisis objek, teks, dan lingkungan di dunia nyata menggunakan kamera perangkat secara real-time. Pengguna dapat memindai apa saja, termasuk produk, tanda, dokumen, dll., dan Grok akan segera memberikan informasi kontekstual dan wawasan yang relevan.