El sistema obtiene la posición y los gestos del usuario desde unas cámaras situadas en la grúa y procesa la voz con un micrófono de laringe apto para funcionar el entornos de mucho ruido como puede ser una fábrica.

Como medida de seguridad, la grúa no ejecuta ningún movimiento hasta que la misma orden no le ha llegado por los dos sistemas (gestos y voz) y además cuenta con un sistema de descripción de la planta en la que actúa para no ejecutar órdenes que puedan suponer choques o accidentes con el edificio y sus equipamientos.