El documento describe el desarrollo de Kinect por parte de Microsoft Research y Xbox. Explica que Kinect utiliza una cámara RGB, un sensor de profundidad y micrófonos para reconocer gestos, movimientos y voz. También describe cómo Kinect fue entrenado con millones de imágenes y datos para reconocer el esqueleto humano en tiempo real a través de aprendizaje automático y visión por computadora.