La instalación de CMUSphinx puede hacerse sin problemas. La conversión de wav a texto ya depende de cómo sean las grabaciones a interpretar. Debe tenerse en cuenta que la tecnología de voz es todavía bastante primitiva actualmente (en todos los productos existentes, incluso en los mejores como CMUSphinx), y que se necesitan muchas "ayudas" para obtener buenos resultados. Ayudas son principalmente que la dicción y grabación sean muy claras, y que se disponga de un arsenal de textos pronunciados por el mismo locutor, con los que se pueda elaborar una suerte de diccionario que permite luego al programa afinar mucho mejor sus interpretaciones. En cualquier caso, la operación es laboriosa y requiere un cierto tiempo.