Gostaria de saber se é possível converter som em texto, a partir, por exemplo, de um vídeo do YouTube, e assim gerar um texto. (Felipe Fernandes)
Sim, é possível. Esta é uma tecnologia que utiliza arquitetura de software de inteligência artificial. Hoje, por exemplo, quando você liga para uma operadora de telefonia, um sistema filtra sua ligação a partir do reconhecimento de sua voz. Quando você fala, sistemas especialistas de análise de fonemas, acústica e estatística analisam e convertem o "wave form", ou seja, o som de sua voz, em textos que terão de fazer sentido para o software. A eficiência disso, é claro, nem sempre acontece na prática - é quando a gente escuta a típica frase "Desculpa, não entendi", dita pela atendente virtual. Hoje, a indústria de tecnologia já dispõe de soluções que tornam sensíveis aos comandos da voz humana aparelhos como os telefones celulares. Já há vários modelos desses aparelhos no mercado que aceitam comandos de voz para fazer ligações e acessar a outros recursos disponíveis no dispositivo. A tendência é termos outros aparelhos, desde um forno micro-ondas até um automóvel, atendendo às vozes de seus proprietários.