Los orígenes del reconocimiento de voz: lo que no sabías
Publicado de GG_ Una pizca de saber (IT) en SmartHome · Viernes 04 Ago 2023
Los orígenes del reconocimiento de voz: lo que no sabías
Es interesante saber un poco de los inicios del reconocimiento de voz, porque nos muestra cómo ha evolucionado esta tecnología a lo largo de la historia y cómo ha influido en el desarrollo de otras áreas, como la inteligencia artificial, el procesamiento del lenguaje natural y la interacción humano-computadora. También nos permite apreciar los desafíos y las oportunidades que presenta el reconocimiento de voz para el futuro, tanto en el ámbito personal como profesional. El reconocimiento de voz es una tecnología que nos acerca más a las máquinas y que nos abre las puertas a un mundo de posibilidades.
El reconocimiento de voz es la tecnología que permite a las máquinas comprender y transcribir lo que decimos. Es una forma de comunicación natural e intuitiva entre los humanos y las computadoras, que tiene muchas aplicaciones y beneficios.
El reconocimiento de voz tiene su origen en el año 1870, cuando Alexander Graham Bell quiso crear un dispositivo que pudiera dar la palabra visible a las personas sordas. Aunque no lo consiguió, su investigación fue el punto de partida para el desarrollo del teléfono.
El primer sistema de reconocimiento de voz se creó en 1952 por los laboratorios Bell. Se llamaba Audrey y podía reconocer el sonido de un número hablado (del cero al nueve) con más del 90% de precisión, pero solo cuando lo hablaba su creador. Era mucho menos preciso con otras voces.
En 1960, se hicieron sistemas que podían reconocer más palabras, como la Shoebox de IBM, que entendía 16 palabras en inglés, o el algoritmo soviético que podía reconocer 200 palabras. Estos sistemas se basaban en comparar las palabras con patrones de voz guardados.
Durante el año de 1970, se hizo Harpy, un sistema financiado por el Departamento de Defensa de los Estados Unidos, que tenía un vocabulario de más de 1000 palabras y podía reconocer no solo palabras, sino frases completas.
En la década de 1980, IBM hizo Tangora, una máquina de escribir activada por voz que tenía un vocabulario de 20.000 palabras y usaba estadísticas para predecir e identificar palabras.
En 1990, Dragon Systems lanzó el primer producto de reconocimiento de voz para el consumidor, llamado Dragon Dictate. En 1997, se lanzó una actualización llamada Dragon NaturallySpeaking, que era el primer producto de reconocimiento de voz continua y podía reconocer el habla a un ritmo de 100 palabras por minuto, llegó a reconocer hasta 160 palabras minuto.
También en 1997 Via Voice fue lanzado por primera vez, como un producto de reconocimiento de voz continua, que permitía a los usuarios dictar texto a una computadora usando un micrófono.
A partir del año 2000, la tecnología de reconocimiento de voz ha avanzado mucho gracias a la inteligencia artificial, el aprendizaje automático y el procesamiento del lenguaje natural. Google, Apple, Amazon y Microsoft son algunos de los líderes en este campo, con productos como Google Assistant, Siri, Alexa y Cortana.
¿Habías escuchado algo sobre estos comienzos del reconocimiento de voz? ¿Qué impresión te causa el avance de esta tecnología?
Todavía no hay reseñas.