Los principios básicos de los motores de traducción automática.
Todos los días usamos diferentes tecnologías sin siquiera saber exactamente cómo funcionan. De hecho, no es muy fácil entender los motores impulsados por el aprendizaje automático. El equipo de Statsbot quiere dejar claro el aprendizaje automático contando historias de datos en este blog. Hoy, hemos decidido explorar los traductores automáticos y explicar cómo funciona el algoritmo de Google Translate.
Hace años, se necesitaba mucho tiempo para traducir el texto de un idioma desconocido. El uso de vocabularios simples con la traducción palabra por palabra fue difícil por dos razones: 1) el lector tenía que conocer las reglas gramaticales y 2) era necesario tener en cuenta todas las versiones de idiomas al traducir la oración completa.
Ahora, no tenemos que luchar tanto, podemos traducir frases, oraciones e incluso textos grandes simplemente colocándolos en Google Translate. Pero a la mayoría de las personas no les importa cómo funciona el motor de la traducción de aprendizaje automático. Este post es para los que sí les importa.
Aprendizaje profundo problemas de traducción
Si el motor del traductor de Google intentara mantener las traducciones incluso para oraciones cortas, no funcionaría debido a la gran cantidad de variaciones posibles. La mejor idea puede ser enseñar a la computadora conjuntos de reglas gramaticales y traducir las oraciones de acuerdo con ellas. Si solo fuera tan fácil como parece.
Si alguna vez ha intentado aprender un idioma extranjero, sabe que siempre hay muchas excepciones a las reglas. Cuando intentamos capturar todas estas reglas, excepciones y excepciones a las excepciones en el programa, la calidad de la traducción se rompe.
Los sistemas modernos de traducción automática utilizan un enfoque diferente: asignan las reglas del texto mediante el análisis de un gran conjunto de documentos.