En Resumen
- La empresa Vivoka fusionó la Web3 e inteligencia artificial en "Ta-Da", una plataforma beta privada para recopilar datos globales.
- La versión beta pública de "Ta-Da" estará disponible en el próximo trimestre, recompensando a los usuarios con tokens TADA.
- Ta-Da se centra en la recopilación de datos de voz en múltiples idiomas y aborda los desafíos de costos y calidad en comparación con otras empresas de IA.
Al fusionar Web3 e inteligencia artificial, Vivoka está introduciendo una nueva forma de recopilar datos para entrenar a nuestros señores robots.
Bajo el liderazgo de William Simonin y la destreza en reconocimiento de voz de Vivoka, la empresa acaba de lanzar la versión beta privada de su nuevo proyecto "Ta-Da", un juego de palabras con la palabra datos.
Se espera que la versión beta pública esté disponible el próximo trimestre.
"A través de 'Ta-da', visualizamos una plataforma donde diversas empresas de IA, que van más allá del reconocimiento de voz, puedan solicitar datos, garantizando la asequibilidad sin comprometer la calidad", dijo Simonin a Decrypt.
Aprovechando la tecnología blockchain, Ta-Da tiene como objetivo fomentar que los usuarios de todo el mundo compartan los datos que crearán al realizar diversas tareas, como leer una frase, escribir un texto o reconocer un objeto.
Los datos recopilados, que podrían incluir grabaciones de voz, imágenes, videos y textos, estarán disponibles para las empresas con el fin de entrenar modelos de IA.
Los usuarios son recompensados con tokens TADA por sus contribuciones.
Desarrollada en la blockchain de MultiversX, la plataforma tiene como objetivo abordar los desafíos clave que enfrentan las empresas que utilizan datos para entrenar modelos de IA, específicamente los altos costos y la calidad inconsistente de los datos.
"Percebimos a los proveedores de blockchain como aliados técnicos fundamentales", dijo Simonin a Decrypt. "Colaborar con MultiversX se siente más íntimo y prioritario que ser uno entre innumerables proyectos en otras plataformas".
El modelo de Ta-Da también prioriza la privacidad del usuario al depender únicamente de datos generados por voluntarios, en marcado contraste con las prácticas de empresas como Meta y Amazon.
Meta Platforms utilizó publicaciones públicas de Facebook e Instagram para entrenar a su asistente virtual de IA Meta AI, mientras que Amazon aprovechó conversaciones reales de usuarios para refinar el modelo de IA de Alexa.
Ta-Da AI apunta a datos de audio diversos
Dado el enfoque en el reconocimiento de voz, uno de los principales propósitos de Ta-Da es acumular grabaciones de voz en múltiples idiomas, todas destinadas a afinar los sistemas de reconocimiento de voz de IA.
Con Vivoka, William Simonin pasó años desarrollando una solución tecnológica que admite 42 idiomas y está diseñada para kits de desarrollo de voz, lo que permite a las empresas de diversos sectores como la robótica y la logística incorporarla en cualquier interfaz de voz.
Actualmente, la empresa trabaja con aproximadamente 100 clientes globales y su tecnología está integrada en más de 100.000 dispositivos en todo el mundo.
Es a través de este extenso trabajo que identificó desafíos dentro del sector incipiente de recopilación de datos de voz.
El inmenso volumen de datos requerido para el perfeccionamiento puede ser prohibitivamente costoso. El costo de 1.000 horas de audio puede llegar a ser de hasta $100.000. Es común que las empresas enfocadas en IA asignen presupuestos que van desde $100.000 hasta $1 millón anualmente solo para este tipo de datos.
Además, surgen preocupaciones con frecuencia en cuanto a la autenticidad y calidad de los datos. "Solo alrededor del 5-10% de un conjunto de datos se somete a un riguroso examen", señaló Simonin, llamando la atención sobre desafíos como la calidad inferior de los datos y la compensación inadecuada para los contribuyentes genuinos.
El desafío sigue siendo asegurar un conjunto de datos de audio diverso y amplio, especialmente cuando se busca comprender lenguajes complejos. "Una IA entrenada únicamente en una voz masculina podría funcionar excepcionalmente bien con esa entrada específica. Sin embargo, su precisión podría fallar cuando una mujer interactúa con ella", explicó Simonin.
Por lo tanto, Ta-Da ofrecerá recompensas más altas por voces más raras.
"Tendrás acceso a varias tareas, cada una ofreciendo una remuneración diferente", dijo Simonin a Decrypt. "Por ejemplo, si hablas un idioma en particular con un acento específico, Ta-Da podría pagar más por requisitos únicos, como alguien que pueda hablar corso con acento inglés".