Xiaomi dezvoltă tehnologia proprietară de redare a vocii pentru a ajuta oamenii cu tulburări de vorbire

Xiaomi, companie de electronice de larg consum și producție inteligentă, cu smartphone-uri și hardware inteligent conectate la bază printr-o platformă IoT, a prezentat cea mai recentă aplicație de algoritmi avansați și tehnologie proprietară de redare a vocii, destinate publicului larg. Tehnologia Text-To-Speech în stil spontan este dezvoltată de Xiaomi AI Labs și folosită pentru a genera o voce unică și personalizată pentru un utilizator cu tulburări de vorbire.

Acesta poate comunica de acum cu ceilalți folosind „propria voce”, în locul vocii electronice monotone. Ca parte a proiectului de pre-cercetare „Own My Voice” condus de Xiaomi Technical Committee, această realizare de succes demonstrează angajamentul Xiaomi – “Tech for Good” (Tehnologie pentru bine) – și, totodată, misiunea companiei „de a le oferi tuturor oamenilor din lume posibilitatea să se bucure de o viață mai bună prin intermediul inovațiilor tehnologice”.

De ce a lansat Xiaomi acest proiect?

Xiaomi pune preț pe bunăstarea oamenilor și se străduiește să le satisfacă necesități diferite prin inovațiile tehnologice. Compania a descoperit că mulți dintre cei cu tulburări de vorbire și-ar dori să aibă voci personalizate, așa că a înființat echipa pentru proiectul “Own My Voice”. Aceasta a invitat o persoană cu tulburări de vorbire pentru a-i oferi o voce nouă. Zhu Xi, inițiator al conversației din cadrul Technology Committee pentru Tech for Good, Xiaomi Corporation, a declarat: „Suntem entuziasmați să putem explora beneficiile multiple pe care inovația tehnologică ni le pune la dispoziție, cum ar fi această soluție pentru cei care își doresc o identitate proprie sau încearcă să își construiască una”.

Cum a desfășurat Xiaomi proiectul?

Pentru a genera vocea cea mai potrivită și personalizată pentru beneficiar, echipa proiectului a recrutat peste 200 de voluntari din cadrul Xiaomi care și-au donat vocile. S-a folosit algoritmul de corelare al amprentei vocale pentru a sincroniza caracteristicile vocilor donate de voluntari cu cele ale destinatarului. Prin această abordare, s-au identificat cele mai potrivite sunete de bază ca sistem de referință pentru destinatar. S-a ținut cont și de reglementările de protecție a vieții private și, prin urmare, vocea aleasă a fost modificată printr-un procedeu acustic complex pentru a dezvolta un sunet nou și original.
Mai departe, s-a folosit tehnologia Text-To-Speech în stil spontan pentru a realiza modelul AI, iar noua voce a căpătat gradual ritm și intonație naturale pentru a exprima emoțiile și tonul uman.

Proiectul “Own My Voice” combină o varietate de algoritmi avansați cu tehnologia proprietară Xiaomi de viteză a discursului pentru a asigura specificitatea, siguranța și autenticitatea ridicată a vocii sintetizate. S-a creat astfel o nouă viziune asupra unui discurs personalizat pentru utilizatorii cu tulburări de vorbire.

Care este semnificația proiectului?

Un grup de experți în tehnologia vorbirii din cadrul Xiaomi AI Labs reprezintă coloana vertebrală a proiectului. Din 2017 și până acum, aceștia au publicat 37 de documente despre vorbire, prezentate la conferințe internaționale de top, cum ar fi Conferința Internațională despre Acustică, Vorbire și Procesarea Semnalului (ICASSP). Succesul proiectului “Own My Voice” depinde foarte mult de tehnologia Text-To-Speech în stil spontan dezvoltată de ei.

În esență, tehnologia Text-To-Speech în stil spontan face ca vocea sintetică să sune ca cea a unui om, din punct de vedere al intonației, pauzelor, vitezei și altor caracteristici. Cu ajutorul ei se înlocuiește vocea electronică monotonă și nenaturală. În prezent, această tehnologie se aplică mai multor dispozitive inteligente, echipate cu Xiaoai, asistentul vocal AI al Xiaomi. Proiectul “Own My Voice” demonstrează că tehnologia Text-To-Speech în stil spontan poate fi adoptată pe scară largă în zonele de accesabilitate și poate îmbunătăți experiența utilizatorilor.

Zhu Xi a adăugat:

„Dacă observăm și ne adresăm nevoilor unor grupuri minoritare într-un stadiu incipient, procesul de difuzare a tehnologiei ar putea fi cu mult scurtat. Acest lucru permite ca beneficiile noilor tehnologii să devină accesibile utilizatorilor cu nevoi speciale, fără întârziere.”

În continuare, Xiaomi va primi feedback de la destinatarul vocii și va studia fezabilitatea proiectului la o scară mai largă. Xiaomi va continua să susțină accesul la cele mai noi tehnologii, cu scopul de a satisface nevoile diverse ale oamenilor prin inovarea tehnologică.

Xiaomi dezvoltă tehnologia proprietară de redare a vocii pentru a ajuta oamenii cu tulburări de vorbire

De ce a lansat Xiaomi acest proiect?

Cum a desfășurat Xiaomi proiectul?

Care este semnificația proiectului?

„Dacă observăm și ne adresăm nevoilor unor grupuri minoritare într-un stadiu incipient, procesul de difuzare a tehnologiei ar putea fi cu mult scurtat. Acest lucru permite ca beneficiile noilor tehnologii să devină accesibile utilizatorilor cu nevoi speciale, fără întârziere.”

LĂSAȚI UN MESAJ Renunțați la răspuns

Alte articole