CAPÇALERA: CURSOS CAOC

Jornalet, gaseta occitana d'informacions

Dissabte, 19 de setembre

Lo Quentin

Dimenge, 23.2.2020 03h00

Common Voice: etapa 1/3


Comentaris Un comentari    
Dolent Fluix Bo Molt bo Fabulós (3 vòtes)
carregant En cargament





En octòbre 2018 vos parlèri d’un projècte de la fondacion Mozilla per crear un motor de reconeissença vocala liure. Caliá realizar la traduccion per començar lo projècte. Degun se mostrèt pas interessat. Es solament en novembre 2019 pendent un festenal del logicial libre, Capitole du Libre, que me diguèri qu’èra tròp damatge. Efectivament, pendent lo festenal i aviá una conferéncia amb un emplegat de Mozilla. Sabiá pas dire se l’occitan fasiá part del projècte. Ieu dins lo public sabiái que non... Avètz aquí la vidèo de la conferéncia.
 

 
 
Se me lancèri pas es qu’es un brave trabalh, gaireben impossible solet.
 
Per començar lo projècte cal traduire lo site web de Mozilla Common Voice, 614 cadenas de tèxtes al moment d’escriure aqueste article. Aprèp cal constituir un còrpus de tèxtes de 5 000 frasas almens. Per cada frasa cal que qualqu’un la valide. Un còp lo còrpus creat, començan los enregistraments àudios, mòstras vocalas. Per cada enregistrament cal tanben una validacion, o doas.
 
E ara... quant de temps dura una frasa? Un par de segondas? Per que lo motor d’aprendissatge siasque eficaç li cal 10 000 oras d’enregistrament. Dètz milas oras. Vaquí.
 
En decembre 2019 faguèri lo torn del monde que coneissi per m’ajudar a traduire lo site. 3 personas m’ajudèron a traduire lo site de Common Voice. Los mercegi aquí! Aguèt un contributor anonim tanben, malaürosament amb un occitan tròp tintat d’espanhòl.
 
Vaquí ont sèm del projècte d’aver un motor de reconeissença vocala liure per l’occitan.
 
L’etapa venenta es la creacion d’un còrpus de tèxtes. Vos parlarai d’aquò dins un autre article perque vòli implicar lo monde.
 
Per acabar la traduccion e per fauta de font, daissèrem en anglés lo nom de las lengas seguentas:
 

Adyghe
Dhivehi
Kabardian
Komi-Zyrian
Luganda
Moksha
Meadow Mari
Hill Mari
Erzya
Kinyarwanda
Sakha
Sinhala
Tajik
Ubykh
Udmurt
Karakalpak
Tagalog
 
Se coneissètz la traduccion en occitan, sètz mai que benvengut per participar a la traduccion e partejar vòstre saber!
 
 
 
abonar los amics de Jornalet
 
 

 



publicitat
BANNER1: IEO Arièja



Comentaris

23 de febrièr 14.05h

Vos tòrni donar lo ligam per realizar la traduccion dels produches de Mozilla :
https://pontoon.mozilla.org/oc/

E aquí unas explicacions : https://framagit.org/provaires/fonts
Es pas a jorn lo document, manca lo vocabulari novèl coma «criptominaire» o «generador d’emprunta numerica».


Valora aquest comentari:   votar positiu 0   votar negatiu 0
Respondre comentari replica Comentari inadequat   Formulari d'abús de comentari

5 -10 -20 -tots
1




Comenta

Lo comentari es estat mandat corrèctament

  Previsualiza

La direccion del Jornalet a lo drech de publicar pas aqueles comentaris que respècten pas las nòrmas basicas d'educacion, civisme e dialòg.
publicitat
BANER3: Ràdio Occitània

Perfil

Lo Quentin

Lo Quentin logo rss

Apassionat de lengas, ai començat a recuperar la lenga en 2011 e dempuèi ensagi d’obrar per l’occitan coma pòdi.

mai d'informacions

contactar l'autor

Categorias

Mai d'articles

Archius




D'autres articles


Jornalet, gaseta occitana d'informacions