CAPÇALERA: CAOC 2021-2022

Jornalet, gaseta occitana d'informacions

Diluns, 20 de setembre

Lo Quentin

Dimècres, 30.6.2021 03h00

Facebook IA e las lengas paucas dotadas


Comentaris Un comentari    
Dolent Fluix Bo Molt bo Fabulós (7 vòtes)
carregant En cargament





Lo 4 de junh lo despartament d’intelligéncia artificiala de Facebook publiquèt un papièr coma dison tocant las traduccions automaticas de mantuna lenga. Dos jòcs de donadas, un de 46 lengas e un autre de 101. 101 es l’identificant dels cors per debutant dins lo sistèma escolar estatsunidenc. Dins los dos grop trobem la lenga occitana representada. De 6000 lengas estimadas pel monde, causèron d’inclure nòstra lenga. Per aquesta experiéncia calguèt trobar un traductor professional per traduire 3001 frasas de l’anglés a l’occitan, frasas de la Wikipèda en anglés. Per çò qu’es dels còrpus, l’occitan es considerat coma «pauc dotat» en tèxtes numerizats e anonats. Mas un paragraf del papièr nos indica aquò:
 

«Al contrari [de las lengas africanas], la traduccion dins mantuna lenga europèa, amai lengas paucas dotadas coma l’occitan, an de melhoras performàncias. Aqueste resultat met en davant l’importància tan del nombre de donadas que lo transferiment d’aprentissatge de lengas ligadas. Per exemple, la traduccion cap a e a partir de l’occitan pòt naturalament manlevar de lengas plan dotadas coma lo francés, l’italian e l’espanhòl.»
 
Aprenèm doncas que la maquina poguèt crear de palancas entre lengas de meteissa familha per compensar las paucas ressorsas disponiblas. Seriá de bon contar al monde contra lo multilingüisme aquò.
 
Òm pòt se demandar l’interest de Facebook de menar aqueste estudi. Encara que siasque pas perfiècha la traduccion automatica permet de comprendre l’idèa màger d’un messatge. Pòdi pas rescondre qu’aqueste malhum social practica de censura pels governaments e autres grops de pression. Per acabar amb una nòta positiva, los jòcs de donadas son provesits en open source.
 
Ligam cap al blog Facebook AI: https://ai.facebook.com/blog/the-flores-101-data-set-helping-build-better-translation-systems-around-the-world/
 
 
 
abonar los amics de Jornalet
 
 

 



publicitat
BANNER1 - IEO 09 divendres espaci occitan



Comentaris

2 de julh 17.22h

*papièr > article (anglicisme)

*siasque > siá (vulgarisme)


Valora aquest comentari:   votar positiu 0   votar negatiu 1
Respondre comentari replica Comentari inadequat   Formulari d'abús de comentari

5 -10 -20 -tots
1




Comenta

Lo comentari es estat mandat corrèctament

  Previsualiza

La direccion del Jornalet a lo drech de publicar pas aqueles comentaris que respècten pas las nòrmas basicas d'educacion, civisme e dialòg.
publicitat
BANER3: Ràdio Occitània

Perfil

Lo Quentin

Lo Quentin logo rss

Apassionat de lengas, ai començat a recuperar la lenga en 2011 e dempuèi ensagi d’obrar per l’occitan coma pòdi.

mai d'informacions

contactar l'autor

Categorias

Las mai...


Mai d'articles

Archius




D'autres articles


Jornalet, gaseta occitana d'informacions