SERVICES D¡¯ANNOTATION ET DE TRANSCRIPTION
TRANSPERFECT DATAFORCE
Les annotations permettent d¡¯ajouter des marquages pertinents aux donn¨¦es afin qu¡¯elles puissent ¨ºtre utilis¨¦es comme moyen d¡¯apprentissage par diff¨¦rents syst¨¨mes. Il est essentiel que les donn¨¦es soient structur¨¦es de la bonne mani¨¨re pour qu¡¯elles puissent ¨ºtre utilis¨¦es ¨¤ des fins d¡¯apprentissage automatique. Il existe de nombreux types de t?ches d¡¯annotation, adapt¨¦es aux besoins de chaque projet. Les t?ches d¡¯annotation linguistique comprennent l¡¯annotation morphosyntaxique, le marquage des diff¨¦rentes parties d¡¯un discours, l¡¯annotation d¡¯entit¨¦s d¨¦sign¨¦es et bien d¡¯autres t?ches.
Si le traitement du langage naturel (TLN) est bas¨¦ sur un apprentissage supervis¨¦, il est indispensable que les donn¨¦es soient annot¨¦es. Par exemple :

Un assistant virtuel tenant une conversation en assurant un suivi des usages anaphoriques (p. ex., les pronoms faisant r¨¦f¨¦rence ¨¤ un autre ¨¦l¨¦ment du texte).

Un syst¨¨me d¡¯extraction de donn¨¦es analysant le texte pour extraire les informations les plus importantes pour le projet.

Un outil de r¨¦sum¨¦ de textes utilis¨¦ pour ne retenir que les parties pertinentes d¡¯un texte dans le but d¡¯extraire les informations importantes sous une forme plus concise.
La transcription consiste essentiellement ¨¤ associer le texte parl¨¦ ¨¤ sa forme ¨¦crite. La transcription peut comprendre, en soi, des annotations linguistiques (sons humains appartenant ¨¤ une langue) et non-linguistiques (sons non humains ou autres sons, tels que le bruit d¡¯une voiture qui passe ou le souffle du vent).
Les transcriptions sont souvent utilis¨¦es pour am¨¦liorer les syst¨¨mes de reconnaissance vocale automatique, eux-m¨ºmes utilis¨¦s pour transcrire automatiquement ce qu¡¯un utilisateur dit lorsqu¡¯il se sert d¡¯un appareil. La transcription est la premi¨¨re ¨¦tape du traitement des donn¨¦es orales puisqu¡¯une fois qu¡¯elles sont converties dans leur forme ¨¦crite, d¡¯autres t?ches de TLN peuvent ¨ºtre appliqu¨¦es au texte.
Aussi bien dans le cadre des t?ches d¡¯annotation que dans celui des t?ches de transcription, ¾ÅÉ« DataForce applique une strat¨¦gie simple et efficace. Apr¨¨s avoir d¨¦fini les exigences applicables et d¨¦cid¨¦ du flux de travail, DataForce m¨¨ne un projet pilote et partage les r¨¦sultats avec le client. Une fois l¡¯approbation du client obtenue, le projet complet est lanc¨¦.