Traitement du langage naturel

Traitement du langage naturel

  

Traitement du langage naturel

Résumé :

Certaines personnes dans le domaine académique pensent que le Traitement du langage naturel (NLP) est un domaine ancien, et qu'il n'a plus d'utilité avec l'émergence des outils d'apprentissage automatique. Ce n'est pas vrai du tout. L'apprentissage automatique est un outil pour le NLP. L'Université de York définit le Traitement du langage naturel (NLP) comme une branche de l'intelligence artificielle au sein de l'informatique. Il se concentre sur l'aide aux ordinateurs pour comprendre la manière dont les humains communiquent à travers plusieurs langues, à la fois écrites et parlées. Le NLP implique beaucoup d'études sur les données non structurées que les gens écrivent et parlent habituellement. Cette difficulté vient du fait que le NLP traite directement avec l'humain. Par exemple, le NLP nous a aidés à communiquer facilement avec nos téléphones portables en parlant avec des applications telles qu'Apple Siri et Amazon Alexa. Cela n'aurait pas été possible sans la présence d'outils NLP. Le NLP a aidé à traiter les langues humaines, l'anglais, l'arabe et d'autres langues populaires, à la fois écrites et parlées. Maintenant, vous allez dire : pourriez-vous fournir plus d'exemples que je peux comprendre afin que je sois convaincu de l'existence d'une spécialisation aussi importante en informatique.

Mots-clés : Traitement de texte, Réponse à des questions, Classification de texte, Traitement du langage naturel, Autocomplétion de texte, Analyse de sentiment, Embedding de mots.

Eh bien, le NLP a des applications que nous utilisons chaque jour et le plus simple exemple d'outil NLP que nous utilisons tous les jours est le moteur de recherche Google. Si Google ne comprend pas la langue dans laquelle vous écrivez, il ne serait pas capable de trouver les sites que vous recherchez. Vous tapez le mot Université d'Anbar,

  

Image 1 Recherche dans le moteur de recherche Google pour le mot slabja

et Google vous fournit le site de l'université en 0,71 millisecondes. Il n'aurait pas été possible pour Google de lister ces sites dans l'ordre d'importance sans l'utilisation des technologies NLP. Google utilise le NLP pour traiter, indexer et catégoriser les pages web d'une manière facilement accessible à l'utilisateur. En Irak, nous avons beaucoup de mots d'argot qui étaient difficiles à comprendre pour un moteur de recherche comme Google, mais maintenant, avec l'aide du NLP et le développement des outils utilisés dans le traitement de texte, Google a pu comprendre des mots comme slabja et dernafis (voir image 1 et image 2, qui montrent les résultats de la recherche Google pour slabja et dernafis. Google a également fourni à l'utilisateur les significations de ces mots, comme slabja : le récipient dans lequel la main est lavée. Dernafis est le tournevis et ainsi de suite pour le reste des autres mots.

 

                                                                        Image 2 Recherche dans le moteur de recherche Google pour le mot dernafis

Une autre question : Y a-t-il d'autres applications dans notre vie quotidienne qui dépendent entièrement du NLP ?

La réponse est oui. Nous énumérons ici les applications les plus populaires du NLP :

1. Applications de réponse à des questions

Le titre peut sembler étrange, et le lecteur pense qu'il n'a jamais vu une telle application de sa vie, mais cette application existe, et nous l'utilisons beaucoup, et il y a de nombreuses entreprises qui utilisent maintenant cette technologie pour créer des robots qui répondent automatiquement à la plupart des questions des utilisateurs. Les Chatbots répondent à de nombreuses questions que les gens posent, comme « J'ai un problème d'activation de ma carte SIM de téléphone portable ». Le Chatbot, adoptant des outils NLP, analyse la question et fournit à l'utilisateur la réponse associée, par exemple, « Vous devriez visiter le site de l'équipe de support ou appeler le numéro de téléphone suivant 79017238076. » De plus, il y a un autre usage quotidien dans le moteur de recherche Google qui utilise la technique de réponse à des questions.

 

Image 3 Questions et réponses par Google lors de la recherche du mot Traitement du langage naturel

 

Lorsque vous demandez à Google quoi que ce soit, Google vous fournit les sites ainsi que les questions associées que les gens ont précédemment posées, voir image 3.

2. Traduction automatique

Nous sommes maintenant conscients des progrès que les applications de traduction ont réalisés. Nous comptons sur ces applications pour traduire différentes langues. Des applications comme Google Translator, Bing Translator, DeepL Translator et d'autres traducteurs sont de bons exemples de traducteurs en ligne récents. Vous pensez que les dictionnaires existent depuis plusieurs milliers d'années et que ces applications ne sont rien d'autre que des dictionnaires électroniques. Non, la plupart de ces dictionnaires sont plus qu'une simple copie et un collage de livres de traductions.

Ces applications de traduction ont utilisé des techniques NLP pour traiter beaucoup de textes électroniques afin d'atteindre la meilleure représentation du mot que vous recherchez. Elles sont allées au-delà pour traduire des phrases entières et des pages dans d'autres langues, en tenant compte des significations des mots, des règles et des temps associés aux mots. Nous pouvons maintenant traduire non seulement des mots sur Google Translate mais aussi des phrases et des textes entiers. Nous voyons dans l'image n° 4 comment Google Translate a trouvé le mot Lock et a ensuite fourni plus d'informations à son sujet. Il a fourni le sens le plus pertinent de ce mot et les mots les plus similaires à ce mot avec des exemples de phrases. L'image 5 montre la capacité de Google Translate à traduire un texte complet.

 

Image 4 Google Translate traduit le mot Lock de l'anglais vers l'arabe

  

Image 5 Google Translate traduit un texte entier

3. Autocomplétion de texte

 Maintenant, non seulement les moteurs de recherche travaillent pour compléter ce que nous écrivons, mais aussi les applications de SMS et bien d'autres. L'autocomplétion de texte n'existerait pas sans l'utilisation des techniques NLP. L'image 6 montre comment le moteur de recherche Google suggère une autocomplétion pour une requête telle que « is natural language. » Google a listé plus de 4 suggestions pour compléter la phrase, telles que is natural language processing machine learning ou is natural language processing ai (voir image 6). L'image 7 montre comment un téléphone mobile moderne (iPhone) suggère de compléter le mot would avec différentes suggestions telles que would you ou would you like ou would it.

Image 6 Le moteur de recherche Google suggère de compléter la requête pour la phrase is natural language.

 

Image 7 Outil de prédiction de texte de l'iPhone suggère de nombreux mots pour compléter would

4. Classification de texte

Récemment, les chercheurs ont montré un intérêt pour les données et leur classification. Un exemple de cela est la classification des articles de recherche en informatique en classes d'intelligence artificielle, de traitement d'image et d'apprentissage automatique. Les technologies NLP peuvent classifier les articles en traitant et en analysant le texte de ces articles et en déterminant la catégorie à laquelle ils appartiennent, que cet article appartienne à l'intelligence artificielle, au traitement d'image ou à l'apprentissage automatique. Un autre exemple populaire de classification de texte est la classification et le filtrage des e-mails en e-mails de base ou en spams. Sans les technologies NLP, nous ne serions pas capables de classifier les e-mails.

5. Analyse de sentiment

Nous utilisons tous maintenant les réseaux sociaux. Nous écrivons sur Facebook, Instagram, Twitter, etc. pour exprimer nos sentiments. Ce que nous écrivons sur les réseaux sociaux est très important pour de nombreuses entreprises. Les entreprises de publicité électorale aux États-Unis ont beaucoup compté sur l'analyse de sentiment pour prédire les attitudes des gens envers les candidats aux élections. L'analyse des sentiments des gens a eu une grande influence pour guider les gens à élire certains candidats.

Il existe de nombreux autres exemples en plus de ces applications NLP, par exemple :

A.    Embedding de mots

B.     Résumé de texte

C.     Reconnaissance d'entités nommées

D.    Assistants contrôlés par la voix

Des outils NLP ont été développés pour inclure des outils d'apprentissage automatique tels que Word2Vec, GloVe, Fasttext, et bien d'autres. De nos jours, ces outils sont obsolètes, et il existe des outils dits qui utilisent des transformateurs comme l'algorithme BERT, RankBrain, GPT-2, GPT-3 et d'autres.

À travers cet article court et simplifié, j'espère avoir donné une idée claire et compréhensible sur le Traitement du langage naturel, connu sous le nom de NLP, et sa définition, ses applications les plus célèbres et ses utilisations dans notre vie quotidienne, ainsi que son importance dans le présent et le futur proche.

 

Mohammed Salah Ibrahim, Ph.D.

Département d'informatique et de technologie informatique

Université d'Anbar, Irak, Anbar, Ramadi E-mail : moh.salah@uoanbar.edu.iq

Téléphone : 964-750-2138425

Sources

[1]        “Le rôle du traitement du langage naturel dans l'IA,” Université de York, 12 oct. 2021. https://online.york.ac.uk/the-role-of-natural-language-processing-in-ai/ (consulté le 19 avr. 2022).

[2]        “Papiers avec code - Traitement du langage naturel.” https://paperswithcode.com/area/natural-language-processing (consulté le 19 avr. 2022).

 

 

 

 

Share |