Skip to content
Effectuer une recherche pour en savoir plus sur les produits et solutions InterSystems, les offres d'emploi, etc.

L'analyse automatique de données non structurées : une mine d'or d'informations

Près de 85% des données sont sous forme non structurée; emails, contrats, rapports de médecins et messages sur les réseaux sociaux : ce sont toutes des données non structurées et elles renferment une véritable mine d'or d'informations.

Pensez par exemple aux visions et aux conclusions d'experts médicaux sur une spécialité déterminée, ou aux rapports de patients détaillés d'une incroyable richesse en termes de données pertinentes. Toutefois, il y a aujourd'hui de plus en plus de données disponibles (songez au Big Data), et elles s'accumulent de plus en plus vite.

Mais comment faire pour extraire rapidement et correctement les informations les plus pertinentes de cette énorme quantité de données non structurées ? À l'aide d'une analyse de texte « ascendante » automatique. Nous vous l'expliquons à l'aide de quatre « cas pratiques » et vous présentons les avantages que ce système peut représenter pour vous dans la pratique.

Avec l'analyse de texte automatique, il convient de répondre à quatre questions importantes :

  1. Exploration de données : De quoi parle le texte ?
  2. Signalisation : Qu'est-ce qui caractérise et est pertinent dans le texte ?
  3. Fragmentation de contenu : Quels textes sont reliés entre eux ?
  4. Collecte d'informations : Quels éléments peuvent être extraits d'un texte ?

Comment cela fonctionne-t-il pratiquement ?

Cela semble relativement abstrait, mais à l'aide d'une série d'applications pratiques d'iKnow (notre technologie qui analyse les données non structurées), nous concrétisons les possibilités d'analyse de texte automatique. Dans la première partie de cette série nous abordons l'exploration de données et les possibilités de signalisation. La deuxième partie traite des possibilités de fragmentation de contenu et de collecte d'informations :

 

Explorer des données : de quoi parle le texte ?

Grâce à l'exploration automatique de données, vous avez un aperçu de ce dont parlent les textes (quels sujets) et de la manière dont les concepts et les sujets sont liés dans le texte les uns aux autres. AuxiPress (une importante entreprise de médias belge à laquelle des partis politiques font notamment régulièrement appel) utilise iKnow pour analyser quelles marques et organisations sont citées dans l'actualité. Et l'entreprise de logiciels espagnole CysNET a intégré iKnow dans son outil Badakit. Avec ce logiciel, leurs clients (tels que la Clinique Universitaire de Navarre) peuvent établir une taxonomie de toutes les découvertes et diagnostics sur la base des rapports médicaux.

 

Signalisation : découvrez ce que vous ignorez encore

Il s'agit d'une forme étendue de reconnaissance de données. Avec cette méthode, on analyse avec précision la pertinence d'un texte ou d'une collection de texte. Elle reflète visuellement les modèles et les thèmes récurrents. Le plus beau dans tout cela est que l'on peut analyser librement l'intégralité des textes, l'analyse ne se limite donc pas à une étude sur la base de mots prédéfinis.

Réputations et prédictions

L'organisation de publication anglaise PCS utilise par exemple iKnow pour analyser des réputations en ligne. Elle utilise pour ce faire des thèmes sur les réseaux sociaux qui sont liés à certaines marques, produits ou services. Ainsi, les brand managers peuvent réagir rapidement aux réactions « négatives » postées en ligne à propos de leurs produits ou services Et le prestataire de soins Parnassia utilise iKnow afin d'identifier certains mots dans les rapports médicaux qui peuvent indiquer que la santé mentale d'un patient se détériore et que cette personne peut représenter un danger pour elle-même. La technologie iKnow établit en quelque sorte des modèles prédictifs sur la base d'analyses de texte qui aident à prédire des troubles mentaux.

Vous voulez en savoir plus ?

Ce ne sont là que quelques applications possibles des fonctions automatisées d'analyse de texte. Dans la deuxième partie, nous abordons les applications en matière de « Fragmentation de contenu » et de « Collecte d'informations » Souhaitez-vous en savoir plus au sujet du contexte dans lequel s'inscrit la technologie iKnow et le fonctionnement de l'analyse de texte automatique ? Lisez notre article  « Analyser le Big Data non structuré ».

 
Pour en savoir plus :

NLP et Covid-19

 

RELATED TOPICS