Cartographie intelligente de l'actualité avec résumé automatique de documents : http://www.connivences.info

 

Mes Activités
Abderrafih LEHMAM
Après ma thèse de Doctorat obtenue à l'université Nancy2 en linguistique informatique sur le sujet du résumé automatique de texte (Distinction : Grand Prix de la Recherche 1996), j'ai dirigé (1997-98) le Projet RAFI (Résumé Automatique par Fragments Indicateurs) qui visait la mise en œuvre d'un prototype de Résumé Automatique de texte. Ce projet avait pour objet la valorisation des résultats trouvés lors de mes recherches de thèse.
De 1998 à ce jour, j'ai continué à travailler dans le domaine du résumé automatique mais aussi en linguistique informatique en général (terminologie, lexiques spécialisés, catégorisation, interrogation d'un moteur de recherche en langage naturel, construction de thésaurus spécialisés, Workflow...). Mes travaux dans le domaine du résumé électronique sont actuellement dirigés vers l'intégration d'un système de résumé automatique au travers d'un  réseau d'entreprise de type Intranet. J'ai prouvé par une expérience au sein d'une grande entreprise nationale française; La Banque de France pour ne pas la nommer ;-) où j'exerçais mon savoir-faire que le résumé de texte automatique a parfaitement sa place dans le monde de l'Entreprise. 

Étant donné que tout ce qui peut se réaliser sur Intranet peut aussi se réaliser sur Internet, j'ai entrepris la réalisation du site http://www.pertinence.net : le premier site qui fait des résumés  multilingues automatiquement en ligne . Dans ce site est mis en branle le logiciel PERTINENCE SUMMARIZER  qui peut être testé gratuitement. Nous avons ensuite créer la société PERTINENCE MINING; société spécialisé en traitement automatique de l'information textuelle, qui développent plusieurs produit liés à ce domaine de traitement. En particulier , la plate-forme de veille multilingue PERTINENCE INFORMATION NETWORK, qui a la spécificité d'intégrer tous nos autres outils à savoir :

- Pertinence Summarizer : logiciel multilingue de résumé automatique de texte aux fonctionnalités très avancées

- Pertinence News Extractor (PNE) : outil permettant d'agréger automatiquement les contenus de différents sites proposant des actualités en vue d'une surveillance automatique, en multilingue.

- Pertinence Meta Search (PMS) : nouveau né des outils de Pertinence Mining, PMS est un méta-moteur de recherche qui permet d'interroger les moteurs de recherche les plus populaires aux plus spécialisés et de filtrer les résultats à l'aide des opérateurs de pertinence propres à notre technologie de traitement de l'information.


La presse en parle : Écoutez la chronique de la radio France Info "Partenaire d'entreprise" (interview de PERTINENCE MINING)

Résumé automatique de texte :  des solutions opérationnelles

Quelques adresses utiles pour des recherches en  Résumé automatique de texte

D'abord celle de mon ami Robert Gaizauskas, enseignant chercheur à l'université de Shieffield (GB), celle de Dragomir Radev enseignant chercheur à l'université du Michigan (Chicago - USA) - on a fréquenté la même école primaire à Fez au Maroc et on se retrouve plusieurs années après avec le même centre d'intérêt au niveau recherche, lui aux USA et moi en France, comme le monde est petit! - et enfin celle de Horracio Saggion chercheur à l'université de Sheffield

Références bibliographiques

(2006, à par) Abderrafih Lehmam, " Le résumé de texte automatique de texte, aspects linguistiques et informatique", Édition de l'Harmattan

(2006) Abderrafih Lehmam, "Solutions de traitement du document textuel avec prise en charge de ressources linguistiques", ISDD 06 - International Symposium: DISCOURSE and DOCUMENT Caen (France) 15-16 June 2006

(2006) Abderrafih Lehmam, "Technologie textuelle multilingue" 2èmes Journées thématiques "Apprentissage Artificiel et Fouille de Données", 27-28 Avril, Univ. PARIS 13

(2006) Abderrafih Lehmam, " Solutions de Text Mining pour l'intelligence économique, vers la veille intelligente.'TELMI’06, "Les outils d’aide à la gestion de l’information stratégique", 30 mars 2006, à l'Université de Lille 3

(2004) Abderrafih Lehmam,  "Watch application, summarization and syndication in Arabic", Proceedings of the conference NEMLAR '04 "Arabic Language Resources and Tools Conference", pp. 157-163, 22-23 September 2004, Cairo, Egypt.

(2004) Abderrafih Lehmam ,  "Un résumeur automatique de textes multilingues intégré dans une plateforme de veille; application à la langue arabe", Actes de la conférence JEP-TALN-RECITAL 2004 : Traitement automatique de la langue arabe écrite et parlée Arabic Language Processing - Text & Speech, pp. 111-122, Fès, Maroc

 A. Lehmam &  (2003), "Pertinence Information Network ; un système d’alerte, en multilingue" Séminaire DocForum Explorez les nouvelles voies de la recherche d'information! journée organisée par l'association DocForum et O. Andrieu (abondance.com) à l'ENS Lettres et Sciences Humaines – Lyon le 20 novembre 2003,

(2003) A. Lehmam &  "Pertinence Information Network; Collecte, traitement, diffusion ciblée et exploitation de l'information" 9e Carrefour des Possibles de la FING (Fondation Internet Nouvelle Génération) ; Rendez-vous régulier au service des innovateurs et des utilisateurs des technologies de l'information et de la communication, 25 septembre 2003, Maison de la RATP, Paris

(2003) A. Lehmam &  "Pertinence Information Network : Agent d'alertes en multilingue ; l’alerte par syndication de contenu" WEBPublication - Publication dynamique sur Internet et Intranet, 2003 Paris

(2003) A. Lehmam &   A. Lehmam "Pertinence Summarizer : un outil d’aide à la rédaction par la génération de résumés automatiques", Colloque COMTEC 2003, Gestion Documentaire – Archivage , mars 2003, Advancia, CCIP Paris

(2002) A. Lehmam & , "Résumé de texte automatique : vers des solutions professionnelles", Journée d'Étude de l'Association pour le Traitement Automatique des LAngues (ATALA) "Le résumé de texte automatique : solutions et perspectives" organisée par Jean-Pierre Desclés (LaLICC - FRE 2520 CNRS - Université Paris-Sorbonne), Abderrafih Lehmam (Pertinence Mining, Paris) et Jean-Luc Minel (LaLICC - FRE 2520 CNRS - Université Paris-Sorbonne) ENST, 14 décembre 2002, Paris

(2003) A. Lehmam  "Résumé automatique multilingue tenant compte de la thématique du texte", Séminaire ATILF (Analyse et Traitement Informatique de la Langue Française) (INaLF CNRS), 6 décembre 2002, Nancy

(2001) A. Lehmam  "Évaluation, rectification et pertinence du résumé automatique de texte pour une utilisation en réseaux Internet et Intranet " 3ème Colloque du Chapitre français de l’ISKO 5-6 juillet 2001 à l’Université de Paris X "Filtrage et résumé automatique de l’information sur les réseaux" pp. 111-124

A. Lehmam (2000)"Résumé de texte automatique : des solutions opérationnelles", La Tribune des Industries de la Langue, de l'Information Électronique et du Multimédia, Janv-Juin , pp.50-58, OFIL, Paris.

A. Lehmam (1999) " Text structuration leading to an automatic summary system ", Information Processing & Management, 35, pp. 181-191, Elsevier Science Ltd, NJ, New York, USA

A. Lehmam (1998) Rapport linguistique du Projet RAFI; 103 pages.,

A. Lehmam (1998) Rapport informatique du Projet RAFI; 105 pages

A. Lehmam (1997b) Automatic summarization on the Web? RAFI: A system for summarizing using indicating fragments , 5ème Conference RIAO '97 Recherche d'Information Assistée par Ordinateur sur Internet, Université McGill, Montréal, Québec H3A 2T7, Canada, 25-26-27 Juin 1997, pp. 112-124.

A. Lehmam (1997a) Une structuration de texte conduisant à la construction d'un système de résumé automatique , 1ères JST FRANCIL '97 Journées Scientifiques et Techniques du Réseau Francophone de l'Ingénierie de la Langue de l'Aupelf-Uref. L'Ingénierie de la Langue : de la Recherche au Produit, Avignon, France, pp. 122-130, 15-16 avril

A. Lehmam (1997) "Le Résumé Electronique : l'expérience de RAFI", Echos n°5, pp. 12-24

A. Lehmam (1996c) Le résumé automatique à fragments indicateurs : un système d'aide au résumé humain, Actes du Colloque " Informatique et Langue Naturelle" I.N.L.'96, 9-10 octobre, Nantes, pp.355-373.

A. Lehmam (1996b) Construction d'un système de résumé automatique de textes de type scientifique et technique, Actes du Colloque "Rencontre des étudiants chercheurs en informatique pour le Traitement Automatique des Langues" RéciTAL'96, les 25, 26, 27 septembre 1996, Courcelles (Gif-sur-Yvette), Paris, pp.65-69.

A. Lehmam (1996a) Le système RAFI, Rapport de la journée "filtrage et résumé automatique de textes" organisée à Paris, le 13 mai 96, Secrétariat d'Etat à la Recherche : MENESR, Paris

A. Lehmam (1996) "Le résumé de texte automatique : des ambitions aux résultats actuels : le système RAFI", La Tribune des Industries de la Langue et de l'Information Électronique, Numéro Spécial: 20-21-22, pp.35-45, Juillet 1996, OFIL, Paris.

A. Lehmam (1995) Le résumé automatique de texte: réalisation d'un prototype procédant par extraction de phrases du texte source. Actes de la Première Rencontre des Jeunes Linguistes de France (Université du Littoral - Nord-Pas-de-Calais). Recueil de Recherches Linguistiques, Dunkerque, pp. 79-89.

 

En vous connectant sur http://www.pertinence.net/pin où PIN est testable gratuitement en ligne, il est offert à tout utilisateur, privé ou professionnel, de syndiquer (exporter des contenus) sur son site Internet et Intranet des fils d'information en multilingue, et ce, en trois clics de la souris, sans connaissances techniques préalables. Tout est automatisé de manière à ce que l'utilisateur puisse choisir le type de format d'export ; HTML, XML, RSS. De plus, tous les articles des fils d'information peuvent être résumés automatiquement avec Pertinence Summarizer.

Pertinence Information Network (PIN) est désormais doté d'un méta-moteur de recherche; Pertinence Meta Search (PMS).
PMS est un méta-moteur de recherche qui permet d'interroger les moteurs de recherche les plus populaires aux plus spécialisés et de filtrer les résultats à l'aide des opérateurs de pertinence propres à la technologie de traitement de l'information de Pertinence Mining.
Ces opérateurs de pertinence sont à utiliser en vue d'affiner au plus précis le filtrage d'une alerte (Newsalerte PIN) ou celui d'un fil d'info généré par PIN :

  • Le signe - (moins ou tiret) peut être utilisé en début de ligne pour exclure les documents qui contiennent le concept figurant sur cette ligne :
    -passage à tabac
  • Le signe + peut être utilisé en début de ligne pour indiquer que le concept figurant sur cette ligne doit obligatoirement apparaître dans les documents retenus :
    +tabac
  • Le signe / peut être utilisé après un concept pour indiquer un contexte dans lequel il doit être ignoré :
    pomme / pomme de terre / pomme d'Api / pomme de Reinette
    +tabac / passage à tabac / faire un tabac
  • Le signe | désigne l'opérateur OU
    pomme | poire | banane
     
  • La mise en forme dans le document (contexte structurel) peut être prise en compte dans le filtrage avec le séparateur ':' ou '\' :
    Le concept "pomme de terre" lorsqu'il apparaît dans un lien (balise HTML <a>) :
    a:pomme de terre
    Le concept "pomme de terre" lorsqu'il n'apparaît pas dans un lien (balise HTML <a>) :
    a\pomme de terre
    Le concept "veille" lorsqu'il apparaît en caractères gras (balise HTML <b>) :
    b:veille
    Le concept "veille" lorsqu'il n'apparaît pas en caractères gras (balise HTML <b>) :
    b\veille
    Remarque: les deux formes suivantes sont équivalentes :
    a\pomme de terre
    pomme de terre / a:pomme de terre

    Toute balise HTML peut être utilisée comme contexte structurel.
    Vous pouvez combiner ces opérateurs :
    +a\pomme / pomme de terre | h1:poire | banane / sac banane


La combinaison des opérateurs de pertinence, l'accès aux sources Web à travers Pertinence Meta Search (PMS) ainsi qu'à des milliers d'autres sources liées à l'actualité (extraits du Web par Pertinence News Extractor) par domaine permet à l'utilisateur de ne rien manquer de l'actualité qui concerne son centre d'intérêt même si celle-ci provient de forums de discussions, du web ou d'annuaires. Les moteurs de recherches, les News Group et les annuaires actuellement définis dans PMS sont (liste évolutive) :


Google - Web
Google - Groups
Google - News
Froogle
Lycos - News
Lycos - Web
MSN Search
Teoma
Yahoo - Directory
Yahoo - News
Yahoo - Web

 

Cont@ctpencil.gif (2430 octets)mail6.gif (291 octets)

Résumé automatique

Activités dans le domaine

automatic summarization