|
Entités nommées dans Le Monde: Un algorithme de résolution de la coréférence dans un corpus journalistique français
|
(Buch) |
Dieser Artikel gilt, aufgrund seiner Grösse, beim Versand als 2 Artikel!
Inhalt: |
La résolution de la coréférence est une question importante en TAL et ses applications dans le domaine sont nombreuses, allant de la traduction automatique à l'extraction d'informations. Ces dernières années, les nombreux travaux dans le domaine ont souvent favorisé des approches probabilistes par classification automatique. Or, des données recueillies dans un corpus d'articles du journal Le Monde, présentées dans cet ouvrage, montrent que la catégorie des expressions référentielles est liée à leur distribution dans les chaînes de coréférence, et aussi que dans certains cas des méthodes propres aux approches symboliques donnent de meilleurs résultats. L'analyse de ces données mène à définir un algorithme de résolution hybride, basé sur l'utilisation de plusieurs classifieurs mais intégrant aussi des éléments plus symboliques. On propose également une méthode originale d'évaluation pour la tâche de résolution de la coréférence, basée sur l'indice de Rand, et qui tient compte de la nature particulière de l'objet à mesurer (i.e. les chaînes de coréférence). |
|