Vous êtes ici : Accueil › Recherche
› RECHERCHER
Titre
Auteur
Mot-clé
Année avant
Année après
Plus d'options

› AFFINER

› RESULTATS DE LA RECHERCHE  
78 résultats › Tri  › Par 
collection_x
Source : Hypotheses.org

Hadoop and Giraph Installation (Step by Step)

Benkoussas, Chahinez (2 oct. 2014)

One of the text-mining sub-projects aims to develop Recommender System for the OpenEdition Platforms. We use graph structure to store OpenEdition documents. Each node represents document (article, book, review, …) and each edge represents a specific relation between two documents (citation, ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Rencontrer Bilbo en 2012

Faath, Élodie (17 avr. 2012)

Plusieurs présentations et démonstrations de Bilbo sont prévues pour cette année : CORIA 2012 (COnférence en Recherche d'Information et Applications) qui s'est tenue les 21, 22 et 23 mars à Bordeaux ((programme disponible ici : http://cifed-coria2012.labri.fr/programme.php)) les 19 et 20 ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Upper bound of annotation with proper noun features

Kim, Young-Min (27 janv. 2012)

An idea, which naturally stuck us, is to try out learning a model with a complete proper noun feature set for each strategy. It will give us an objective upper bound on the annotation performance. And from the expected upper bounds, we can decide which strategy is preferable that the others.  The ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Proper noun features on corpus level 1

Kim, Young-Min (4 oct. 2011)

This part of experiments constitutes the use of external proper noun lists. To overcome the miss-annotation between people name and place, we think of using a set of proper noun lists. People name and country lists are provided by the Revues.org article collection and place list is completed from ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Revision to the learning and test data (corpus level 1)

Kim, Young-Min (29 juin 2011)

Our corpus follows the TEI guidelines. That is, its structure is not perfectly adapted to the task of reference field identification. Taking into account the reusing of Revues.org corpus, we decided to follow TEI guidelines rather than construct an optimized corpus for reference field identification ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

TEI et étiquetage des références bibliographiques

Faath, Élodie (9 mai 2011)

TEI ou Encoding Initiative est un langage XML permettant la description et l'échange de textes numériques, et dans notre cas, celle des références bibliographiques. Trois niveaux de description sont possibles avec ce langage : qui regroupe tous les éléments bibliographiques. ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Machine Learning and Text Mining for Retrieving Reviews of Books

Faath, Élodie (20 nov. 2013)

[Ce billet est co-écrit par Chahinez Benkoussas (LSIS-OpenEdition), Hussam Hamdan (LSIS-LIF-OpenEdition), Patrice Bellot (LSIS-OpenEdition), Élodie Faath (OpenEdition), Marin Dacos (OpenEdition), Frédéric Béchet (LIF)] Introduction In the social science and humanities, book reviews are an ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

About the robustness of Bilbo

Ollagnier, Anaïs (3 nov. 2014)

In this post, we will first try to see the impact of training set's nature on the performance of automatic annotation. Secondly, we will try to see how well our system handles multilingual documents. All experiments are based on 10 fold cross-validation, we used the set of feature in this previous ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Évaluation de Bilbo : vérifier l'annotation du résultat d'estimation - Partie 1

Faath, Élodie (8 juil. 2011)

Pour cette première phase d'évaluation, nous allons vérifier comment le modèle CRF développé sur le premier corpus a annoté les références bibliographiques. Nous pouvons d'abord observer que les éléments ayant permis l'annotation des références ont été simplifiés pour l'apprentissage ...

Voir plus d'informations | Voir la fiche de la ressource

Source : Hypotheses.org

Proper noun features III (corpus 1)

Kim, Young-Min (26 janv. 2012)

We extract seven different learning sets according to the defined strategies in the previous post. Several important fields are selected for the comparison including the surname, forename and place fields that are our main concern here. First, we compare the baseline model and the strategy S1, which ...

Voir plus d'informations | Voir la fiche de la ressource