en_USA_nytime_int

Du 01 octobre 2014 au 31 décembre 2014


Le média : Le Flux RSS :
NOM : The New York Times URL du site : http://www.nytimes.com
TYPE : quotidien CATEGORIE : International
PAYS : USA LANGUE : anglais

Statistiques sur les items “bruts” et dédoublonnés :


Items bruts : Items dédoublonnés : Doublon(s) :
Plus ancien item : 2014-10-01 Plus ancien item : 2014-10-01 Nb de doublons Titre : 1767
Plus récent item : 2014-12-31 Plus récent item : 2014-12-31 Nb de doublons Description : 2157
Total nombre de jour : 92 Total nombre de jour : 92 Doublons sur Titre et Description : 1267
Total d’items : 5871 Total d’items : 3214 Total des doublons supprimés : 2657
Minimum d’items (jours) : 21 Minimum d’items (jours) : 10 Item(s) unique(s) :
Maximum d’item (jours) : 109 Maximum d’items (jours) : 53 Nb d’items uniques : 1938
Moyenne d’items (jours) : 64 Moyenne d’items (jours) : 35
Ecart-type (jours) : 19 Ecart-type (jours) : 11 Rupture(s) :
Min d’items (semaine) : 213 Min d’items (semaine) : 111 Nb de jours sans items : 0
Max d’items (semaine) : 523 Max d’items (semaine) : 280 Nb de période de rupture : 0
Moyenne d’items (semaine) : 419 Moyenne d’items (semaine) : 230 Plus longue rupture (en jours) 0
Ecart-type (semaine) : 83 Ecart-type (semaine) : 43 Plus courte rupture (en jours) 0

Items bruts = tous les items stockés de la base de données durant la pèriode choisie.


Items dédoublonnés = Items bruts - Doublons.


Doublons = Item RSS dont le titre OU la description est identique à un(e) autre, dans un intervalle de temps de 7 jours.


Item Unique = Items pour lesquels au moins un doublon a été détecté et supprimé.


Ruptures journalières = Jours durant lesquels aucun item n’a été collecté. Elles sont soit “natuelles” soit “informatiques” (disfonctionnement de l’outil de collecte).



Nombre d’items “bruts” et dédoublonnés par jour

plot of chunk Items



Nombre de doublons détectés et supprimés

plot of chunk doublons



Moyenne mobile (7 jours) du nombre d’items “bruts” et dédoublonnés

plot of chunk MoyMobile



Cycle hebdomadaire des items “bruts”

Écart au nombre moyen d’items collectés par jour. Cycle calculé sur l’ensemble de la période, ruptures incluses

plot of chunk cycleHebdo1



Cycle hebdomadaire des items dédoublonnés

Écart au nombre moyen d’items collectés par jour. Cycle calculé sur l’ensemble de la période, ruptures incluses

plot of chunk cycleHebdo2



Contenu des items dédoublonnés :


Contenu du titre : Contenu de la description :
Nb de caractères min : 13 Nb de caractères min : 44
Nb de caractères max : 114 Nb de caractères max : 398
Nb de caractères moyen : 60 Nb de caractères moyen : 155
Nb de caractères médian : 59 Nb de caractères médian : 152
Ecart-type : 14 Ecart-type : 33
Nb Items sans titre : 0 Nb Items sans description : 0


Nombre de caractères dans le titre des items, par jour

plot of chunk titre



Nombre de caractères dans la descritpion des items, par jour

plot of chunk description



Résultat du taggage géographiques (dico Pays_Free_dico ) des items dédoublonnés :


Statistiques sur le Geotaggage
Nb de GeoTAG Total : 4234 Nb de GeoTAG Unique : 145
Part d’items taggés : 91.6 % Moyenne de répétition des TAGs detectés : 29.2
Moyenne du Nb de TAG par item : 1.3 Mediane de répétition des TAGs detectés : 8
Mediane du Nb de TAG par item : 1 Ecart-type des répétitions des TAGs detectés : 58
Ecart-type du Nb de TAG par item : 0.76 Minimum de répétitions des TAGs detectés : 1
Nb de TAG minimum par item : 0 Maximum de répétitions des TAGs detectés : 441
Nb de TAG maximum par item : 7
Moyenne du Nb de TAG par jour : 46 Moyenne du Nb de TAG par semaine : 302
Mediane du Nb de TAG par jour : 1 Mediane du Nb de TAG par semaine : 316
Ecart-type du Nb de TAG par jour : 15.2 Ecart-type du Nb de TAG par semaine : 62
Nb de TAG minimum par jour : 14 Nb de TAG minimum par semaine : 149
Nb de TAG maximum par jour : 78 Nb de TAG maximum par semaine :400

Items dédoublonnés = “items bruts - doublons”.


Items Geo-taggués. Il s’agit des items dans lesquels au moins un pays a été détécté automatiquement, en utilisant le ditionnaire " Pays_Free_dico “.



Nombre d’items geo-taggués sur l’ensemble des items dédoublonnés

plot of chunk itemsTag



Liste et nombre des TAGs (les 50 plus cités) géographiques détectés

plot of chunk PaysTag



TAGs géographiques détéctés (les 50 plus cités) dans le temps

plot of chunk heatmap1



Répartition géographique des TAGs détectés

plot of chunk carteTagCumul



Cooccurrences des TAGs geographiques (dico Pays_Free_dico ) :


Statistiques sur les Cooccurrences des TAGs Geographiques
Total des cooccurrences : 1594 Nb de cooccurrences Unique : 456
Part des items geo-taggés comportant des cooccurrences : 35.4 % Rrépétition moyenne des cooccurrences : 3.5
Nb de cooccurrences moyen : 1.5 Mediane de répétition des cooccurrences : 1
Nb de cooccurrences médian : 1 Ecart-type des répétitions des cooccurrences : 7.5
Ecart-type du Nb de cooccurrences : 1.47 Minimum de répétitions des cooccurrences : 1
Nb de cooccurrences minimum : 1 Maximum de répétitions des cooccurrences : 76
Nb de cooccurrences maximum : 21
Nb de cooccurrences moyen par jour : 17.3 Moyenne du Nb de cooccurrences par semaine : 114
Nb de cooccurrences médian par jour : 1 Mediane du Nb de cooccurrences par semaine : 106
Ecart-type du Nb de cooccurrences par jour : 9.4 Ecart-type du Nb de cooccurrences par semaine : 38
Minimum de cooccurrences par jour : 1 Nb de cooccurrences minimum par semaine : 71
Maximum de cooccurrences par jour : 48 Nb de cooccurrences maximum par semaine :201

Items Geo-taggués. Il s’agit des items dans lesquels au moins 1 pays a été détécté automatiquement, en utilisant le ditionnaire " Pays_Free_dico “.


Items co-taggués.Il s’agit des items dans lesquels au moins 2 pays ont été détéctés automatiquement, en utilisant le ditionnaire " Pays_Free_dico “.



Nombre d’items Geo-taggés comportant des cooccurrences

plot of chunk itemscoTag



Liste et nombre des cooccurrences de Geo-tags trouvés

plot of chunk PayscoTag



Coocurrence des TAGs géographiques détéctés (les 50 plus cités) dans le temps

plot of chunk heatmap2



Cocitations de pays - Graphe des flux dominants

Pays dominants. Le nombre total de co-citations est supérieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays intermediaires. Le nombre total de co-citations est supérieur ou inférieur au nombre total de co-citations de chaque pays avec lesquels il est co-cité


Pays Dominés. Le nombre total de co-citations est inférieur aux nombre total de co-citations de chaque pays avec lesquels il est co-cité


plot of chunk graphe1