Les données sont issues des recensements menés par l’US Bureau of Census (http://www.census.gov/). Les données des recensements de 1980, 1990 et 2000 ont été interpolées dans les mailles de 2010, par la firme GeoLytics, Inc (http://www.geolytics.com/). Elles sont disponibles au sein de la Neighborhood Change Database 1970-2010 (NCDB).
2 | 2 |
---|---|
3 | 5 |
Variable | 1980 | 1990 | 2000 | 2010 |
---|---|---|---|---|
Appartenance ethno-raciale (dans la population totale) | Race, Hispanic Origine and Breakdown B001 et B008, 1980 Decennial Census STF1 | Hispanic Origin by Race P12, 1990 Census STF1 | Hispanic by race, 2000 Census SF1 | Hispanic or Latino Origin by Race P5, 2010 Census SF1a |
Age (dans la population totale) | Sex by Age B011, 1980 Decennial Census STF1 | Age summary, 1990 Census STF1 | Sex by Age P8, 2000 Census SF1 | Sex by Age P12, 2010 Census SF1a |
Niveau d’éducation (dans la population de 25 ans et plus) | Years of School Completed 18+ C052, 1980 Decennial Census STF3 | Educational Attainment P057, 1990 Census STF3 | Sex by Educational Attainment P37, 2000 Census SF3 | 2012 American Community Survey: 5-Year Data |
Niveau de revenu (dans le total des ménages) | Household Income in 1979 C070, 1980 Decennial Census STF3 | Household Income in 1989, 1990 Census STF3 | Household Income in the Past 12 Months, 2000 Census SF3 | Household Income in the Past 12 Months, 2012 American Community Survey 5-Year Data |
Dans les tables issues des différents recensements, les données des quatre critères (appartenance ethno-raciale ([varrace]), âge ([varage]), niveau d’éducation ([vareduc]) et niveau de revenu ([varinc])) sont exprimées en effectifs de population ou de ménage, pour chaque unité spatiale, et pour un ensemble de sous-groupes : entre seulement 8 pour l’appartenance ethno-raciale à 24 pour l’âge. Les données ont été transformées en pourcentages du total de chaque population de référence, puis elles ont été regroupées au sein de catégories plus larges de population afin d’obtenir entre 4 et 5 groupes seulement par critère. Cette application propose 19 variables statistiques, comprises dans un ensemble de 4 critères dont la somme des sous-groupes en valeurs relatives correspond à la population de référence totale des unités spatiales.
Identifiant | Description |
---|---|
WHITEper | Pourcentage de Blancs non Hispaniques ou Latinos |
BLACKper | Pourcentage de Noirs non Hispaniques ou Latinos |
ASIANper | Pourcentage d’Asiatiques non Hispaniques ou Latinos |
OTHERper | Pourcentage des autres appartenances ethno-raciales non hispaniques ou Latinos : Indiens d’Amérique, Eskimos, Îliens du Pacifique, etc. |
HISPAper | Pourcentage d’Hispaniques ou Latinos |
Identifiant | Description |
---|---|
UNDER18per | Pourcentage de moins de 18 ans |
F18TO24per | Pourcentage de 18-24 ans |
F25TO44per | Pourcentage de 25-44 ans |
F45TO64per | Pourcentage de 45-64 ans |
MORE65per | Pourcentage de plus de 65 ans |
Identifiant | Description |
---|---|
NODIPLOMper | Pourcentage des non-diplômés |
F9TO12THper | Pourcentage de |
UNDERGRADper | Pourcentage |
GRADUATEper | Pourcentage des diplômés de niveau master et plus |
Identifiant | Description |
---|---|
F0T20per | Pourcentage de ménages entre 0 et 20 000 dollars par an |
F20TO40per | Pourcentage de ménages entre 0 et 20 000 dollars par an |
F40TO60per | Pourcentage de 25-44 ans |
F60TO80per | Pourcentage de 45-64 ans |
F80TO100per | Pourcentage de plus de 65 ans |
L’identification des discontinuités repose sur la mesure d’un différentiel sur un ou plusieurs attributs entre deux entités géographiques proches ou contigües. Les discontinuités renvoient à des phénomènes géophysiques (limite de l’arbre, limite terre-mer, etc.), mais aussi humains à travers la répartition différenciée des caractéristiques sociales, économiques, démographiques ou culturelles (limite urbain-rural, ségrégation sociale, etc.). Dans ce dernier cas, mesurer les discontinuités revient à calculer le niveau de dissemblance qui se réalise dans le voisinage d’une paire de lieux ou de territoires. L’identification des discontinuités nécessite ainsi au préalable un mesure de la proximité entre des couples de lieux, ou plus généralement un maillage dont les paires de mailles contigües sont séparées par un segment. Ainsi, plus le niveau de dissemblance sur un segment, entre deux unités spatiales contigües, est élevé, plus la discontinuité apparaît comme forte, mis à part toutes les réserves possibles sur l’hétérogénéité interne des mailles (Grasland, 1997). S’appliquant à des attributs statistiques, la mesure de la dissemblance nécessite l’usage d’une fonction de dissimilarité. Parmi les différentes fonctions existantes, le choix a été fait de se centrer sur une mesure simple de la différence absolue entre les mailles contigües.La fonction de dissimilarité, à ne pas confondre avec l’indice de dissimilarité utilisé dans le champ de la ségrégation, est la suivante : D = |x**i − x**j| Cet indice présente l’avantage de garder les ordres de grandeur sur des valeurs qui sont déjà exprimées en relatif et non en effectif. Par exemple, le passage sur un segment d’une population de 20% à 40% implique une discontinuité de 20%, incluant un rapport du simple au double entre ces deux voisins. Par contre, le passage de 1% à 2%, qui est également un doublement de la valeur sur le segment, ne correspond qu’à une discontinuité nettement moins forte de 1%.
Les données sont disponibles selon trois maillages, définis par l’US Bureau of Census :
-
Block : la plus petite maille géographique utilisée par le recensement, elle est délimitée selon les réseaux routiers et hydrologiques. Il existe plus de 11 millions de blocks aux Etats-Unis, dont XXXX sont dans les villes intermédiaires. Les blocks ont une population qui varie entre 0 et plusieurs centaines d’habitants suivant la morphologie du bâti.
-
Block Group : il s’agit d’un regroupement de blocks, qui compte en moyenne 800 habitants et dont l’étendue dépend de la densité. Il existe 217 740 block groups dans le pays, dont 40 738 composent les villes intermédiaires.
-
Census Tract : il s’agit d’un regroupement de 3 à 5 block groups, défini par les services du recensement selon un objectif d’homogénéité ethno-raciale. Cette maille compte généralement entre 1 200 et 8 000 habitants, avec une taille optimale de 4 000 personnes. Il existe 74 002 census tracts aux Etats-Unis, dont 13 480 composent les villes intermédiaires.
Villes | Block | Block group | Census tract |
---|---|---|---|
Ensemble | 40 778 | 13 480 | |
Austin | 0 | 967 | 350 |
Baltimore | 0 | 1 949 | 683 |
Charlotte | 0 | 1 367 | 539 |
Cincinnati | 0 | 1 548 | 498 |
Cleveland | 0 | 1 694 | 638 |
Columbus | 0 | 1 349 | 433 |
Denver | 0 | 1 797 | 621 |
Hartford | 0 | 884 | 290 |
Indianapolis | 0 | 1 178 | 397 |
Jacksonville | 0 | 705 | 262 |
Kansas City | 0 | 1 533 | 530 |
Las Vegas | 0 | 1 294 | 487 |
Memphis | 0 | 857 | 314 |
Milwaukee | 0 | 1 302 | 431 |
Nashville | 0 | 1 020 | 380 |
New Orleans | 0 | 1 110 | 405 |
Orlando | 0 | 834 | 390 |
Pittsburgh | 0 | 1 919 | 711 |
Portland | 0 | 1 421 | 491 |
Providence | 0 | 1 205 | 370 |
Raleigh | 0 | 569 | 224 |
Riverside | 0 | 2 122 | 822 |
Sacramento | 0 | 1 372 | 486 |
San Antonio | 0 | 1 990 | 457 |
San Diego | 0 | 1 335 | 628 |
Seattle | 0 | 1 795 | 721 |
St Louis | 0 | 2 493 | 615 |
Tampa | 0 | 2 017 | 746 |
Virginia Beach | 0 | 1 162 | 422 |
Villes | Block | Block group | Census tract |
---|---|---|---|
Ensemble | 0 | 107 866 | 37 814 |
Austin | 0 | 2 598 | 934 |
Baltimore | 0 | 4 947 | 1 709 |
Charlotte | 0 | 3 629 | 1 451 |
Cincinnati | 0 | 4 234 | 1 367 |
Cleveland | 0 | 4 564 | 1 681 |
Columbus | 0 | 3 653 | 1 181 |
Denver | 0 | 4 684 | 1 614 |
Hartford | 0 | 2 364 | 771 |
Indianapolis | 0 | 3 132 | 1 051 |
Jacksonville | 0 | 1 844 | 673 |
Kansas City | 0 | 3 901 | 1 393 |
Las Vegas | 0 | 3 361 | 1 246 |
Memphis | 0 | 2 228 | 835 |
Milwaukee | 0 | 3 460 | 1 123 |
Nashville | 0 | 2 748 | 1 040 |
New Orleans | 0 | 2 866 | 1 065 |
Orlando | 0 | 2 262 | 1 030 |
Pittsburgh | 0 | 5 290 | 2 006 |
Portland | 0 | 3 841 | 1 336 |
Providence | 0 | 3 079 | 916 |
Raleigh | 0 | 1 485 | 595 |
Riverside | 0 | 5 662 | 2 235 |
Sacramento | 0 | 3 597 | 1 277 |
San Antonio | 0 | 5 517 | 1 227 |
San Diego | 0 | 3 591 | 1 673 |
Seattle | 0 | 4 773 | 1 876 |
St Louis | 0 | 6 645 | 1 694 |
Tampa | 0 | 5 097 | 1 829 |
Virginia Beach | 0 | 2 814 | 986 |
Aux trois échelles disponibles, les valeurs de discontinuités sont calculées pour chaque couple d’unités spatiales contigües, c’est-à-dire sur les lignes qui forment les limites entre deux unités spatiales voisines. Ces segments ne renseignent en aucun cas la qualité physique de la séparation, et il peut s’agir d’une voie routière ou ferrée plus ou moins large, d’un cours d’eau ou d’un lac, d’un espace vert ou boisé, etc. Pour l’ensemble des villes intermédiaires, chaque unité spatiale comporte en moyenne XXX voisins (segments) par block, 2.6 segments par block group, et 2.8 segments par census tract [numobjects]. Les segments qui forment le contour des agglomérations ont été éliminés, ne donnant pas lieu à un voisinage intra-urbain. En outre, ces caractéristiques dépendent des formes urbaines d’une part, et des contextes d’urbanisation d’autre part. En effet, ces limites prennent très souvent appui sur le réseau routier, de telle sorte qu’un réseau en quadrillage de type Manhattan, et que l’on retrouve surtout dans les centre-villes, implique plutôt une moyenne à 4 voisins. Au contraire, les réseaux routiers plus périurbains entraînent un voisinage tendanciellement plus proche de 3 voire 2 segments. Ces différences internes à la ville se déclinent aussi entre les villes puisque certaines s’organisent selon des réseaux plutôt périurbains (par exemple Raleigh ou Austin), alors que d’autres ont des réseaux centraux plus étendus (par exemple Seattle ou Tampa).
Les fonds de cartes proviennent de ces deux organismes :
-
US Bureau of Census : http://www.census.gov/
-
The National Historical Geographic Information System (NHGIS) : https://www.nhgis.org/
Ceux-ci ont été en partie généralisés. Les fonds de carte servant à l’analyse des discontinuités ont été créés à partir ces mailles, de telle sorte à conserver la géométrie spatiale. Le système de coordonnées géographiques correspond à du NAD83 et les coordonnées projetées pour l’ensemble des villes sont en USA Contiguous Albers Equal Area Conic.
L’identification des villes intermédiaires a été réalisée au préalable dans le cadre de la recherche doctorale de Sylvestre Duroudier. L’application MUSIC s’appuie sur cette définition opératoire des villes intermédiaires (Duroudier, 2016) pour en proposer une exploration des formes socio-spatiales intra-urbaines. Cette définition considère les villes selon la délimitations des Core Based Statistical Areas réalisée par l’US Bureau of Census, mise à jour en 2013 d’après les données du recensement de 2010 par l’Office of Management and Budget. Une CBSA est constituée d’un ou plusieurs comtés, centraux ou périphériques. Ils sont définis comme centraux s’ils comptent au moins 5 000 habitants dans un urban core (au moins 10 000 habitants agglomérés avec une continuité du bâti), et définis comme périphériques si les navettes domicile-travail atteignent 25% (au moins 25% de la part de la population du comté périphérique qui travaille dans les comtés centraux, ou 25% de la part des emplois du comté périphérique occupés par des résidents des comtés centraux). Cette délimitation implique que les villes incluent dans leurs périmètres des espaces centraux et périurbains, ainsi que des zones rurales. L’identification de cette strate urbaine repose sur la notion d’intermédiarité, qui propose de compléter l’attribut moyen de ces villes par la prise en compte des fonctions d’intermédiation dont elles disposent et qui leurs confèrent un certain niveau de rayonnement dans la hiérarchie urbaine et dans leur environnement régional. Cette notion permet une définition opérationnelle des villes par la combinaison de critères de taille où les villes intermédiaires sont moins grandes, et des critères de fonction où les villes intermédiaires ne sont pas si petites. Le croisement de différents critères relevant de la taille et des fonctions urbaines, par des méthodes d’analyse de données, permet de distinguer un ensemble de 29 villes intermédiaires aux Etats-Unis. Celles-ci sont comprises entre 1,130 millions d’habitants à Raleigh et 3,44 millions d’habitants à Seattle.
Méthode :
-
Pour une ville = CAH ward euclidean
-
Pour plusieurs villes = kmeans euclidean
Idée 1 : vaste littérature sur la ségrégation Idée 2 : problème de l’approche intra-urbaine car indices souvent aspatiaux Idée 3 : mesures retenues : quotient de localisation, indice d’entropie, autres ? Avec équations.