figshare
Browse

Classificação por trajetórias produtivas — Assentamento Três Rios e entorno (Rio Maria/PA) — Censo 2017 × MapBiomas C9 — v2 / Productive-trajectory classification — Três Rios Settlement and surroundings (Rio Maria, Pará) — Census 2017 × MapBiomas C9 — v2

Version 2 2025-10-06, 16:14
Version 1 2025-10-06, 16:10
dataset
posted on 2025-10-06, 16:14 authored by Maurilio MonteiroMaurilio Monteiro, Regiane Paracampos SilvaRegiane Paracampos Silva
<p dir="ltr"><b>Português</b> — <b>English</b></p><p dir="ltr">Descrição <b>— Português</b></p><p dir="ltr"><b>Conteúdo do dataset</b><br>Este CSV reúne, para cada polígono do CAR no entorno do Assentamento <b>Três Rios</b> (Rio Maria, Pará, região de Carajás), (i) a <b>composição de uso e cobertura da terra</b> (grupos do MapBiomas) e (ii) a <b>classe de trajetória tecnológica</b> atribuída por um procedimento em <b>três etapas</b>:</p><p><br></p><ol><li><b>Supressão de sobreposições do CAR (pré-processamento):</b> entre os polígonos extraídos do CAR (2024), foram eliminados aqueles <b>sobrepostos em ≥ 15%</b> da área do <b>menor</b> polígono. Critério de manutenção: <b>preservar o polígono que contém o ponto de coordenada geográfica</b> do estabelecimento constante no <b>Register of Establishments Enumerated in the 2017 Agricultural Census</b> (IBGE, 2019a).</li><li><b>Otimização com cotas (MILP/ILP; CBC/PuLP):</b> o vetor de composição <b>vec2</b> de cada polígono é associado aos <b>centróides tecnológicos</b> estimados a partir de uma matriz de referência para a região de Carajás (Monteiro & Silva, 2023; derivada do Censo Agropecuário 2017 — IBGE, 2019b–d), <b>reproduzindo as proporções empíricas por V4×V5</b> (“bandas ótimas”).</li><li><b>Filtro empírico (v2, pós-processamento):</b> regras simples sobre componentes de <b>vec2</b> (limiares ≤ 0,01) <b>reclassificam casos de fronteira</b> para <b>7 → TPOT (Patronal — Outro Tipo)</b> ou <b>8 → TCOT (Camponesa — Outro Tipo)</b>. Este arquivo corresponde à <b>classificação final</b> (após o filtro).</li></ol><p dir="ltr"><b>Cobertura geográfica e temporal</b></p><ul><li>Localização: entorno do Assentamento <b>Três Rios</b>, município de <b>Rio Maria (PA)</b>, região de <b>Carajás</b>, Amazônia.</li><li>Base de uso do solo: <b>MapBiomas Coleção 9 (1985–2023)</b>; as classes foram <b>agrupadas</b> para compor as variáveis de composição (MapBiomas, 2024).</li><li>Trajetórias tecnológicas (referência): <b>ano-base 2017</b>, a partir de Monteiro & Silva (2023), derivado do <b>Censo Agropecuário 2017</b> (IBGE, 2019b–d).</li><li>Relação com a grade climática: o assentamento situa-se em célula de <b>alta resolução do HadGEM3-GC31-HM (HighResMIP hist-1950)</b> do Met Office Hadley Centre no <b>CMIP6</b>; o polígono analisado <b>corresponde ao recorte da grade</b>, útil para integração com saídas climáticas (ESGF; Roberts et al., 2019). <b>Este dataset foca uso/cobertura e classificação tecnológica</b>, não variáveis climáticas.</li></ul><p dir="ltr"><b>Formato do arquivo</b></p><ul><li>Arquivo: <code>CAR_UsoSolo_clas_crivo.csv</code> (<b>final</b>, após o filtro empírico)</li><li>Delimitador: <code>;</code> (ponto e vírgula)</li><li>Codificação: <b>UTF-8</b></li><li>Observação: cada <b>linha</b> representa um <b>polígono</b> do CAR dentro do recorte estudado.</li></ul><p dir="ltr"><b>Principais campos (colunas típicas)</b></p><ul><li><b>Identificação e atributos:</b> <code>cod_imovel</code>, <code>nom_imovel</code>, <code>nom_munici</code>, <code>OBJECTID</code>, <code>ind_status</code>, <code>ind_tipo_i</code>, <code>num_area_i</code>, <code>CAR_3Rios</code>.</li><li><b>Composição MapBiomas (exemplos):</b> prefixos como <code>F3_</code>, <code>F4_</code>, <code>F6_</code>, <code>F11_</code>, <code>F12_</code>, <code>F15_</code>, <code>F21_</code>, <code>F24_</code>, <code>F25_</code>, <code>F29_</code>, <code>F33_</code>, <code>F39_</code>, <code>F41_</code> (p. ex., <code>F3_F_Flore</code>, <code>F15_Past</code>, <code>F12_F_Camp</code>, <code>F21_Mosa</code>, <code>F41_O__Lav</code>, <code>F29_Roch</code>, <code>F25_N__veg</code>, <code>F6_Fl_Alag</code>, <code>F11_F_Campo</code>). Representam <b>proporções</b> (0–1) de grupos MapBiomas no polígono.</li><li><b>Sumários em nível de grade (quando presentes):</b> <code>grid_3</code>, <code>grid_21</code>, <code>grid_41</code>, <code>grid_29</code>, <code>grid_25</code>, <code>grid_6</code>, <code>grid_39</code>, <code>grid_24</code>, <code>grid_33</code>, <code>grid_11</code>.</li><li><b>Classificação e controles:</b></li><li><ul><li><code>V4</code> = estrato/grupo utilizado nas <b>cotas</b> da otimização;</li><li><code>V5</code> = <b>código final da trajetória tecnológica</b> (após o filtro): <code>1 TPPB</code>, <code>2 TPCT</code>, <code>3 TPCP</code>, <code>4 TCPB</code>, <code>5 TCCT</code>, <code>6 TCCP</code>, <code><strong>7 TPOT</strong></code>, <code><strong>8 TCOT</strong></code>;</li><li><code>CK</code> = chave interna de controle/checagem do pipeline.</li></ul></li><li>Observação: o significado dos nomes das colunas segue o script e pode ser consultado no arquivo <b>“dicionario.csv”</b> (anexo).</li></ul><p dir="ltr"><b>Uso pretendido e integração</b></p><ul><li>Análises espaciais de <b>trajetórias produtivas</b> no entorno de assentamentos.</li><li>Integração com o <b>Register of Establishments Enumerated in the 2017 Agricultural Census</b> (IBGE, 2019a).</li><li>Integração com camadas do <b>MapBiomas</b> e com a <b>grade CMIP6</b> (uso da terra × padrões tecnológicos × clima).</li><li>Insumo para <b>diagnósticos regionais</b>, <b>planejamento</b> e <b>pesquisas reprodutíveis</b>.</li></ul><p dir="ltr"><b>Qualidade, limites e reprodutibilidade</b></p><ul><li><b>Cotas:</b> com <code>tolerance = 0.00</code>, as proporções por <b>V4×V5</b> reproduzem o empírico; ajustar a tolerância se o recorte local divergir da referência.</li><li><b>Filtro heurístico:</b> as regras v2 são <b>conservadoras</b> e <b>documentadas no código</b>; criam as classes <b>7/8</b> para casos “outro tipo”.</li><li><b>Proveniência:</b> este arquivo é o <b>pós-filtro</b> do pipeline; agrupamentos e normalizações estão explicitados no script.</li><li><b>Rastreabilidade:</b> ver também o relatório <code><strong>Relatorio_Final_V4_V5.csv</strong></code> gerado no mesmo processamento.</li></ul><p dir="ltr"><b>Como citar</b><br>Monteiro & Silva (2025). <b>Classificação por trajetórias produtivas</b> (Assentamento Três Rios, Rio Maria/PA). CSV gerado com <code>carajas_trajectory_classifier_v2_empirical_filter.py</code>.</p><p><br></p><p dir="ltr"><b>Description — English</b></p><p dir="ltr"><b>Dataset contents</b><br>This CSV compiles, for each CAR polygon within the <b>Três Rios</b> Settlement buffer (Rio Maria, Pará, Carajás region), (i) the <b>land-use/land-cover composition</b> (MapBiomas grouped classes) and (ii) the <b>technological trajectory class</b> assigned by a <b>three-step</b> procedure:</p><p><br></p><p dir="ltr"><br></p><ol><li><b>Removal of overlapping CAR polygons (pre-processing):</b> among polygons extracted from CAR (2024), those <b>overlapping by ≥ 15%</b> of the <b>smaller</b> polygon’s area were removed. Retention rule: <b>keep the polygon that contains the geographic coordinate point</b> of the establishment listed in the <b>Register of Establishments Enumerated in the 2017 Agricultural Census</b> (IBGE, 2019a).</li><li><b>Quota-constrained optimization (MILP/ILP; CBC/PuLP):</b> each polygon’s composition vector <b>vec2</b> is matched to <b>technological centroids</b> estimated from a Carajás reference matrix (Monteiro & Silva, 2023; derived from the <b>2017 Agricultural Census</b> — IBGE, 2019b–d), <b>reproducing empirical V4×V5 proportions</b> (“optimal bands”).</li><li><b>Empirical filter (v2, post-processing):</b> simple rules on <b>vec2</b> components (thresholds ≤ 0.01) <b>reclassify borderline cases</b> to <b>7 → TPOT (Patronal — Other Type)</b> or <b>8 → TCOT (Camponesa — Other Type)</b>. This file corresponds to the <b>final classification</b> (after the filter).</li></ol><p dir="ltr"><b>Geographic and temporal coverage</b></p><ul><li>Location: buffer around the <b>Três Rios</b> Settlement, municipality of <b>Rio Maria (PA)</b>, <b>Carajás</b> region, Amazonia.</li><li>Land-use base: <b>MapBiomas Collection 9 (1985–2023)</b>; classes were <b>grouped</b> to build the composition variables (MapBiomas, 2024).</li><li>Technological trajectories (reference): <b>base year 2017</b>, from Monteiro & Silva (2023), derived from the <b>2017 Agricultural Census</b> (IBGE, 2019b–d).</li><li>Relation to the climate model grid: the settlement lies within a <b>high-resolution HadGEM3-GC31-HM (HighResMIP hist-1950)</b> cell (Met Office Hadley Centre, <b>CMIP6</b>); the analyzed polygon <b>corresponds to that grid footprint</b>, enabling integration with climate outputs (ESGF; Roberts et al., 2019). <b>This dataset focuses on land-use/land-cover and technological classification</b>, not on climate variables.</li></ul><p dir="ltr"><b>File format</b></p><ul><li>File: <code>CAR_UsoSolo_clas_crivo.csv</code> (<b>final</b>, after the empirical filter)</li><li>Delimiter: <code>;</code> (semicolon)</li><li>Encoding: <b>UTF-8</b></li><li>Note: each <b>row</b> represents one <b>CAR polygon</b> within the study extent.</li></ul><p dir="ltr"><b>Key fields (typical columns)</b></p><ul><li><b>Identification and attributes:</b> <code>cod_imovel</code>, <code>nom_imovel</code>, <code>nom_munici</code>, <code>OBJECTID</code>, <code>ind_status</code>, <code>ind_tipo_i</code>, <code>num_area_i</code>, <code>CAR_3Rios</code>.</li><li><b>MapBiomas composition (examples):</b> prefixes such as <code>F3_</code>, <code>F4_</code>, <code>F6_</code>, <code>F11_</code>, <code>F12_</code>, <code>F15_</code>, <code>F21_</code>, <code>F24_</code>, <code>F25_</code>, <code>F29_</code>, <code>F33_</code>, <code>F39_</code>, <code>F41_</code> (e.g., <code>F3_F_Flore</code>, <code>F15_Past</code>, <code>F12_F_Camp</code>, <code>F21_Mosa</code>, <code>F41_O__Lav</code>, <code>F29_Roch</code>, <code>F25_N__veg</code>, <code>F6_Fl_Alag</code>, <code>F11_F_Campo</code>). These represent <b>proportions</b> (0–1) of MapBiomas grouped classes within the polygon.</li><li><b>Grid-level summaries (when present):</b> <code>grid_3</code>, <code>grid_21</code>, <code>grid_41</code>, <code>grid_29</code>, <code>grid_25</code>, <code>grid_6</code>, <code>grid_39</code>, <code>grid_24</code>, <code>grid_33</code>, <code>grid_11</code>.</li><li><b>Classification and controls:</b></li><li><ul><li><code>V4</code> = stratum/group used for <b>quota</b> enforcement in the optimization;</li><li><code>V5</code> = <b>final technological trajectory code</b> (after the filter): <code>1 TPPB</code>, <code>2 TPCT</code>, <code>3 TPCP</code>, <code>4 TCPB</code>, <code>5 TCCT</code>, <code>6 TCCP</code>, <code><strong>7 TPOT</strong></code>, <code><strong>8 TCOT</strong></code>;</li><li><code>CK</code> = internal pipeline check/consistency key.</li></ul></li><li>Note: column name meanings follow the script and can be found in the attached <b>“dicionario.csv”</b> (data dictionary).</li></ul><p dir="ltr"><b>Intended use and integration</b></p><ul><li>Spatial analyses of <b>productive trajectories</b> in settlement buffers.</li><li>Integration with the <b>Register of Establishments Enumerated in the 2017 Agricultural Census</b> (IBGE, 2019a).</li><li>Integration with <b>MapBiomas</b> layers and with the <b>CMIP6</b> grid (land-use × technological patterns × climate).</li><li>Input for <b>regional diagnostics</b>, <b>planning</b>, and <b>reproducible research</b>.</li></ul><p dir="ltr"><b>Quality, limits, and reproducibility</b></p><ul><li><b>Quotas:</b> with <code>tolerance = 0.00</code>, <b>V4×V5</b> proportions reproduce the empirical reference; adjust tolerance if the local extent diverges from the reference.</li><li><b>Heuristic filter:</b> v2 rules are <b>conservative</b> and <b>documented in the code</b>; they create <b>7/8</b> classes for “other-type” cases.</li><li><b>Provenance:</b> this file is the <b>post-filter</b> output of the pipeline; groupings and normalizations are explicitly coded in the script.</li><li><b>Traceability:</b> see also the <code><strong>Relatorio_Final_V4_V5.csv</strong></code> report generated by the same workflow.</li></ul><p dir="ltr"><b>How to cite</b><br>Monteiro & Silva (2025). <b>Productive-trajectory classification</b> (Três Rios Settlement, Rio Maria/PA). CSV generated with <code>carajas_trajectory_classifier_v2_empirical_filter.py</code>.</p><p dir="ltr"><br></p>

Funding

Government of the State of Pará and SECTET-PA, support under Funding Agreement no. 023/2021—SECTET/UNIFESSPA/FADESP.

History