Rata copiilor neinscrisi la scoala si dezvoltarea economica¶

Procesarea si Vizualizarea Datelor Folosind Python¶

Stefan-Daniel Wagner (164600)


1. Prezentarea problemei si motivatia¶

Accesul la educatie este unul dintre cei mai importanti indicatori de dezvoltare umana. Obiectivul de Dezvoltare Durabila nr. 4 (SDG 4) al ONU vizeaza asigurarea educatiei de calitate, incluzive si echitabile pentru toti pana in 2030.

Cu toate acestea, milioane de copii din intreaga lume raman in afara sistemului educational. Aceasta analiza investigheaza legatura dintre nivelul de dezvoltare economica al unei tari si rata copiilor neinscrisi la scoala, folosind date de la UNESCO si Banca Mondiala.

Ipoteza de lucru¶

Rata copiilor neinscrisi in scoli este mai ridicata in tarile cu nivel de dezvoltare economic mai scazut, iar aceasta rata scade in timp odata cu cresterea economica.

Sursa datelor¶

  • Rata copiilor neinscrisi la scoala (out-of-school rate, nivel primar) — UNESCO Institute for Statistics, via Our World in Data
  • PIB per capita (GDP per capita, PPP, dolari internationali constanti 2021) — World Bank, via Our World in Data

Variabile principale¶

Variabila Tip Sursa
Rata out-of-school (nivel primar, ambele sexe) Dependenta UNESCO
PIB per capita (PPP) Independenta World Bank
Regiune geografica Categoriala OWID

2. Planul de lucru¶

  1. Import si curatare date — descarcare CSV-uri de la OWID, merge pe tara + an, filtrare valori lipsa
  2. Analiza exploratorie — statistici descriptive, distributii pe regiuni
  3. Vizualizare (6 grafice, fiecare raspunde la o intrebare concreta):
    • Unde e problema? — Harta mondiala
    • Cat de grava e situatia per regiune? — Box plot pe regiuni
    • Care sunt tarile cele mai afectate? — Top tari
    • Exista legatura cu bogatia? — Scatter PIB vs. rata OOS
    • Se imbunatateste situatia? — Evolutie in timp pe regiuni
    • Cat de mult s-a schimbat in 20 de ani? — Comparatie prima vs. ultima masurare
  4. Analiza statistica — corelatie Pearson/Spearman, curba LOWESS
  5. Interpretare si concluzii

3. Implementare¶

3.1 Import librarii si descarcare date¶

Educatie (primar): (5400, 4)
PIB per capita:    (7240, 5)
Dataset combinat: (3793, 6)
Tari unice: 196
Perioada: 1990 – 2024
Regiuni: ['Africa', 'Asia', 'Europe', 'North America', 'Oceania', 'South America']
Entity Code Year oos_rate gdp_pc region
0 Albania ALB 1999 3.06716 6086.0090 Europe
1 Albania ALB 2003 1.33887 8025.2812 Europe
2 Albania ALB 2004 3.56275 8483.2940 Europe
3 Albania ALB 2008 6.73451 11056.3520 Europe
4 Albania ALB 2009 5.63091 11430.6220 Europe

3.2 Statistici descriptive¶

oos_rate gdp_pc
count 3793.00 3793.00
mean 9.60 24195.27
std 13.54 25013.16
min 0.00 510.82
25% 1.28 5760.80
50% 4.42 14853.67
75% 11.05 36563.62
max 79.78 174569.52
nr_tari oos_mediana oos_medie gdp_mediana
region
Africa 49 13.16 17.64 3738.81
North America 29 5.26 9.11 25056.49
South America 11 4.16 6.91 18458.72
Asia 46 3.82 6.14 15802.22
Oceania 14 2.57 6.22 6983.64
Europe 42 1.47 3.06 47650.01

Regiunile cu PIB per capita mai mic au rate out-of-school mai ridicate. Africa si Asia se remarca cu cele mai mari valori.

3.3 Vizualizari¶

Grafic 1 — Unde e problema? Harta mondiala¶

No description has been provided for this image

Harta releva o concentrare clara a ratelor ridicate in Africa si parti din Asia, in timp ce Europa, America de Nord si Asia de Est au rate aproape de zero. Distributia geografica reflecta nivelul de dezvoltare economica.

Grafic 2 — Cat de grava e situatia per regiune? Box plot¶

No description has been provided for this image

Africa are atat mediana cea mai ridicata, cat si cea mai mare variabilitate — exista tari cu rate de peste 50%, dar si tari africane cu rate apropiate de zero. Europa si America de Nord sunt concentrate aproape de zero, cu exceptii rare. Fiecare punct reprezinta o tara, astfel incat se vede si distributia reala, nu doar cutia.

Grafic 3 — Care sunt tarile cele mai afectate? Top 15¶

No description has been provided for this image

Contrastul este de doua ordine de marime: tarile cele mai afectate au rate de zeci de procente, in timp ce tarile cu cele mai mici rate au valori sub 1%. Tarile cu rate ridicate sunt predominant din Africa, cele cu rate mici din Europa si Asia de Est.

Grafic 4 — Exista legatura cu bogatia? Scatter + LOWESS¶

No description has been provided for this image

Acesta este graficul central al analizei. Se observa o relatie negativa clara: tarile mai bogate au rate mai mici de copii neinscrisi. Curba LOWESS (o tehnica non-parametrica ce nu presupune o forma predefinita) arata ca relatia nu e pur liniara — efectul PIB-ului este cel mai puternic in tarile sarace, iar dupa un prag de ~$10.000 per capita, rata se stabilizeaza aproape de zero.

Etichetele marcheaza cateva exceptii interesante: tari sarace care reusesc sa mentina rate scazute (sugerand politici educationale eficiente) si tari relativ bogate cu rate surprinzator de mari.

Grafic 5 — Se imbunatateste situatia? Evolutie in timp¶

No description has been provided for this image

Trend descendent in toate regiunile — progres global real in inscrierea copiilor la scoala. Totusi, decalajul ramane enorm: Africa porneste de la rate mult mai mari si, desi scade, ramane cu mult in urma celorlalte regiuni.

Grafic 6 — Cat de mult s-a schimbat in 20 de ani? Dumbbell chart¶

No description has been provided for this image

Dumbbell chart-ul arata progresul concret: in fiecare regiune, punctul verde (ultima masurare) este la stanga punctului rosu (prima masurare), ceea ce inseamna ca ratele au scazut peste tot. Africa a facut cel mai mare progres in valoare absoluta, dar ramane la cel mai ridicat nivel. Europa si America de Nord au ajuns aproape de eliminarea completa a problemei.

3.4 Analiza statistica¶

=======================================================
CORELATIA: PIB per capita vs. Rata out-of-school
=======================================================

Pearson  (log GDP vs OOS):  r = -0.485,  p = 6.22e-13
Spearman (GDP vs OOS):     rho = -0.477,  p = 1.49e-12

R² = 0.235
  → log(PIB per capita) explica 23.5% din varianta ratei OOS

Numar de tari: 196

Concluzie: Corelatia este moderat negativa si semnificativa statistic (p < 0.001).

Ambele teste — Pearson (parametric, pe log-GDP) si Spearman (non-parametric) — confirma o corelatie negativa semnificativa. Coeficientul Spearman este mai mare decat Pearson, ceea ce este consistent cu o relatie neliniara (asa cum sugereaza si curba LOWESS din graficul 4).

4. Interpretarea rezultatelor¶

Ipoteza 1: Rata OOS este mai mare in tarile mai sarace¶

Confirmata. Corelatia negativa dintre log(PIB per capita) si rata out-of-school este semnificativa statistic. Curba LOWESS arata ca relatia este neliniara — efectul cresterii economice e cel mai puternic in tarile sarace, iar dupa un prag de ~$10.000/capita, rata se stabilizeaza aproape de zero.

Ipoteza 2: Rata scade in timp odata cu dezvoltarea economica¶

Confirmata. Toate regiunile inregistreaza un trend descendent in rata OOS. Dumbbell chart-ul confirma progresul concret: fiecare regiune are o rata mai mica la ultima masurare decat la prima. Africa a facut cel mai mare progres absolut, dar ramane cea mai afectata regiune.

Exceptii notabile¶

  • Unele tari cu PIB scazut au rate OOS surprinzator de mici — sugerand ca politicile publice pot compensa partial dezavantajul economic
  • Unele tari cu resurse mai mari nu au eliminat complet problema — bogatia singura nu garanteaza acces universal la educatie

Limitari¶

  • Datele UNESCO nu sunt disponibile pentru toti anii si toate tarile, ceea ce poate introduce bias
  • Corelatie ≠ cauzalitate: PIB-ul este un proxy pentru alti factori (infrastructura, stabilitate politica, investitii in educatie)
  • Rata OOS nu surprinde calitatea educatiei sau abandonul scolar ulterior

5. Concluzii¶

Analiza a confirmat ambele ipoteze de lucru:

  1. Exista o legatura puternica intre dezvoltarea economica si accesul la educatie. Tarile cu PIB per capita mai ridicat au rate semnificativ mai mici de copii neinscrisi la scoala primara. Relatia este neliniara — cresterea economica are cel mai mare impact in tarile cele mai sarace.

  2. Situatia se imbunatateste in timp, in toate regiunile lumii. Decalajele raman insa mari — Africa continua sa fie cea mai afectata, desi progresul absolut este semnificativ.

Rezultatele subliniaza importanta investitiilor in educatie ca parte a strategiilor de dezvoltare, dar si faptul ca politicile publice conteaza — exista tari sarace care reusesc sa mentina rate scazute prin eforturi tintite.

Directii viitoare¶

  • Analiza pe niveluri de educatie (secundar vs. primar) pentru a vedea unde se pierd cei mai multi copii
  • Includerea altor indicatori (cheltuieli publice cu educatia, rata de urbanizare)
  • Analiza cauzala (panel data, diferente-in-diferente) pentru a separa efectul politicilor de cel al cresterii economice