Dit stukje staat niet op de PyPI toelichting maar wel op de CBS site. Misschien handig om toe te voegen?
Bij het werken met grote datasets is het efficiënter om niet de gehele dataset, maar slechts een gedeelte op te halen. Een lijst van gewenste kolommen kan in de parameter select meegegeven worden aan get_data(). Rijen kunnen gefilterd worden met door de parameter filters volgens de vorm " eq " in te vullen. De namen en codes van de dimensies zijn te vinden in de metadata van een tabel. In het volgende voorbeeld wordt het aantal inwoners van de gemeente Amsterdam opgevraagd.
Downloaden van selectie van data
data = pd.DataFrame(
cbsodata.get_data('83765NED',
filters="WijkenEnBuurten eq 'GM0363 '",
select=['WijkenEnBuurten','AantalInwoners_5']))
print(data.head())
De output is een dataframe met slechts één rij en twee kolommen in plaats van de gehele tabel.
Dit stukje staat niet op de PyPI toelichting maar wel op de CBS site. Misschien handig om toe te voegen?
Bij het werken met grote datasets is het efficiënter om niet de gehele dataset, maar slechts een gedeelte op te halen. Een lijst van gewenste kolommen kan in de parameter select meegegeven worden aan get_data(). Rijen kunnen gefilterd worden met door de parameter filters volgens de vorm " eq " in te vullen. De namen en codes van de dimensies zijn te vinden in de metadata van een tabel. In het volgende voorbeeld wordt het aantal inwoners van de gemeente Amsterdam opgevraagd.
Downloaden van selectie van data
data = pd.DataFrame( cbsodata.get_data('83765NED', filters="WijkenEnBuurten eq 'GM0363 '", select=['WijkenEnBuurten','AantalInwoners_5'])) print(data.head()) De output is een dataframe met slechts één rij en twee kolommen in plaats van de gehele tabel.