Databehandling og -analyse med Python og OpenRefine#

En praktisk innføring for humanister og samfunnsvitere

Velkommen!#

Laget av David Massey, Michael Preminger, og Camilla Holm Soelseth / Publisert som JupyterBook

Denne websiden er en Open Access digital lærebok utformet som en praktisk og interaktiv guide til det å jobbe med data i kultur- og informasjonsforvaltning, og humanistisk og samfunnsvitenskaplig forskning. Boken en introduksjon til programmeringsspråket Python (og noen utvalgte databehandlingspakker) samt databehandlingsprogrammet OpenRefine. Læreboka er særlig rettet mot studenter og forskere i humaniora og samfunnsvitenskap som jobber med data fra nettet, eller data fra arkiv, bibliotek, museer og andre lignende samlinger.

Boka tar deg med fra A – Å i det å innhente, behandle og analysere data. Boken egner seg særlig for de som ønsker å studere kultur (i bred forstand) og digitale eller digitaliserte materialer (som eksisterer som data).

Ved bruk av Python vil du her lære å samle, lese, lagre og behandle data. Ved bruk av OpenRefine vil du lære å vaske data og gjøre klart datasett for videre analyser. Videre vil du lære å analysere datasett med bruk av databehandlingspakken Pandas. Til sist vil du lære å ta i bruk databehandlingspakken Plotly for å visualisere. Med unntak av OpenRefine vil alt skje i det populære brukergrensesnittet Jupyter Notebooks.

Oppbygning#

Del I gir en kort introduksjon til hvordan installere og ta i bruk det du trenger. Del II av boken lærer deg det grunnleggende om programmeringsspråket Python, mens del III går nærmere inn på hvordan behandle kultur og informasjon som data og datasett. Her får du en innføring i det å forholde deg til og jobbe med det datasett for å gjøre enkle deskriptive analyser og visualiseringer, samt det å foreta utvalg og lage nye datasett for mer spesifikke analyser.

Del IV vil ta for seg innhenting og scraping av data og vil være ferdig høsten 2024.

Kontakt oss#

Kontaktpunkt er Camilla Holm Soelseth, som kan kontaktes på: camil @ oslomet.no

Hvordan sitere denne boka#

Massey, D., Preminger, M., & Soelseth, C. H. (2024). Databehandling og -analyse med Python og OpenRefine (1.0). Zenodo. https://doi.org/10.5281/zenodo.13329396

Del 5: Call for Chapters#

Her vil det komme informasjon om del V av boken, høsten 2024. Del 5 vil bestå av mer spesifikke og avanserte analysemetoder, og vi vil oppfordre interesserte til å sende inn bidrag gjennom en call for chapters i september 2024.

Takk#

Versjon 1.0 har vært testet av professor Nina Lager Vestberg, informatiker Trym Bremnes, informasjonsviter Karoline Kornkveen Hoff, og humanist Andrea Dale Wefring. Vi takker enormt mye for tilbakemeldingene dere ga oss, som vi ha inkorporert på best mulig måte for å gjøre denne læreboka så bra som mulig!