In questo articolo vedremo alcuni esempi di codici “famosi”, introdurremo il concetto di banca dati, definiremo cosa si intende per open data.

Come abbiamo visto nel nostro articolo introduttivo sull’information literacy, le informazioni in Internet sono informazioni

  • non strutturate,
  • non complete,
  • non verificate,
  • non definitive.

Non è un problema nuovo per l’umanità, solamente che un tempo la questione toccava un numero molto limitato di persone, mentre oggi ci riguarda tutti.

Per passare dalle informazioni non strutturate a quelle strutturate (considerando la gestione dell’informazione come risorsa, di cui parliamo nell’articolo informazione: una introduzione) si è provato innanzitutto a catalogare l’informazione.

La catalogazione/classificazione delle informazioni prescinde l’automazione della stessa, così come gli archivi esistevano prima dell’introduzione dell’informatica per semplificarne la gestione.

Un esempio di schema di classificazione del XIX secolo: la classificazione Dewey per le conoscenze, utilizzata ancora in molte biblioteche.
Un esempio di schema di classificazione del XX secolo: la classificazione ATECO contiene i codici delle attività produttive per il nostro paese.

Ogni schema di classificazione si riferisce ad una determinata codifica.

Definiamo codice parlante un codice che, a prima vista, ci dia una o più informazioni in esso contenute (ad esempio se vedo un codice fiscale italiano, riesco a capire immediatamente in che anno è nata la persona a cui è riferito).

Nel seguito vediamo, molto velocemente, come sono costruiti alcuni codici “famosi”.

Codici italiani: alcuni esempi

Come sono costruiti alcuni fra i più diffusi codici italiani?

  • codice di avviamento postale (CAP): è il codice che identifica una zona di consegna della posta; quello italiano è composto da 5 cifre numeriche con questo significato
    • 1-2 la provincia (ad esempio 37 per la provincia di Verona)
    • 3 questa cifra può essere 1 se si tratta di un capoluogo di provincia, oppure 0 altrimenti
    • 4-5 queste due cifre specificano le zone di consegna della posta (variano per i paesi, mentre per la città possono essere 00 se si tratta di una piccola città, altrimenti indicano i quartieri della città)
  • codice catastale: è il codice che identifica un comune, è composto da una lettera alfabetica e da tre cifre numeriche
  • codice fiscale: è il codice che identifica un contribuente italiano; è un codice a 16 caratteri alfanumerici con questo significato
    • 1-3 tre consonanti del cognome,
    • 4-6 tre consonanti del nome,
    • 7-8 le ultime due cifre dell’anno di nascita
    • 9 una lettera che identifica il mese di nascita
    • 10-11 il giorno di nascita e il sesso (da 01 a 31 giorno di nascita per gli uomini, da 41 a 71 giorno di nascita per le donne, sommato di 40)
    • 12-15 il codice catastale del comune di nascita
    • 16 un carattere di controllo
  • partita IVA: è un codice che identifica le aziende, quello italiano è composto da 11 cifre con questo significato
    • 1-7 un numero progressivo all’interno della zona della camera di commercio
    • 8-10 tre cifre che indicano la zona della camera di commercio (ad esempio 023 è Verona)
    • 11 un carattere di controllo
  • codice ATECO: sta per ATtivitò ECOnomica ed è un codice che identifica il settore di attività di un’azienda, di un libero professionista, di un artigiano ecc.; è composto da 1 carattere alfabetico (spesso omesso) e da 6 cifre separate a due a due da un punto, come ad esempio (N) 79.11.00 per le agenzie di viaggio; con questo significato
    • lettera alfabetica: sezione
    • 1-2 divisione
    • 3-4 gruppo e classe
    • 5-6 Categoria e Sottocategoria
  • codici ABI e CAB: sono entrambi codici numerici di 5 cifre ciascuno, rispettivamente per indicare la banca (ABI) e l’agenzia/sportello (CAB)
  • codice IBAN: è un codice per identificare un conto corrente; in Italia ha 27 cifre con significato:
    • 1-2 il paese (IT)
    • 3-4 un codice di controllo
    • 5 un codice di controllo
    • 6-10 il codice ABI
    • 11-15 il codice CAB
    • 16-27 il numero di conto corrente, preceduto da una serie di 0 se necessario
  • codice ANIA: è un codice numerico di 4 cifre, che identifica una impresa assicurativa autorizzata ad operare in Italia

Codici internazionali: alcuni esempi

Ecco alcuni fra i principali codici internazionali.

  • ISO 3166-1: è il codice internazionale per identificare i paesi del mondo; ha tre parti dette
    • numerico: tre cifre numeriche, ad esempio per l’Italia 380
    • alpha-3: tre caratteri alfabetici, ad esempio per l’Italia ITA
    • alpha-2: due caratteri alfabetici, ad esempio per l’Italia IT
  • codici GTIN: il Global Trade Item Number è un insieme di codici prodotto univoci riconosciuto a livello internazionale; è contenuto nei codici a barre dei prodotti al supermercato o in alcune pubblicazioni cartacee; può avere lunghezze diverse e, nella pratica, si riferisce ad esempio alla codifica UPC negli USA, al codice JAN in Giappone, alle codifiche EAN in Europa, all’ISBN per i libri.
    Se ad esempio facciamo riferimento al codice EAN-13 (prodotti europei per il mercato internazionale), questo ha 13 cifre con significato:

    • 1-2 paese di origine
    • 3-7 produttore
    • 8-12 nome prodotto
    • 13 un codice di controllo
  • prefisso telefonico internazionale: è il codice numerico da anteporre ad un numero telefonico nazionale per poterlo raggiungere direttamente dall’estero; può avere da 1 a 3 cifre numeriche, di solito precedute da un doppio zero (spesso indicate con un “+”)
  • codice IATA: è il codice aeroportuale (ogni aeroporto è identificato da tre caratteri alfabetici)
  • classificazione Dewey: è un codice numerico introdotto nel 1876 per classificare i campi della conoscenza umana; interesante notare come questi ultimi si siano modificati radicalmente (a prescindere dal codice) nel corso degl oltre 150 anni trascorsi
  • codice NACE: è il codice europeo di classificazione delle attività produttive (come l’ATECO italiano)

Le banche dati

Una banca dati è un insieme di dati strutturati, organizzati e codificati così da permettere il rapido reperimento delle informazioni.

Il reperimento mirato delle informazioni, information retrieval, comprende le tecniche informatiche (compresi i linguaggi per l’interrogazione di un database) per la ricerca di quanto è memorizzato in un archivio elettronico.
La concretizzazione delle teorie relative all’information retrieval è sotto gli occhi di tutti, ogni qual volta si utilizza un motore di ricerca.

Le banche dati sono utilizzate in una vasta gamma di settori e attività, tra cui

  • la ricerca scientifica,
  • l’analisi di mercato,
  • l’affidabilità creditizia
  • la gestione delle risorse umane
  • la sicurezza informatica.

Le banche dati possono essere gestite da

  • aziende private,
  • organizzazioni governative
  • istituzioni accademiche

e possono includere informazioni di diversi tipi, come ad esempio

  • dati finanziari
  • informazioni di mercato
  • informazioni sulle persone
  • dati scientifici

Vanno considerate sempre alcune importanti tematiche: l’utilizzo e la pubblicazione dei dati richiede anche la gestione attenta delle questioni di privacy, sicurezza e qualità dei dati, per garantire che i dati siano accurati, affidabili e non violino la privacy o i diritti delle persone.

Una banca dati può anche contenere solo metadati: è il caso del catalogo di una biblioteca. Oggi è possibile accedere alle informazioni riguardanti la posizione di un volume all’interno di una biblioteca mediante un servizio detto OPAC (Online Public Access Catalogue). Il catalogo collettivo delle biblioteche del servizio bibliotecario nazionale italiano è ad esempio disponibile all’indirizzo https://opac.sbn.it.

Gli open data

Gli open data sono dati che sono resi pubblici e accessibili a chiunque, senza restrizioni di accesso, riutilizzo o redistribuzione. Questi dati possono provenire da

  • fonti governative,
  • fonti non governative
  • fonti private

e sono spesso raccolti, gestiti e pubblicati in modo da garantire la massima trasparenza e accessibilità.

Gli open data possono includere una vasta gamma di informazioni, come dati governativi sulle spese pubbliche, dati sulle condizioni meteorologiche o sul traffico, dati scientifici o dati finanziari. L’obiettivo degli open data è quello di promuovere la trasparenza e la partecipazione democratica, fornendo ai cittadini, alle imprese e ai ricercatori accesso a informazioni di valore pubblico.

Un esempio di open data italiano è il portale https://dati.gov.it/ che permette di accedere a numerose categorie di dati in possesso della pubblica amministrazione.

Gli open data sono spesso pubblicati in formato aperto, ovvero in formati standardizzati e machine-readable, che consentono la loro facile elaborazione e analisi da parte di computer o software di analisi dei dati. Inoltre, gli open data possono essere pubblicati con licenze di utilizzo, che specificano le condizioni per il loro riutilizzo, come ad esempio l’obbligo di citare la fonte o di pubblicare i risultati di analisi effettuate sui dati.

Gli open services

L’accesso agli open data può essere diretto o effettuato mediante servizi, detti open services, come API o altri metodi di visualizzazione o interfacciamento e integrazione fra sistemi informatici.

Gli open services consentono dunque l’accesso e l’elaborazione dei dati in modo trasparente e interoperabile.

Ad esempio, le API possono essere utilizzate per accedere e interrogare i dati pubblici, consentendo ai ricercatori, alle imprese o ai cittadini di analizzare e visualizzare i dati in modo personalizzato e su diverse piattaforme. Inoltre, gli strumenti di visualizzazione dei dati possono essere utilizzati per creare mappe interattive, grafici e altre rappresentazioni visive dei dati pubblici, migliorando la comprensione e l’accessibilità dei dati pubblici.

 

Foto di Tima Miroshnichenko da Pexels