Cursuri/Wikidata și proiectele surori/Wikidata

De la Wikimedia
Sari la navigare Sari la căutare

Wikidata este o bază de date cu informații de mai multe tipuri și din mai multe domenii, aflate în domeniul public (în majoritatea țărilor datele în sine nu sunt protejate de drepturi de autor, ci doar reprezentarea lor). Interfața Wikidata este disponibilă în mai multe limbi, inclusiv română.

Baza de date nu este tabelară cum v-ați putea aștepta, ci este formată din elemente (items) legate între ele într-un graf și care conțin declarații (statements). Fiecare declarație conține cel puțin o pereche cheie-valoare, dar poate conține și alte perechi de clarificare (qualifiers) sau surse.

Principii de folosire

Spre deosebire de Wikipedia, care este destinată unui public uman, Wikidata este folosită atât de oameni, cât și de programe software. Datele conținute sunt date deschise conectate (linked open data). Acest lucru înseamnă că ele pot fi citite prin intermediul unor interfețe automate și refolosite în alte locuri. De exemplu, Wikipedia în limba română folosește datele Wikidata pentru a popula multe din infocasetele afișate.

În cadrul acestui curs vom folosi interfața manuală a Wikidata, adică site-ul wikidata.org. Acest site este un wiki bazat pe software-ul MediaWiki, la fel ca Wikipedia, însă are o interfață ușor diferită. Nu poate fi editată pagina în întregime, ci doar declarații individuale, iar softul oferă auto-completarea proprietăților acceptabile într-un anumit context și oferă sugestii despre combinațiile cheie-valoare invalide sau care nu pot fi verificate automat.

Spațiul de nume principal nu are titluri, ci niște coduri de forma Qnnnnn, unde n sunt cifre. Fiecare pagină nouă primește un număr crescător, deci nu există o asociere permanentă între titlu și conținut. Aceste pagini care încep cu Q se numesc în engleză items (în română elemente, dar tradus uneori itemi, alteori simplu pagini). Oricine poate crea un element nou.

Pe lângă date, acest spațiu de nume conține și lexeme. Acestea sunt un tip special de elemente creat pentru a facilita construirea proiectului Wikționar și au numele de forma Lnnnnnn. Ele au un model de date ușor diferit (adică acceptă alte proprietăți), însă ca editare și utilizare funcționează la fel ca elementele normale, de aceea nu vom intra în detalii specifice.

Mai există un spațiu de nume al proprietăților (în engleză properties), unde titlurile sunt de forma Property:Pnnnn. Proprietățile sunt comune mai multor pagini și pentru a păstra o anumită organizare, doar administratorii le pot crea, în urma unei discuții a comunității.

Structura unui element

Părțile componente ale unui element Wikidata

Un element Wikidata este format din 4 părți: titlul (format din etichetă, descriere și aliasuri), declarațiile, identificatorii (legături către alte baze de date) și legăturile către alte proiecte Wikimedia (sitelinks). Aspectul paginii pe calculator este prezentat în imaginea din dreapta. Pe mobil, aspectul poate fi ușor diferit, dar cele 4 părți sunt prezente.

O specificație completă a datelor păstrate într-un element Wikidata poate fi găsită în pagina Wikibase/DataModel.

Etichetă, descriere, aliasuri

Un element are exact o etichetă și o descriere. Combinație etichetă + descriere trebuie să fie unică în Wikidata. Acest lucru ne permite să avem mai multe pagini cu aceeași etichetă, iar descrierea dezambiguizează între ele. Vezi de exemplu câte pagini cu numele Bucșani există pe Wikidata.

Declarații

Un element poate avea oricâte declarații. Fiecare declarație poate fi reprezentată printr-o pereche cheie-valoare și conține:

  • exact o cheie, care trebuie să fie una din proprietățile acceptate de Wikidata
  • una sau mai multe valori, care trebuie să fie într-unul din tipurile de date acceptate de Wikidata; există și 2 valori speciale: nicio valoare (no value), sau valoare necunoscută (unknown value).

În plus, fiecare valoare poate fi completată cu:

  • calificatori - o altă pereche cheie-valoare cu aceleași cerințe ca mai sus; fiecare afirmație poate avea oricâți calificatori
  • referințe - fiecare referință este formată la rândul ei din una sau mai multe perechi cheie-valoare cu aceleași cerințe ca mai sus; fiecare afirmație poate avea oricâte referințe

Tipuri de date

Format:Articol principal

Tipurile de date definesc cum se comportă și ce tipuri de date acceptă o declarație. Mai jos vă prezentăm tipurile de date implicite, cele mai folosite. Pe Wikidata este posibil să existe și alte tipuri de date.

  1. Tipuri de tip șir de caractere:
    1. Șir de caractere (string): un șir de caractere ce nu are nevoie să fie tradus
    2. Text monolingv: un text scris într-o anumită limbă. Pe lângă textul propriu-zis trebuie menționată și limba
    3. Identificator extern: un șir de caractere care este unit cu o parte statică pentru a forma o legătură către o bază de date externă.
    4. URL: o adresă web
  2. Tipuri ce trimit la Wikimedia Commons (vezi modulul anterior pentru detalii pentru ce pot conține acestea):
    1. Fișiere multimedia
    2. Forme geografice
    3. Date tabulare
  3. Alte tipuri:
    1. Coordonate pe glob. Permit specificarea unor coordonate pentru orice obiect din univers. Necesită menționarea globului (implicit este Pământul) și a preciziei coordonatelor.
    2. Timp. Acceptă orice dată, cu precizie până la nivel de zi. Există planuri de introducere a timpului, însă deocamdată nu se pot introduce date cu precizie mai bună.
    3. Cantitate. Este un număr real, împreună cu o precizie și o unitate de măsură

Calificatori

Perechile de calificare (qualifiers) oferă informații suplimentare despre declarație căreia îi sunt asociate. De exemplu, pentru proprietatea țară, o anumite valoare poate avea calificatori pentru perioada în care acea entitate a aparținut acelei țări: începând cu și până la. Nu există reguli cu privire la ce proprietăți pot fi folosite pentru calificare, însă doar unele din proprietățile disponibile vor influența afișarea informațiilor pe Wikipedia. Dacă doriți să găsiți o proprietate utilă, căutați în elemente asemănătoare sau folosiți funcția de auto-completare din editorul Wikidata.

Referințe

În Wikidata, referințele sunt construite tot prin perechi cheie-valoare. Când adăugați o referință, editorul vă va lăsa să adăugați numai anumite proprietăți, printre care URL de referință, data accesării sau titlu. Și în acest caz, cea mai bună soluție este să folosiți auto-completarea oferită de editor.

Identificatori

Identificatorii sunt declarații de tipul identificator extern. În afară de tipul de date, ei se comportă ca orice altă declarație.

Sitelinks

Legăturile către alte proiecte Wikimedia sunt adăugate în secțiuni dedicate (Wikipedia, Wikivoyage etc.). Trebuie specificat codul de limbă (ro pentru română, en pentru engleză etc.) și titlul paginii în limba respectivă. În cazul Wikimedia Commons se introduce categoria ce conține imagini despre subiectul respectiv.

Comunitate și editare

La fel ca Wikipedia sau Wikimedia commons, Wikidata are propria comunitate de editori și propriile reguli.

Reguli de includere

Notabilitatea pe Wikidata are cu totul alte reguli - mult mai permisive - decât Wikipedia. O intrare este notabilă dacă îndeplinește oricare din aceste criterii:

  1. Există o pagină despre subiect în oricare din proiectele Wikimedia (are cel puțin un sitelink)
  2. Se referă la o entitate clar identificabilă descrisă în surse publice serioase
  3. Este necesară pentru a îmbunătăți prezentarea unei alte entități

Aceste criterii foarte permisive fac ca numărul de intrări din Wikidata să fie mult mai mare decât numărul de articole din Wikipedia. Există intrări pentru articole științifice, articole individuale de enciclopedie, autori ale acestor articole care nu sunt suficient de notabili pentru a avea articole în enciclopedie, comune, sate, orașe, localități componente etc.

Editarea pe site

Scurt tutorial de editare pe Wikidata

Cea mai ușoară metodă pentru a învăța editarea pe Wikidata este prin intermediul tururilor ghidate de pe site, pe care vă invităm să le urmați. Alternativ, puteți urmări filmulețul din această secțiune.

În principiu, fiecare tip de date prezentat mai sus are propriul editor. Fiecare declarație se editează individual, împreună cu calificatorii și referințele aferente. Un lucru important de reținut este că orice editare la Wikidata este licențiată sub o licență chiar mai permisivă decât la Wikipedia, și anume CC-0, care este echivalentul domeniului public, permițând reutilizarea materialelor fără menționarea sursei. Atenție deci la datele aduse în masă din surse externe! Nu uitați că în Europa există și drepturi conexe precum drepturile fabricanților bazelor de date.

Rezultatul modulului

Vă invităm să faceți cel puțin 10 editări pe Wikidata. Acestea pot să fie de orice fel: completarea unei informații, adăugarea unei surse, legarea unui articol creat de dvs. la Wikidata etc. Puteți edita un singur element sau mai multe.

Dacă ați creat un articol pe un subiect care are deja un element Wikidata, puteți conecta articolul la element direct din Wikipedia: de pe siteul pentru calculator, în meniul din stânga ultima legătură din secțiunea Limbi se numește "Adaugă legături". Dând clic pe ea, puteți lega articolul curent de articolul echivalent din altă limbă. Pentru a crea un element nou, mergeți la wikidata.org și în meniul din stânga aveți legătura Create element nou. Completați acolo eticheta și descrierea în română și apăsați pe butonul "Creare". Nu uitați să adăugați apoi legătura către articolul din Wikipedia.

Note