Formatele fișierelor

JSON este un format simplu de fișier care poate fi ușor citit de orice limbaj de programare. Simplitatea înseamnă că computerele cu care se poate lucra mai ușor decât altele, de exemplu, cu XML.







XML este utilizat pe scară largă pentru schimbul de date, deoarece vă permite să salvați structura în date și cum să le salvați în fișiere și permite dezvoltatorilor să stocheze părți ale documentației împreună cu datele fără a interfera cu citirea lor.

Consorțiul W3C recomandă un format numit RDF. În acesta, informațiile pot fi prezentate astfel încât datele din diferite surse să poată fi ușor combinate. Datele RDF pot fi stocate în XML și JSON, printre alte vederi. RDF încurajează identificarea prin URL, astfel încât să puteți schimba în mod convenabil prin rețea. RDF nu este încă distribuită pe scară largă, dar a devenit o tendință pentru inițiativele guvernamentale deschise, inclusiv proiectele de date britanice și spaniole. Inventatorul webului, Tim Berners-Lee, a propus recent o schemă de cinci stele în care datele RDF aferente sunt unul dintre obiectivele inițiativelor de date deschise.

foi de calcul

Mulți oficiali au informații stocate în foi de calcul, cum ar fi, de exemplu, Microsoft Excel. Aceste date pot fi utilizate imediat după ce se face o descriere corectă a valorilor fiecărei coloane.

Cu toate acestea, în foi de calcul, apar uneori macrocomenzi și formule, ceea ce face dificilă lucrul cu ele. Prin urmare, este mai bine să stocați descrieri ale acestor calcule împreună cu tabelele - astfel, le va fi mai ușor pentru utilizatori să le citească.

Fisierele delimitate

CSV este un format foarte util datorită compactării sale, care permite transferul de seturi de date mari cu aceeași structură. Cu toate acestea, acest format este atât de simplu încât datele din acesta sunt deseori inutile, fără ca documentația să explice ce este. Disponibilitatea acestor documente și relevanța lor pentru astfel de formate este deosebit de importantă.

Document text

Pentru a demonstra mai multe tipuri de date, de exemplu - listele de discuții relativ stabile sau ceva de genul acesta - pot exista destule formate comune cum ar fi Word, ODF, OOXML sau PDF. Distribuția lor poate fi ieftină, deoarece de multe ori în acest format sunt produse date. Formatul nu oferă niciun mijloc de monitorizare a structurii, de aceea este adesea dificilă introducerea automată a datelor. Încercați să utilizați șabloane pentru documente care vor afișa date pentru reutilizare, astfel încât să le puteți extrage cel puțin.

În plus, pentru utilizarea ulterioară a datelor, utilizarea maximă a marcajului tipografic ar fi utilă, deoarece facilitează diferențierea anteturilor de informație și așa mai departe. De obicei, nu este recomandat să distribuiți datele în format de procesor de text, dacă acestea sunt disponibile într-un alt format.

Text simplu

Computerele citesc cu ușurință documente în format text (.txt). Cu toate acestea, metadatele despre structura din ele, ca regulă, sunt absente, din cauza faptului că dezvoltatorii trebuie să scrie un parser pentru a analiza documentul.

Când faceți schimb de fișiere text între sisteme de operare, pot apărea probleme. MS Windows, Mac OS și alte sisteme asemănătoare Unix informează diferit computerul că au ajuns la sfârșitul liniei.







Scanează documente

Formate proprietare

Unele sisteme specializate etc. au propriile formate în care stochează datele. Uneori este suficient să punem datele în acest format - mai ales dacă se presupune că vor fi procesate într-un sistem similar în viitor. Ar trebui să menționăm întotdeauna unde puteți găsi informații suplimentare despre acest format proprietar - de exemplu, oferind un link către site-ul producătorului. Cel mai adesea merită să se stabilească datele în format gratuit, dacă este posibil.

Astăzi, datele sunt adesea prezentate pe site-uri în format HTML. Pentru destul de rar schimbarea datelor cu o acoperire mică, acest lucru este suficient. Uneori este mai bine să aveți date într-un format care să le ușureze descărcarea și manipularea ușoară a acestora, dar este mai ușor să se refere la o pagină de pe un site web, poate fi un loc bun pentru afișarea inițială a datelor.

Deschideți formate de fișiere

Chiar dacă informațiile sunt transmise în format electronic, ușor de citit de mașină, cu toate detaliile, pot apărea probleme datorită formatului propriu-zis al fișierului.

Formatele în care sunt publicate informațiile - cu alte cuvinte, baza digitală în care sunt stocate - pot fi "deschise" sau "închise". Formatul este deschis dacă specificațiile pentru programe sunt disponibile pentru toată lumea, fără nicio taxă - adică oricine poate folosi aceste specificații în programul lor fără restricții din cauza "drepturilor de proprietate intelectuală".

Dacă formatul este "închis", înseamnă că fie specificațiile sale nu sunt disponibile publicului, fie că sunt disponibile, dar sunt brevetate, astfel încât utilizarea lor este limitată. Dacă informația este eliberată într-un format închis, pot apărea bariere considerabile din calea reutilizării sale; probabil, cel care vrea să o folosească, va trebui să cumperi programele potrivite.

Avantajul formatelor de fișiere deschise este că dezvoltatorii pot crea mai multe pachete software și servicii care funcționează cu aceste formate. Acest lucru elimină majoritatea obstacolelor în calea utilizării informațiilor din aceste fișiere.

Utilizarea formatelor de fișiere închise ale căror specificații nu sunt disponibile poate avea ca rezultat dependența de programele terților sau de titularii licențelor de format. În cel mai rău caz, acest lucru poate însemna că informațiile pot fi citite numai printr-un singur program, care poate fi prohibitiv costisitor sau depășit.

, astfel, este mai bine să publicați în formate deschise la mașină, ușor de citit.

Exemplu: datele de trafic din Regatul Unit

În ceea ce privește posibilele considerente și limitări rezonabile, instituțiile ar trebui să publice informații online în format deschis, astfel încât să poată fi primite, descărcate, indexate și căutate de programe populare de căutare. Formatul deschis înseamnă că este independent de platformă, poate fi citit de mașină și este accesibil publicului fără restricții care ar putea împiedica reutilizarea acestor informații.

Cum se folosește acest format?

Atunci când autoritățile trebuie să publice date noi - date care nu au fost publicate anterior - încercați să alegeți un format bazat pe echilibrul dintre preț și adecvarea scopului. Pentru fiecare format, există câteva lucruri pe care ar trebui să le cunoașteți; Scopul acestei secțiuni este de a le explica.

Această secțiune discută numai modul în care se distribuie cele mai bune felii de date destinate procesării mașinilor. Sfaturi și instrucțiuni pentru dezvoltarea site-uri Web și aplicații Web, consultați alte secțiuni.

Servicii Web

Dacă datele se modifică frecvent și dimensiunea fiecărei porții este limitată, merită să le deschideți accesul prin intermediul serviciilor web. Există mai multe moduri de a crea servicii Web, dar cel mai adesea folosiți SOAP și REST. De obicei SOAP este de preferat, dar serviciile REST sunt foarte ușor de dezvoltat și de utilizat, deci acest standard este utilizat foarte mult.

bază de date

Bazele de date, cum ar fi serviciile web, oferă acces direct și dinamic la date. Avantajul bazelor de date este că permit utilizatorilor să selecteze exact piesele care le interesează.

Accesul la distanță de la date provoacă anumite probleme de securitate; În plus, accesul la date are sens doar dacă structura bazei de date și valorile câmpurilor și înregistrărilor individuale sunt bine documentate. Adesea, cea mai ușoară și mai ieftină modalitate de a rezolva problemele de securitate este crearea unui serviciu web pentru demonstrarea datelor.

Luați în considerare donația mică.

Formatele fișierelor

Susținut de






Articole similare

Trimiteți-le prietenilor: