Het bestand is een van de fundamentele onderdelen van de computerervaring. Maar wat is een "bestand" eigenlijk? Het is een pictogram op uw bureaublad, een vermelding in een lijst die uw budget opent als een spreadsheet en een naam die u aan uw nieuwste selfie kunt geven. Aan het einde van de dag is een "bestand" een verzameling bits (nullen en enen) gerangschikt in een patroon dat door een toepassing wordt begrepen.
Ontwikkelaars kunnen deze patronen geheim houden, waardoor gebruikers een bepaald programma kunnen behouden ondanks alternatieven. De volledige Microsoft Office-gids Bestandsconvertor De complete Microsoft Office-gids Bestandsconvertor Als u ooit een tekstbestand hebt geconverteerd, zoals PDF naar Word, bent u bekend met de uitdaging. Soms is het net zo gemakkelijk als afdrukken, soms hebt u speciaal gereedschap nodig. Voer deze omzetterhandleiding in. Lees verder . Andere ontwikkelaars kunnen zelfs de acceptatie van hun indelingen aanmoedigen. In sommige gevallen kunt u het formaat gemakkelijk openen en interpreteren of is het mogelijk onmogelijk om de indeling buiten de oorspronkelijke toepassing te gebruiken. We zullen voorbeelden van al het bovenstaande in dit artikel bekijken.
Op tekst gebaseerde versus binaire bestandsindelingen
Het eerste belangrijke aspect van verschillende bestandstypen is of het binair of tekstgericht is. Laten we elk daarvan een voor een bekijken.
Tekstgebaseerde formaten
Het tekstbestand is het meest standaard bestandsformaat. Het kan worden gelezen door vrijwel elk systeem dat er is met een processor. Dit formaat is een reeks bits (enen en nullen) die voldoet aan de ASCII-standaard (we zullen Unicode voorlopig over het hoofd zien), wat betekent dat een computer elke byte (8 bits) als een karakter kan interpreteren uit de volgende:
- AZ (inclusief hoofdletters en kleine letters
- 0-9
- Ruimteteken
- Een selectie van symbolen (bijv. Interpunctie)
- Controle karakters (bijv. "DEL")
Aangezien de gegevens als tekst worden opgeslagen, kunt u de inhoud van een bestand bekijken door het in een teksteditor te openen, zelfs eenvoudige bestanden zoals Windows Notepad 2 Minimalistische teksteditors die u waarschijnlijk nog nooit hebt gehoord [2] Minimalistische tekstverwerkers die u waarschijnlijk heeft Nooit gehoord van [Windows] Afgezien van het feit dat het bij voorkeur gebaseerd is op snelle laadtijden, vereisen sommige applicaties gewoon niet te veel hulpbronnenintensieve functies. Minimalistische applicaties zijn klein en schoon, en zo lang ze de klus hebben geklaard, dan ... Lees meer (of equivalenten voor Mac De beste Mac-teksteditors te gebruiken in 2018 De beste Mac-teksteditors te gebruiken in 2018 Een nieuwe tekst nodig hebben editor voor je Mac Hier zijn de beste gratis en betaalde macOS-teksteditors voor platte tekst, codering en alles daartussenin. Meer lezen, Linux Geavanceerde Linux-teksteditors vergeleken: kate vs gedit Geavanceerde Linux-teksteditors vergeleken: kate vs gedit Elke Linux-versie gebruiker zal u vertellen dat een goede teksteditor een vitaal onderdeel is van een computersysteem, ongeacht of u een nieuwe gebruiker of een doorgewinterde pro bent. Terwijl u een Terminal-tekst ... Lees meer, iOS Write-app: een mooie iOS Teksteditor met Markdown-ondersteuning en tientallen acties Schrijf-app: een mooie iOS-teksteditor met ondersteuning voor markdown en tientallen acties Het schrijven van apps voor de iPad en iPhone is er in overvloed. We hebben het geluk dat we leven in een tijd waarin ontwikkelaars op de proppen komen met nieuwe manieren om tekst te bewerken met unieke functies in nieuw apps. Deze ... Lees meer, en Android 7 afleiding-vrije teksteditors voor Android vergeleken: wat is het beste? 7 afleidingsvrije teksteditors voor Android vergeleken: wat is het beste? Krijg wat echt werk gedaan op je Android-apparaat met behulp van een van deze geweldige tekst-editors. Lees verder ). Aangezien bijna alle computerplatforms worden geleverd met een eenvoudige teksteditor, kunt u wat (tekst) informatie in een van deze bestanden plaatsen en erop vertrouwen dat u er altijd toegang toe hebt. Andere applicaties hoeven verder niets te weten om de gegevens op zijn minst goed te kunnen lezen.
Het wordt echter ingewikkelder wanneer u iets als het lettertype of een automatisch ingevulde datum op de omslagpagina moet weergeven. In deze gevallen dragen ASCII-tekens bij aan een op tekst gebaseerd formaat zoals Markdown What Is Markdown? 4 redenen waarom je het nu moet leren Wat is een daling? 4 redenen waarom u het nu zou moeten leren Moe van HTML en WYSIWYG-editors? Dan is Markdown het antwoord voor jou, ongeacht wie je bent. Meer lezen of XML. Hoewel dit de voordelen van gewone tekst zoals transparantie oplevert, vereisen deze bestanden vaak meer ruimte voor elementen zoals tags. Beschouw het volgende éénzin-bestand in platte tekst en vervolgens in de "Platte ODT" -indeling van Open Document Format (XML). De onderstaande afbeelding laat zien dat de tekstversie 53 bytes is, terwijl de ODT-versie 25.000 bytes is .
Binaire indelingen
In tegenstelling tot binaire formaten Wat is binair? [Technology Explained] What Is Binary? [Technology Explained] Aangezien binary zo absoluut fundamenteel is voor het bestaan van computers, lijkt het vreemd dat we het onderwerp nooit eerder hebben aangepakt - dus vandaag had ik gedacht dat ik een kort overzicht zou geven van wat binary ... Lees verder Meer zijn bestanden die een applicatie beetje bij beetje zal maken. U kunt proberen deze bestanden te openen met een teksteditor, maar waarschijnlijk weet u niet hoe u ze moet interpreteren. Hieronder ziet u het resultaat van een poging een Microsoft Excel-bestand te openen met een teksteditor.
De applicatie moet de gegevens in een binair bestand op een specifieke manier verwerken. Bij het openen van een XLS-bestand moet een toepassing de eerste zestien bytes van het bestand behandelen als de markering "begin van bestand" (BOF). Binnen die markering is het vijfde item een enkele bit die aangeeft of het bestand voor het laatst is bewerkt op het Windows-platform ("fWin"). Het komt na vier andere items, elke twee bytes, wat betekent dat het "fWin" -item het 65ste bit in het Excel-bestand is.
Zoals we hebben gezien, als u het probeert te openen met een toepassing die het 65e bit niet als de "fWin" -vlag verwerkt, zal die toepassing het niet correct openen. Het kan veel verminkte karakters op het scherm vertonen (zie hierboven), het sierlijk behandelen met een foutmelding (ook hierboven getoond, omdat Linux), of crashen. In ieder geval zal het niet weten hoe de gegevens correct moeten worden gelezen, en zal het dus niet correct worden weergegeven. Maar applicaties kunnen, eenmaal geprogrammeerd, zoveel bestandsformaten als gewenst verwerken.
Open versus eigen indelingen
De volgende overweging is of een bestandsindeling open is (dat wil zeggen beschikbaar is voor eenvoudig gebruik door anderen) of eigen is. Merk op dat "proprietary" niet hetzelfde is als gesloten, althans niet in alle gevallen. Hoewel het bovenstaande 'tekst vs. binaire' debat een technische discussie was, heeft 'open vs. eigendom' meer te maken met de licentievoorwaarden van een bestandsindeling. Meer hierover in de volgende secties.
Open formaten
Open formaten zijn die waarbij de licentie gebruikers toestaat ze voor hun eigen toepassingen aan te nemen. Een normalisatie-instantie van een bepaald soort moet ook toezicht houden op hun voortdurende ontwikkeling door een gemeenschap van bijdragers om de formats echt "open" te laten zijn. Open formaten zijn ook vrij van licentiekosten en beperkingen - ze kunnen door iedereen worden gebruikt, voor welk doel dan ook. Misschien wel de meest bekende open indeling is de Open Document Format (ODF) 9 Zeldzame Office-bestandsindelingen die u moet kennen 9 Zeldzame Office-bestandsindelingen die u moet weten Heeft u ooit vreemde bestandsindelingen tegengekomen in uw kantoorsuite? We zullen u een snelle inleiding geven over zeldzame, maar nuttige office-bestandstypen en waarvoor u ze kunt gebruiken. Read More, voor het eerst uitgebracht in 2005 door OASIS. Het doel was om een alternatief te bieden voor het slot dat Microsoft op de productiviteitsmarkt had.
Met open formaten hoeft u nooit bang te zijn dat uw informatie in een bepaald bestand is vergrendeld. Beschouw het volgende, dat ons bestand met platte ODT-indeling laat zien. Hoewel er veel externe informatie omheen zit, kunt u de feitelijke gegevens daar zien, die u dag in dag uit vrijgeeft.
Een ander voordeel van open formaten is hun grondige documentatie. Het is één ding dat een bestand gemakkelijk leesbaar is. Een programmeur zal nog steeds (met vallen en opstaan) moeten uitzoeken wat zijn functie precies is. Maar in het geval van ODF geeft de versie 1.2-specificatie een programmeur alles wat hij moet weten om de ondersteuning ervan efficiënt te implementeren.
Eigen formaten
Ten slotte worden eigen indelingen beschermd door hun ontwikkelaars. Het kan zijn omdat ze handelsgeheimen bevatten, ten behoeve van (waargenomen) veiligheid, of simpelweg omdat de ontwikkelaar zijn werk niet wil delen. Wat de reden ook is, deze formaten zijn eigendom van End User License Agreements (EULA's) of andere voorwaarden die de gebruiker verbieden reverse engineering te proberen of anderszins het bestandsformaat te "kraken".
Eens slechts 'verboden', de Digital Millenium Copyright Act Wat is de Digital Media Copyright Act? Wat is de Digital Media Copyright Act? Lees meer (DCMA) heeft dingen veranderd. Ontwikkelaars hebben nu de juridische ondersteuning om achter diegenen aan te gaan die hun werk reverse-engineeren. U moet nadenken over de toekomst voordat u investeert in een toepassing die een eigen indeling gebruikt. Moet u die informatie in de toekomst ergens anders naartoe migreren? Zo ja, hoe pijnlijk zal het zijn? Zal het bedrijf zelfs rond zijn in een jaar, of vijf? Je moet overwegen of de functies van een app het waard zijn als het ook betekent dat je vanwege eigen indelingen in die ontwikkelaar wordt geblokkeerd.
Voorbeelden van bestandsindelingen
Als je naar het bovenstaande kijkt, springen een paar combinaties eruit. Het is waar dat op tekst gebaseerde bestandsindelingen geschikt zijn om open te zijn . Evenzo, als het doel van een formaat eigendom is, is het gemakkelijker om het op die manier te houden door het binair te maken. Maar dit is niet altijd het geval.
Het XCF-afbeeldingsformaat van de GIMP is een open indeling die ook binair is. Het project bevat een gedetailleerde beschrijving van hoe het formaat de afbeeldingen, tekst en lagen bevat waaruit een GIMP-bestand bestaat als onbewerkte bits en bytes (hieronder weergegeven). Ontwikkelaars kunnen dit gebruiken om hun eigen implementatie te coderen, zodat externe toepassingen zoals ImageMagick afbeeldingen eenvoudig kunnen bijsnijden en vergroten / verkleinen in Linux. Afbeeldingen eenvoudig in Crop en formaat vergroten Als u wat basis bijsnijden en vergroten of verkleinen wilt bij Linux - misschien om te helpen met een project of maak een afbeelding gemakkelijker om te uploaden naar uw favoriete sociale netwerken - probeer dan deze ... Lees meer toolkit kan ze importeren.
Omgekeerd is de nieuwste Microsoft Visio-indeling (VSDX) een op XML gebaseerd (en dus op tekst gebaseerd) formaat. Het publiceert een gedetailleerde referentie van de samenstelling van deze bestanden. In het referentiedocument wordt echter opgemerkt dat Microsoft "patenten heeft die uw implementatie kunnen dekken" van .VSDX-ondersteuning. Bovendien stelt de Library of Congress gebruik van de VSDX-specificatie "garandeert geen royaltyvrije licentie voor alle relevante patenten" als u deze gebruikt. Dit is een andere manier om te zeggen dat je de dobbelsteen kunt gooien en deze ondersteuning kunt gebruiken. Maar Microsoft kan wel of niet willen dat u later betaalt, afhankelijk van hoe dicht het concurreert met Visio.
Als je denkt dat die ingewikkeld zijn, wat dacht je van het niet-platte ODT-formaat? Het is een bestand in ZIP-indeling (binair en open, tenzij u ook de codering ervan gebruikt) met de tekst van een document ( content.xml, open op tekst gebaseerde indeling) en afbeeldingen (bijv. PNG, binair maar open).
Hoe belangrijk zijn bestandsformaten, echt waar?
Dit is een moeilijke vraag. Aan de ene kant hebben sommige besturingssystemen, zoals iOS, geprobeerd om te isoleren dat gebruikers überhaupt met bestanden te maken hebben. U hebt de app die het bestand heeft gemaakt om het te openen, wie geeft om zijn structuur of wat de extensie is? Toch hebben veel organisaties (met name regeringen) aangedrongen om ervoor te zorgen dat openbare gegevens in een open formaat zijn.
Als je een software-idealist bent (niet dat daar iets mis mee is), zorg er dan bij het evalueren van nieuwe apps voor dat ze in een open (bij voorkeur) op tekst gebaseerde indeling staan. Als u gewoon aan de slag wilt gaan, is het mogelijk dat eigen indelingen geen probleem voor u zijn.
Wat denk je? Vraagt u dat uw informatie zich bevindt in open, op tekst gebaseerde indelingen die u kunt converteren en verifiëren? Of zijn de formaten die de ontwikkelaars gebruiken, gepatenteerd of niet, genoeg voor jou? Laat het ons hieronder weten in de reacties!
Afbeeldingscredits: Edilus / Shutterstock