15 enorme online databases die u moet kennen

Het internet documenteert alles. Sommige van die gegevens worden geconcentreerd in enorme knowledgebases. Noem ze online encyclopedieën of databases - de vraag is, weet jij wat de beste zijn?

Het internet documenteert alles.  Sommige van die gegevens worden geconcentreerd in enorme knowledgebases.  Noem ze online encyclopedieën of databases - de vraag is, weet jij wat de beste zijn?
Advertentie

Denk aan je favoriete open databases.

Ik ben er zeker van dat Wikipedia en IMDb meteen voor de geest komen, maar misschien heb je niet al die kennis ooit nodig of een uitgebreide database van entertainment voor alle dingen. Soms hebt u een beetje VLDB-smaak (Very Large Data Base) nodig. Iets om uw data-analyse te verbeteren Hoe word ik een data-wetenschapper Hoe word ik een data-wetenschapper Datakunde is van een nieuw bedachte term in 2007 uitgegroeid tot een van de meest gewilde disciplines van vandaag. Maar wat doet een data-wetenschapper? En hoe kun je in het veld breken? Lees verder . Iets om het 'grote' in je big data te stoppen. Wul, goed mens, je bent op de juiste plek.

Hier zijn 15 enorme online databases So What Is a Database, Anyway? [MakeUseOf Explains] Dus wat is een database eigenlijk? [MakeUseOf Explains] Voor een programmeur of een technologie-liefhebber is het concept van een database iets dat echt als vanzelfsprekend kan worden beschouwd. Voor veel mensen is het concept van een database zelf echter een beetje vreemd .... Lees Meer kun je gratis Excel Vs. openen en analyseren. Access - Kan een spreadsheet een database vervangen? Excel Vs. Access - Kan een spreadsheet een database vervangen? Welke tool moet u gebruiken om gegevens te beheren? Toegang en Excel zijn beide voorzien van gegevensfiltering, sortering en query's. We laten u zien welke het beste geschikt is voor uw behoeften. Lees meer of bekijk het gewoon op uw gemak.

1000 genomen

De voltooiing van het Human Genome Project (HGP) in 2003 was nog maar het begin. Sindsdien hebben de vooruitgang in de sequentietechnologie de kosten per persoon sterk verminderd, wat een enorme uitbreiding van de HGP mogelijk maakt, van de eerste onderzoeksbasis van twintig universitaire laboratoria naar een uitgebreid, geglobaliseerd netwerk van onderling verbonden voorzieningen voor genoomkaarten.

U kunt een deel van het 1000 Genomes-project downloaden, met informatie over de volgorde voor meer dan 2600 mensen uit 26 populaties over de hele wereld. Dit is een 200TB-bestand, dus wees voorbereid. We raden aan deze te gebruiken in combinatie met een krachtig cloud computing-platform.

Zie ook: The Animal Genome Size Database voor genoomgegevens met betrekking tot 5635 soorten.

lijnvliegtuigen

lijnvliegtuigen

De planespotters hemel. Een enorme afbeeldingendatabase met 2.532.457 foto's van allerlei soorten vliegtuigen, van het kleinste individuele vaartuig tot kolossale grote vliegende forten.

Airliners beschikt ook over een uitgebreide vliegtuiggegevens- en geschiedenissectie die altijd wordt bijgehouden in samenwerking met Aerospace-publicaties om de feitelijke nauwkeurigheid te waarborgen. Hiermee is het een van de meest gedetailleerde vliegtuigdatabases op internet geworden.

Zie ook : Probeer Planespotters.net voor een andere reeks afbeeldingen, of SeatGuru voor vliegtuigschotels.

Het internetarchief

Internetarchief

De site die voorheen bekend stond als The Internet Archive, heeft een enorm herontwerp ondergaan. De site is sinds 2002 niet veel veranderd, maar sindsdien is er veel veranderd. Het internetarchief is sinds het begin nog meer gegroeid.

Door alles op het internet te archiveren, geeft de site u gratis toegang tot digitale media, waaronder boeken, muziek en games. Internet Archive brengt 900 klassieke arcadegames naar uw browser. Hier zijn 7 van de beste Internet Archive brengt 900 Classic Arcade Games naar uw browser. Hier zijn 7 van de beste De arcade van je stad is mogelijk halverwege de jaren 90 afgesloten, maar dat zou je er niet van moeten weerhouden om je klassieke spellen te laten repareren. Lees meer, video's en nog veel meer. De verzameling wordt momenteel geschat op ongeveer 10 petabytes Geheugentapes uitgelegd - Gigabytes, Terabytes en Petabytes in Layman's termen Geheugegrootte uitgelegd - Gigabytes, Terabytes en Petabytes in de terminologie van Layman Het is gemakkelijk te zien dat 500 GB meer dan 100 GB is. Maar hoe verhouden verschillende grootten zich? Wat is een gigabyte naar een terabyte? Waar past een petabyte in? Laten we het opruimen! Meer lezen, en terwijl hun webcrawlers blijven kruipen, blijft deze groeien.

Freebase

Freebase

Freebase is 'een community-samengestelde database van bekende personen, plaatsen en dingen', opgeslagen in een gegevensstructuur die een grafiek wordt genoemd . Een grafiek bestaat uit knooppunten, verbonden door hun randen, waardoor Freebase zijn inhoud snel kan uitbreiden zonder bestaande records te onderbreken.

Helaas is Freebase, eigendom van Google, eerder dit jaar overgeschakeld naar de alleen-lezen-modus, voordat de stand-alone servicedatabase wordt overgedragen aan de Wikimedia Foundation voor integratie. Probeer bètafuncties uit op Wikimedia en een voorbeeld van wat er nieuw is Voordat u begint Probeer bètafuncties uit Wikimedia en preview Wat is er nieuw vóór iedereen anders Wikimedia's bèta-functiesprogramma stelt iedereen in staat om de aankomende nieuwe functies op Wikimedia en zijn wiki's uit te proberen. Doe mee en help maken van Wikimedia een betere ervaring voor ons allemaal. Lees meer in het Wikidata-project (eind juni 2015). Ontwikkelaars kunnen momenteel nog steeds toegang krijgen tot Freebase met behulp van bestaande API's, maar zodra de switch is gemaakt, moeten ontwikkelaars Wikimedia API's gebruiken om toegang te krijgen tot de gegevens.

Zoek een graf

Find A Grave

Vanuit de thuisbasis van een internetkennisdroomteam van Google en Wikimedia, gaan we naar het morbide. Find a Grave is een enorme database van 121 miljoen records over begrafenissen overal ter wereld.

Meest uitgebreide records komen uit de VS, maar er zijn enkele kleinere landen met grote gegevens. Compleet met foto's, interessante monumenten en een aantal interessante grafschriften ... als je inspiratie nodig hebt?

GameRankings

Game Rankings

Een database onderhouden door het altijd aanwezige reviewing team van Gamespot. GameRankings geeft een goed afgeronde weergave van de populariteit van een game door online en offline recensenten te beoordelen van gerenommeerde bronnen. 6 plaatsen om uit te vinden wat de beste videogames zijn ooit 6 plaatsen om uit te vinden Wat zijn de beste videogames ooit Het is maar natuurlijk voor een fan van gaming om zich af te vragen wat de beste games ooit gemaakt hebben, of tenminste wat volgens de experts de beste zijn. Lees verder .

The Big Cartoon Database

BCBD

In dezelfde geest als de enorme IMDb, richt The Big Cartoon Database zich uitsluitend op alle geanimeerde dingen: tekenfilms, films, televisieprogramma's, advertenties en meer. Als het een animatie is, vindt u deze hier - en als dat niet het geval is, meldt u zich aan als bijdrager aan deze steeds groter wordende database.

The Big Cartoon Database heeft een zustersite in The Big Comic Database, waar nog eens 100.000 of meer strips staan. 9 Video Game Themed Comics Boeken die je moet lezen 9 Video Game Themed Comics Boeken die je zou moeten lezen Het is tijd om uit te schakelen en naar bed. Maar je zit nog steeds te popelen om je favoriete spel te spelen. Je moet ontspannen, dus waarom zou je je favoriete spel dan niet lezen? Lees meer, verspreid over zo'n 5.000 series, met meer dan 35.000 coverscans. Het bevat ook een uitgebreide zoekfunctie, inclusief een handleiding voor stripboeken met details over de huidige verkoopwaarden op de verschillende indelingsniveaus.

Zie ook : The Grand Comics Database, een niet-commerciële bedrijfsdatabase van strips wereldwijd.

CiteSeer X

CiteSeer

Een onmisbare tool voor studenten Bibliografieën en voetnootcitaties maken is gemakkelijker met Bookends voor Mac Bibliografieën maken en voetnoten citeren is gemakkelijker met Bookends voor Mac Bookends voor Mac voert praktisch de onderzoeks- en citaatopmaaktaken voor u uit. Read More en academici, CiteSeer X is een openbare zoekmachine en een digitale bibliotheek met academische en wetenschappelijke publicaties. Het werd vaak beschouwd als het eerste geautomatiseerde citatie-indexeringssysteem en was de inspiratie voor Google Scholar en Microsoft Academic Search. Hoewel de laatste sindsdien is geïntegreerd in de Bing-zoekmachine.

CiteSeer X richt zich op het indexeren van openbare wetenschappelijke documenten. Als uw onderzoeksartikel openlijk wordt verspreid, heeft het een grotere kans om in de zoekmachine te verschijnen. CiteSeer X is een uitstekend voorbeeld van de kracht van gedeelde kennis die beschikbaar wordt gesteld aan een veel breder publiek.

Zie ook : Google Scholar voor een ander assortiment boeken en citaten.

WorldCat

WorldCat

Helaas geen database van elke kattenfoto op internet. Dat zou iets zijn! WorldCat is veel nuttiger dan dat. De referentielocatie documenteert de collecties van meer dan 72.000 bibliotheken over de hele wereld, verspreid over 170 landen en territoria. Dit is handig als u onderzoek doet in een vreemd land of als u gewoon zeldzame boeken wilt lezen.

Het enige nadeel is de update-methode. WorldCat maakt gebruik van een batchverwerkingsmodel in plaats van dat gebruikers in realtime toegang hebben tot de gegevens. WorldCat geeft dus niet de uitleenstatus van gecatalogiseerde boeken aan, of een bibliotheek meerdere exemplaren van één boek bezit, of dat het boek in kwestie direct toegankelijk is voor diegenen die het willen bezoeken. Het is nog steeds een zeer nuttig hulpmiddel, vooral als het wordt gebruikt in combinatie met CiteSeer X.

Het Simpsons-archief

Simpsons

"Het internetcentrum van Simpsons-gidsen, nieuws en informatie." Ik had het zelf niet beter kunnen zeggen. De al lang bestaande favoriet van de fans begon al in 1994, en gaat nog steeds sterk, zelfs zonder interactieve multimedia, al was het maar om aan het waakzame oog van Fox's juridische afdeling te ontsnappen.

WinCustomize

WinCustomize

U vindt een van de grootste databases met aanpassingshulpmiddelen voor Windows. Hoe kunt u uw Windows-geluidseffecten aanpassen? Uw Windows-geluidseffecten aanpassen U kunt uw computer laten klinken als uw favoriete tv-programma, uw eigen geluiden opnemen of ze volledig uitschakelen. . Hier is een spoedcursus over het wijzigen en opnemen van geluidseffecten voor Windows. Lees meer hier, van XP tot Windows 8.1 10 Windows 8 Startscherm Hacks 10 Windows 8 Startscherm Hacks Windows gaat richting een meer geblokkeerde richting met Windows 8 en het startscherm en de 'moderne' app-omgeving. Het valt niet te ontkennen - je kunt zelfs geen aangepaste startschermachtergrond instellen zonder ... Lees meer. Ik weet zeker dat het niet lang meer duurt voordat Windows 10 begint met het maken van de rondes. De enorme populariteit ervan komt voort uit een combinatie van krachten. Eigenaar Stardock subsidieert de site, er zijn weinig tot geen advertenties. Het profiteert ook van het aantal personen dat naar de site van Stardock is gesluisd.

Ultiem gitaararchief

GuitarTabs

Ah, een nostalgische rijstrook naar een database die me eraan herinnerde dat ik nooit Roger Waters zou worden. Sterker nog, ik kan nog steeds nauwelijks spelen, maar dat is een ander verhaal.

Het Ultimate Guitar Archive, oftewel Ultimate-Guitar (UG), heeft meer dan 1.500.000 geregistreerde leden over de hele wereld die toezicht houden op een belachelijk grote hoeveelheid community-inhoud. Het is bijna verbijsterend hoeveel gitaargerelateerde informatie uit een enkele bron wordt verspreid. De community heeft gewoon geen enorme database, ze werken ook vaak samen met elkaar om uitgebreide muziekprojecten te maken.

Planten voor een toekomst

Planten-For-A-Future

Plants for a Future documenteert ecologisch duurzame tuinbouw. Het heeft een grote rol in het verspreiden van kennis over soortendiversiteit en het belang van permacultuur. Wat begon als een klein project in de diepten van Cornwall is langzaam uitgegroeid tot een wereldwijde database.

De groei is enigszins langzaam en concentreert zich grotendeels op permacultuur in het VK en de EU, maar veel van de records kunnen worden geruild voor specifieke locaties in de VS als u eenmaal over de soortgegevens beschikt.

Quandl

Maak gebruik van deze Excel-invoegtoepassing om gegevens te verwerken en te analyseren Power-up Excel met 10 invoegtoepassingen om gegevens te verwerken, analyseren en visualiseren Net als een pro Start Excel met 10 invoegtoepassingen om gegevens te verwerken, analyseren en visualiseren als een pro-vanille Excel is geweldig, maar je kunt het nog krachtiger maken met invoegtoepassingen. Welke gegevens u ook moet verwerken, de kans is groot dat iemand hiervoor een Excel-app heeft gemaakt. Hier is een selectie. Lees verder . De belangrijkste Quandl-site fungeert als een databasezoekopdracht en lokaliseert databases van over de hele wereld die overeenkomen met uw zoektermen. Probeer het eens als je wat extra gegevens snel wilt hebben, of gewoon wilt spelen met grote datasets (eerlijk gezegd, wie niet ?!).

Quandl

Zie ook : De zoekmachine van de Enigma-database.

Kleine afbeeldingen

De Tiny Images-dataset werkt als een visueel woordenboek. Klik ergens binnen de afbeelding en een zoekterm verschijnt met extra informatie. U kunt ook specifieke termen gebruiken om 80 miljoen afbeeldingen te doorzoeken.

Visueel woordenboek

De database is onderdeel van een breder machine learning project. Hoe intelligente software je leven gaat veranderen Hoe intelligente software je leven gaat veranderen Skynet komt eraan en het zal ongelofelijk populair worden. Nieuwe AI-technologieën zijn in opkomst die de manier waarop we leven, spelen en werken zullen leren. Lees meer gericht op het onderwijzen van computers om semantische velden binnen afbeeldingen te "zien" en "lezen".

Bonusbron: / r / datasets

De 'voorpagina van internet' is een solide thuis voor liefhebbers van data mining over de hele wereld. Er zijn subreddes gewijd aan machine learning, datamining, tekst naar data en datasets. Als u iets specifieks nodig heeft, kunt u een verzoek indienen. Elke week verschijnen er nieuwe datasets.

Pas op voor de interessante datasets die zijn gepost zoals de immunisatieniveaus in kinderopvang en scholen voor Californië.

Gebruikt u de rijkdom?

Het internet heeft voor individuen de duidelijkste mogelijkheid gecreëerd om samen te komen en hun kennis te concentreren in één enkele database. We proberen overal alles over te documenteren. Sommige van deze databases zijn bedoeld om te worden bekeken, andere zijn bedoeld om te leren Hoe een Excel-draaitabel voor gegevensanalyse te gebruiken Een Excel-draaitabel gebruiken voor gegevensanalyse De draaitabel is een van de krachtigste hulpmiddelen in het Excel 2013-repertoire. Het wordt vaak gebruikt voor grote data-analyse. Volg onze stapsgewijze demonstratie om er alles over te leren. Lees meer, maar we hopen dat je ze allemaal leuk vindt.

Wat zijn je favoriete databases? Zijn er open massale referentiebronnen die ik in deze lijst had moeten opnemen?

Image Credits: netwerkserver via Shutterstock, bibliotheek via Shutterstock

In this article