Spraakherkenning was vroeger vreselijk onnauwkeurig. Het werkte maar een handvol van de tijd voor een handjevol mensen. Maar nu is het eigenlijk best goed, dankzij de gecombineerde inspanningen van Nuance, Microsoft, Apple en Google, die talloze middelen hebben gegooid om deze daadwerkelijk te verbeteren.
Van al deze bedrijven hebben weinigen de belofte in overeenstemming gebracht met spraakherkenning van Google, die het tot een fundamentele pijler van zijn mobiele en dienstenstrategie heeft gemaakt.
Een van Google's vroegste verkenners was de kortstondige GOOG-411 (of Google Voice Local Search). Het is gelanceerd in 2008 en heeft mensen in staat gesteld om met behulp van hun stem naar zakelijke telefoonnummers te zoeken. Spraakherkenningstechnologie is ook een centraal onderdeel van Android geweest en met de lancering van JellyBean zijn de grootste verbeteringen in Android 4.2 en 4.3? Wat zijn de grootste verbeteringen in Android 4.2 en 4.3? Als je vastzit op 4.0 Ice Cream Sandwich of 4.1 Jelly Bean, moet je upgraden? Read More het eindelijk beschikbaar offline.
Eerder deze week introduceerde Google eindelijk spraakherkenning in Google Documenten.
Gebruikers kunnen hun documenten letterlijk dicteren (net zoals ik met dit artikel doe) zonder de noodzaak om extra software of plug-ins te installeren. Het is een flinke stap voorwaarts voor de online kantoorsuite, maar is het goed?
Ermee beginnen
Voordat we beginnen met het verkennen van de functies, wil ik graag weten hoe u Google Voice Typing kunt krijgen. Als je een Google-account hebt, heb je dit al. Open Google-documenten en open een nieuw of bestaand document. Dan verschijnt er een venster met de vraag of u het dictaat wilt gebruiken. Klik op Probeer het .
Vervolgens moet je Google Documenten toestemming geven om je microfoon te gebruiken. Dat is gewoon een kwestie van klikken op Toestaan voor een pop-upvenster.
Vervolgens moet u de taal selecteren die u wilt gebruiken met Google Voice Typing. Het aanbod aan talen en dialecten varieert van Engels en Spaans tot Afrikaans en Arabisch.
Klik vervolgens op het microfoonpictogram en begin te praten.
Hoe nauwkeurig is het?
Een van de grootste obstakels voor spraakherkenning die de mainstream raakt, is dat het vaak niet nauwkeurig genoeg is . Vroeger was het een gegeven dat als je spraakherkenning gebruikt, je een paar uur nodig hebt om je tekst te bewerken en te corrigeren. Dus hoe gaat het aanbod van Google in dit opzicht?
Best wel aardig eigenlijk . Google Voice Typing heeft grotendeels begrepen wat ik zei, ook al heb ik een regionaal Engels accent ( we praten later over accenten ).
Ik was vooral onder de indruk van de wijze waarop de spraakherkenning van Google achtergrondgeluiden behandelde. Toen ik dit artikel schreef, blafte een Yorkshire Terrier in mijn woonkamer en mijn raam was gedeeltelijk open. Ik woon op een drukke weg waar auto's constant langsrijden. Maar ondanks dat kon Google dit filteren en focussen op wat ik precies zei.
Het grootste probleem was dat Google Voice Typing vaak worstelde met interpunctie. Ik zou "komma", "periode" en "volledige stop" zeggen, en het zou dat interpreteren als dat ik "komma", "periode" en "volledige stop" wil schrijven. Dit was frustrerend om twee redenen.
Ten eerste, omdat het me zou honen, door eerst de juiste interpunctie te gebruiken, voordat we onmiddellijk teruggaan naar de gespelde versie van het woord. Er was geen manier om dit te stoppen en ik zou het document handmatig moeten bewerken om het te repareren.
Maar misschien nog erger, ik kon het niet voorkomen dat het gebeurde. Er is geen woordenboek waarin u spellingen kunt overschrijven. Het gebeurt gewoon en je moet ermee omgaan.
Ik wil niet onderschatten hoe frustrerend dit is. Het is heel vervelend . Maar het is ook iets waarvan ik zeker weet dat het zal worden verbeterd, omdat steeds meer mensen deze functie gebruiken en Google meer middelen gebruikt om zijn spraakherkenning te verbeteren.
Naast die ergernis, was ik behoorlijk tevreden met de nauwkeurigheid van de spraakherkenning van Google.
Hoe het accenten behandelt
Ik was verbaasd over het aantal talen en dialecten dat Google Voice Typing ondersteunt. Alleen al in het Engels ondersteunt het de Nieuw-Zeelandse, Australische, Indiase, Zuid-Afrikaanse, Amerikaanse en Britse dialecten, om er maar een paar te noemen. Het probleem is dat er niet echt een Amerikaans accent is, net zoals er geen Brits accent is. Integendeel, er zijn een reeks accenten en dialecten die van plaats tot plaats verschillen.
Het is een gemeenplaats dat het VK een accent heeft voor elke postcode. Het MakeUseOf Team biedt een scala aan verschillende accenten onder het Britse personeel. Christian Cawley spreekt met een breed Middlesbrough-accent. Rob Nightingale, die uit Southport komt, heeft een noordelijker drawl. Terwijl Mark O'Neil een Schotse twang heeft.
Ik woon in Liverpool, dus ik heb een Scouse-accent dat enigszins de Atlantische oceaan induikt, grotendeels dankzij mijn Amerikaanse verloofde en de tijd die ik in Zwitserland doorbracht.
En het is eerlijk om te zeggen dat spraakherkenningsprogramma's vaak worstelen om de regionale Engelse dialecten te begrijpen. Toen Siri uitkwam, bijvoorbeeld, werd het onvermogen om Schotse gebruikers te begrijpen een lopende grap.
Maar het aanbod van Google was uitzonderlijk. Geloof me als ik zeg dat je niet hoeft te oefenen met een ander accent. Welke Apps & Websites zullen mijn Accent verbeteren bij het spreken van een andere taal? Welke apps en websites zullen mijn accent verbeteren wanneer ik een andere taal spreek? Ik wil echt dat mijn uitspraak overeenkomt met die van een moedertaalspreker. Zijn er apps of websites die me kunnen helpen? Lees verder . Ik heb met een handjevol vrienden gesproken die ook regionale Engelse accenten hebben, en ze hebben er eveneens positieve ervaringen mee. Hoewel ik toegeef dat dit een klein en volledig onwetenschappelijk monster is, is het zeker veelbelovend.
Stem dicteersnelheid
Spraakherkenningsprogramma's zijn van oudsher verlamd door het onvermogen om de snelheid bij te houden die de gebruiker dicteert. Toegegeven, ik was een beetje bezorgd dat het aanbod van Google niet anders zou zijn, vooral gezien het feit dat het een online service is, in plaats van een programma dat draait op mijn opgevoerde MacBook Pro.
Maar ik was onder de indruk. Google was in staat om mijn sterk cafeïnevrije spreekvaardigheid bij te houden en werkte niet als een bottleneck voor mijn productiviteit. Het was het tegenovergestelde van mijn ervaringen met andere spraakdicteerhulpmiddelen.
Ik weet niet of dat kwam omdat ik een snelle FTTC heb (Fibre to the Cabinet). Wat is het verschil tussen FTTC en FTTP, en waarom zou u erom geven? Wat is het verschil tussen FTTC en FTTP, en waarom zou u erom geven? We zijn er allemaal geweest op een bepaald moment. Ziek van onze internetdienst, op zoek naar een nieuwe manier om verbinding te maken met internet, maar in de war door de vele verschillende opties. Lees Meer thuis internetverbinding, of het feit dat Google een grenzeloze voorraad van snelle servers tot zijn beschikking heeft. Hoe dan ook, ik kon dingen gedaan krijgen.
Een opmerking over microfoons
Ingebouwde microfoons hebben de neiging om te slaan en missen. In mijn ervaring zijn ze uitstekend, net als op Apple's laptops, of niet. Er is zelden een middenweg.
Als algemene regel geldt dat de goedkoopste laptops de beste laptops onder de $ 300 zijn: alles wat u moet weten Beste laptops onder de $ 300: alles wat u moet weten Het vinden van een goede laptop voor minder dan $ 300 is tegenwoordig bijna onmogelijk, maar kan worden gedaan als u weet wat Zoeken naar. Hier is alles wat u moet weten om een aankoop te doen ... Lees Meer heeft de slechtste interne microfoons. Het is slechts een van die functies die meestal worden over het hoofd gezien door fabrikanten van apparaten.
Ik begon dit artikel te dicteren met de interne microfoon op mijn MacBook Pro. Hoewel Google Docs vaak zei dat het problemen had om mij te horen, vertaalde dit zich niet naar langzamer of onnauwkeurig dicteren. Alles werkte prima.
Ik heb ook Google Voice Typing geprobeerd met een dure Blue Yeti externe microfoon. Dit zijn podcast-kwaliteit microfoons die op Amazon voor meer dan $ 100 worden verkocht.
Blue Yeti USB-microfoon - Zilverblauwe Yeti USB-microfoon - Zilver Koop nu bij Amazon $ 110, 00
Toegegeven, ik merkte geen verschillen als het ging om de nauwkeurigheid of de snelheid van het dictaat. Het grootste voordeel van het gebruik van deze microfoon was dat ik een paar AKG-koptelefoons kon plaatsen en deze als een monitor kon gebruiken. Hierdoor kon ik me meer bewust zijn van achtergrondgeluid en mezelf aanpassen als ik te luid of te zacht was.
Laatste gedachten
Google stemherkenning is niet perfect. Maar dat is nauwelijks een verrassing, want solide spraakherkenning is een behoorlijk zware prestatie om mee te doen. Er is veel waarvan ik voelde dat het verbeterd kon worden.
Dit draait vooral om de manier waarop de software omgaat met interpunctie en zinsstructuur. In een ideale wereld zou Google automatisch interpunctie invoegen op basis van het ritme en de cadans van je stem, maar daar zitten we ver van af.
Het is ook jammer dat deze software zijn weg nog moet vinden in de andere aanbiedingen van Google, zoals Gmail. Idealiter zou ik de mogelijkheid willen hebben om Google Voice Typing als een app te downloaden en het te gebruiken met andere software, zoals iWork's Pages Pages 5.0 voor Mac Inclusief Smart Inspector Panel, maar Less Features Pages 5.0 voor Mac Inclusief Smart Inspector Panel, Maar minder functies Er zijn veel lichtgewicht en eenvoudig te gebruiken teksteditors voor Mac-gebruikers, maar voor projecten waarvoor functies voor desktop publishing nodig zijn, is Apple's onlangs gereviseerde Pages nog steeds een goede oplossing. Read More of de markdown-editor IA Writer iA Writer voor Mac en iOS: de beste tekstverwerker die u nooit hebt gebruikt iA Writer voor Mac en iOS: de beste tekstverwerker die u nooit hebt gebruikt Of het nu een schoolkrant of een blogpost is, we bevinden ons allemaal op een gegeven moment in de positie dat we een stel tekens in een tekstbestand moeten dumpen. Terwijl mobiele telefoon ... Lees meer.
Maar dat zijn twee kleine ergernissen, Google Voice Typing is net zo goed als mogelijk. Voor het contrast heb ik dit gedeelte van het artikel geschreven met de ingebouwde spraakherkenning van OS X, en het was lang niet zo accuraat en ook niet zo snel.
Als dit mensen niet overhaalt om over te schakelen naar Google Drive, weet ik niet wat het zal doen.
Nu aan jou! Ben je in de verleiding gekomen door de spraakherkenning van Google Drive? Heb je het al geprobeerd? Vertel me er alles over in de reacties hieronder.