Jak je hlasové psaní novou nejlepší funkcí Dokumentů Google

  • Gabriel Brooks
  • 1
  • 3954
  • 301
reklama

Rozpoznávání hlasu bylo strašně nepřesné. Fungovalo to jen pro hrstku lidí, hrstku času. Ale nyní je to vlastně docela dobré, díky kombinovanému úsilí Nuance, Microsoft, Apple a Google, které hodily nespočet zdrojů na jejich skutečné zlepšení.

Ze všech těchto společností málokdo splnil závazek k hlasovému rozpoznávání Google, který z něj učinil zásadní lynchpin její strategie mobilních služeb a služeb.

Jedním z prvních nájezdů společnosti Google byl krátkodobý GOOG-411 (nebo Google Voice Local Search). Zahájena v roce 2008 a umožnila lidem vyhledávat firemní telefonní čísla pomocí hlasu. Technologie rozpoznávání hlasu byla také středobodem systému Android a se spuštěním JellyBean Jaké jsou největší vylepšení v systémech Android 4.2 a 4.3? Jaké jsou největší vylepšení v systému Android 4.2 a 4.3? Pokud jste přilepená na 4.0 Ice Cream Sandwich nebo 4.1 Jelly Bean, měli byste upgradovat? nakonec se stal dostupným offline.

Začátkem tohoto týdne společnost Google konečně zavedla rozpoznávání hlasu do Dokumentů Google.

Uživatelé mohou doslova diktovat své dokumenty (podobně jako to dělám s tímto článkem) bez nutnosti instalovat žádný další software nebo plug-iny. Je to významný skok vpřed pro online kancelářský balíček, ale je to dobré?

Začínáme

Než začneme potápět s jeho funkcemi, chci se dotknout toho, jak získáváte psaní Google Voice. Pokud máte účet Google, máte již tento účet. Stačí otevřít Dokumenty Google a otevřít nový nebo existující dokument. Poté se objeví okno s dotazem, zda chcete vyzkoušet hlasový diktát. Klikněte na Zkus to.

Dále musíte dát Dokumentům Google oprávnění k používání mikrofonu. To je jen otázka kliknutí Dovolit do vyskakovacího okna.

Poté musíte vybrat jazyk, který chcete použít při psaní na Google Voice. Nabídka jazyků a dialektů se pohybuje od angličtiny a španělštiny, po afrikánštinu a arabštinu.

Poté stačí kliknout na ikonu mikrofonu a začít mluvit.

Jak přesné to je?

Jednou z největších překážek rozpoznávání hlasu, která zasáhla mainstream, je to často není to dost přesné. Dříve se ukázalo, že pokud používáte rozpoznávání hlasu, budete muset strávit několik hodin úpravou a opravou textu. Jak tedy společnost Google nabízí v tomto ohledu jízdné?

Vlastně docela příznivě. Google Voice Typing z velké části porozuměl tomu, co jsem řekl, přestože mám regionální anglický přízvuk (o akcentech si promluvíme později).

Obzvláště na mě udělal dojem, jak rozpoznávání hlasu od společnosti Google zacházelo s hlukem v pozadí. Když jsem psal tento článek, v mém obývacím pokoji štěkal Yorkshire Terrier a moje okno bylo částečně otevřené. Bydlím na rušné silnici, kde auta neustále projíždějí kolem. Ale přesto to Google dokázal odfiltrovat a soustředit se jen na to, co jsem říkal.

Největším problémem bylo psaní Google Voice, které se často potýkalo s interpunkcí. Řekl bych, že “čárka”, “doba” a “tečka”, a to by to interpretovalo, když jsem chtěl psát “čárka”, “doba”, a “tečka”. To bylo frustrující ze dvou důvodů.

Zaprvé, protože by mě to posmrtilo tím, že nejprve použiji správnou interpunkci, než se okamžitě vrátím k hláskované verzi slova. Neexistoval žádný způsob, jak to zastavit, a já bych musel ručně upravit dokument, aby byl opraven.

Ale možná ještě horší, nemohl jsem tomu zabránit. Neexistuje slovník, ve kterém byste mohli potlačit hláskování. Stává se to, a vy se s tím musíte vypořádat.

Nechci pochopit, jak je to frustrující. Je to vážně nepříjemné. Ale je to také něco, o čem jsem přesvědčen, že bude vylepšen, protože čím dál více lidí tuto funkci používá, a jak společnost Google věnuje více zdrojů na zlepšení rozpoznávání hlasu.

Kromě této zvláštní nepříjemnosti jsem byl docela potěšen přesností rozpoznávání hlasu Google.

Jak zachází s akcenty

Byl jsem ohromen tím, kolik jazyků a dialektů podporuje Google Voice Typing. Pouze v angličtině podporuje novozélandské, australské, indické, jihoafrické, americké a britské dialekty. Problém je, že ve skutečnosti neexistuje americký přízvuk, podobně jako britský přízvuk. Spíše existuje řada akcentů a dialektů, které se liší od místa k místu.

Je pravda, že Spojené království má pro každý poštovní směrovací číslo důraz. Tým MakeUseOf se může pochlubit řadou různých přízvuků mezi britskými zaměstnanci. Christian Cawley mluví s širokým přízvukem Middlesbrough. Rob Nightingale, který pochází z Southportu, má severnější tah. Zatímco Mark O'Neil má skotský záblesk.

Bydlím v Liverpoolu, takže mám přízvuk Scouse, který se mírně unáší do Atlantiku, hlavně díky mému americkému snoubenci a času, který jsem strávil ve Švýcarsku.

A je spravedlivé říci, že programy rozpoznávání hlasu se často snaží porozumět regionálním anglickým dialektům. Když například vyšel Siri, jeho neschopnost pochopit skotské uživatele se stala běžným vtipem.

Ale nabídka společnosti Google byla výjimečná. Věřte mi, když říkám, že nebudete muset cvičit mluvení s jiným přízvukem. Jaké aplikace a weby pomohou vylepšit můj přízvuk při mluvení jiným jazykem? Jaké aplikace a weby pomohou vylepšit můj přízvuk při mluvení jiným jazykem? Opravdu chci, aby moje výslovnost odpovídala výslovnosti rodilého mluvčího. Existují nějaké aplikace nebo weby, které mi mohou pomoci? . Mluvil jsem s hrstkou přátel, kteří mají také regionální anglické akcenty, a měli s tím podobně pozitivní zkušenosti. I když připouštím, že je to malý a zcela nevědecký vzorek, je to určitě slibné.

Rychlost diktování hlasu

Programy rozpoznávání hlasu byly tradičně zasaženy neschopností držet krok s rychlostí, kterou uživatel diktuje. Nepochybně jsem se trochu obával, že nabídka společnosti Google se neliší, zejména vzhledem k tomu, že se jedná o online službu, spíše než o program běžící na mém systému MacBook Pro.

Ale byl jsem ohromen. Google dokázal držet krok s mou rychlostí mluvení s vysokou úrovní kofeinu a nepůsobil jako překážka mé produktivity. Byl to úplný opak mých zkušeností s jinými nástroji hlasového diktování.

Nevím, zda to bylo proto, že mám rychlý FTTC (Fibre to Cabinet). Jaký je rozdíl mezi FTTC a FTTP a proč by vás to mělo zajímat? Jaký je rozdíl mezi FTTC a FTTP a proč by vás to mělo zajímat? Všichni jsme tam byli v jednom okamžiku. Nemocný z naší internetové služby, hledající nový způsob připojení k internetu, ale zmatený mnoha různými možnostmi. domácí internetové připojení nebo skutečnost, že Google má k dispozici neomezené množství rychlých serverů. Ať tak či onak, dokázal jsem to udělat.

Poznámka k mikrofonům

Vestavěné mikrofony bývají zasaženy. Podle mých zkušeností jsou buď vynikající, jako na laptopech Apple, nebo ne. Existuje velmi zřídka jakékoli prostřední terén.

Obecně platí, že nejlevnější notebooky Nejlepší notebooky do 300 USD: Vše, co potřebujete vědět Nejlepší notebooky do 300 USD: Vše, co potřebujete vědět Nalezení dobrého notebooku za méně než 300 USD je v těchto dnech téměř nemožné, ale lze to udělat, pokud víte, co hledat. Zde je vše, co potřebujete vědět, abyste si mohli koupit ... budete mít nejhorší interní mikrofony. Je to jen jedna z funkcí, které výrobci zařízení obvykle přehlíží.

Začal jsem diktovat tento článek pomocí interního mikrofonu na svém MacBook Pro. Ačkoli Google Docs často říkal, že měl potíže se mnou, to se nepřekládalo na pomalejší nebo nepřesné diktování. Všechno fungovalo dobře.

Vyzkoušel jsem také službu Google Voice Typing s drahým externím mikrofonem Blue Yeti. Jedná se o mikrofony v kvalitě podcast, které na Amazonu prodávají za více než 100 USD.

Je pravda, že jsem si nevšiml žádných rozdílů, pokud jde o přesnost nebo rychlost diktátu. Největší výhodou používání tohoto mikrofonu však bylo, že jsem dokázal vložit sluchátka AKG a použít je jako monitor. To mi umožnilo lépe si uvědomit hluk v pozadí a přizpůsobit se, pokud jsem byl příliš hlasitý nebo příliš tichý.

Závěrečné myšlenky

Rozpoznávání hlasu Google není dokonalé. To je ale sotva překvapení, protože solidní rozpoznávání hlasu je docela těžké se odtrhnout. Je toho hodně, co jsem cítil, že se dá vylepšit.

To se většinou soustředí na to, jak se software zabývá interpunkcí a strukturou vět. V ideálním světě by Google automaticky vkládal interpunkci na základě rytmu a kadence vašeho hlasu, ale jsme dlouho daleko od toho.

Je také škoda, že tento software se dosud nedostal do dalších nabídek společnosti Google, jako je Gmail. V ideálním případě bych ráda možnost stáhnout Google Voice Typing jako aplikaci a použít ji s jinými částmi softwaru, jako je Stránky iWork Pages Pages 5.0 pro Mac včetně panelu Smart Inspector, ale Méně funkcí Pages 5.0 for Mac zahrnuje Panel Smart Inspector, Ale méně funkcí Existuje mnoho lehkých a snadno použitelných textových editorů pro uživatele Mac, ale pro projekty vyžadující funkce publikování na počítači jsou nedávno přepracované Stránky společnosti Apple stále dobrým řešením. nebo editor Markdown IA Writer iA Writer pro Mac & iOS: Nejlepší textový procesor, který jste nikdy nepoužívali iA Writer pro Mac & iOS: Nejlepší textový procesor, který jste nikdy nepoužili Ať už je to školní papír nebo blogový příspěvek, vše nás se v určitém okamžiku ocitneme v pozici, kdy musíme do textového souboru vyhodit spoustu znaků. Zatímco mobilní telefon… .

Ale to jsou dvě drobné nepříjemnosti, Google Voice Typing je stejně dobrý, jak to vypadá. Naproti tomu jsem tuto část článku napsal pomocí vestavěného rozpoznávání hlasu OS X a nebylo to ani tak přesné, ani rychlé.

Pokud to lidi nepřesvědčí, aby přešli na Disk Google, nevím, co budou.

Nyní k vám! Byl jste v pokušení rozpoznávání řeči na Disku Google? Už jste to vyzkoušeli? Řekněte mi o tom vše v komentářích níže.




08.03.24 10:45
oral atorvastatin 10mg <a href="https://lipiws.top/">order atorvastatin 10mg generic</a> purchase lipitor generic
O moderní technologii, jednoduché a cenově dostupné.
Váš průvodce ve světě moderních technologií. Naučte se, jak používat technologie a pomůcky, které nás každý den obklopují, a naučte se, jak objevovat na internetu zajímavé věci.