Co jsou Markovovy řetězce? 5 použití šikovných reálných světů

  • Owen Little
  • 0
  • 3286
  • 724
reklama

Možná jste tento termín slyšeli “Markovův řetězec” dříve, ale pokud jste nebrali několik tříd teorie pravděpodobnosti nebo algoritmů počítačové vědy Jak se naučit programování bez stresu Jak se naučit programování bez stresu Možná jste se rozhodli pokračovat v programování, ať už pro kariéru nebo jen jako koníček. Skvělý! Ale možná se začínáte cítit ohromeni. Není to tak skvělé. Zde je nápověda, která vám usnadní cestu. , pravděpodobně nevíte, co jsou, jak fungují a proč jsou tak důležité.

Představa o Markovově řetězci je “pod kapotou” koncept, což znamená, že opravdu nepotřebujete vědět, co jsou, abyste z nich mohli těžit. Určitě však můžete mít prospěch z pochopení toho, jak fungují. Jsou jednoduché, ale užitečné v mnoha ohledech.

Tady je pádový kurz - vše, co potřebujete vědět o Markovových řetězcích, se zhroutilo do jediného stravitelného článku. Pokud se chcete ponořit ještě hlouběji, vyzkoušejte kurz teoretické informace zdarma na Khan Academy (a zvažte také další online kursové stránky. 8 nejlepších webů pro bezplatné vysokoškolské kurzy online 8 nejlepších webů pro bezplatné vysokoškolské kurzy online Máte zájem o bezplatný přístup na vysokou školu) kurzy? Zde jsou některé z nejlepších webů, kde můžete zdarma online kurzy.).

Markovovy řetězce 101

Řekněme, že chcete předpovědět, jaké bude zítra počasí. Skutečná předpověď - druh prováděný odbornými meteorology 7 nejlepších bezplatných meteorologických aplikací pro Android 7 nejlepších bezplatných meteorologických aplikací pro Android Tyto bezplatné meteorologické aplikace vám pomohou zůstat na vrcholu počasí se zařízením Android. - zahrnuje stovky nebo dokonce tisíce různých proměnných, které se neustále mění. Meteorologické systémy jsou neuvěřitelně složité a nelze je modelovat, alespoň pro laiky, jako jste vy a já. Problém však můžeme zjednodušit pomocí odhadů pravděpodobnosti.

Představte si, že jste měli přístup k třicetiletým údajům o počasí. Začnete na začátku a všimnete si, že 1. den byl slunečný. Pokračujte, všimněte si, že Den 2 byl také slunečný, ale Den 3 byl oblačno, pak Den 4 byl deštivý, což vedlo k bouřce v Den 5, následované slunnou a jasnou oblohou v Den 6.

V ideálním případě byste byli podrobnější, kdybyste se rozhodli namísto analýzy ze dne na den analyzovat každou hodinu, ale toto je pouze příklad pro ilustraci tohoto konceptu, tak mějte se mnou!

Uděláte to během celého 30letého souboru údajů (což by bylo jen plachých 11 000 dnů) a na základě dnešního počasí vypočítáte pravděpodobnost jaké bude zítřejší počasí. Například, pokud je dnes slunečno, pak:

  • 50% šance, že zítra bude zase slunečno.
  • 30% šance, že zítra bude zataženo.
  • 20% šance, že zítra bude deštivé.

Nyní to opakujte pro všechny možné povětrnostní podmínky. Pokud je dnes zataženo, jaké jsou šance, že zítra budou slunečno, deštivé, mlhavé, bouřky, krupobití, tornáda atd.? Brzy máte celý systém pravděpodobností, který můžete použít k předpovědi nejen zítřejšího počasí, ale příštího dne a následujícího dne.

Přechodné státy

Toto je podstata Markovova řetězce. Máte jednotlivé stavy (v tomto případě povětrnostní podmínky), kde každý stát může přecházet do jiných stavů (např. Slunečné dny mohou přecházet do zataženo) a tyto přechody jsou založeny na pravděpodobnosti. Pokud chcete předpovědět, jaké bude počasí v jednom týdnu, můžete prozkoumat různé pravděpodobnosti během následujících sedmi dnů a zjistit, které z nich jsou nejpravděpodobnější. Tak, Markov “řetěz”.

Kdo je Markov? Byl to ruský matematik, který přišel s celou myšlenkou, že jeden stát vede přímo do jiného státu na základě určité pravděpodobnosti, kde žádné jiné faktory neovlivňují přechodnou šanci. V podstatě vynalezl Markovův řetězec, tedy pojmenování.

Jak se Markovovy řetězce používají ve skutečném světě

S vysvětlením z cesty pojďme prozkoumat některé aplikace ve skutečném světě, kde se jim hodí. Možná vás překvapí zjištění, že jste celou dobu využívali Markovovy řetězy, aniž byste to věděli!

Generování jmen

Zúčastnili jste se někdy stolního hraní, hraní MMORPG nebo dokonce psaní beletrie? Možná jste trpěli nad pojmenováním svých postav (alespoň v jednom bodě nebo jiném) - a když jste prostě nemohli myslet na jméno, které se vám líbí, pravděpodobně jste se uchýlili k online generátoru jmen Vytvořte nový alias pomocí Nejlepší online generátoři jmen [Weird & Wonderful Web] Vytvořte nový alias s nejlepšími online generátory Name [Weird & Wonderful Web] Vaše jméno je nudné. Naštěstí můžete přejít online a vybrat si nový alias pomocí jednoho z nespočetných generátorů jmen dostupných na internetu. .

Přemýšleli jste někdy, jak tito generátoři fungují? Jak se ukázalo, mnoho z nich používá Markovovy řetězce, což z něj činí jedno z nejpoužívanějších řešení. (Existují i ​​jiné algoritmy, které jsou samozřejmě stejně efektivní!)

Vše, co potřebujete, je sbírka dopisů, kde každé písmeno obsahuje seznam možných následných dopisů s pravděpodobnostmi. Takže například dopis “M” má 60% šanci vést dopis “A” a 40 procent šanci vést k dopisu “Já”. Udělejte to pro spoustu dalších písmen a spusťte algoritmus. Boom, máš jméno, které dává smysl! (Každopádně většinou.)

Google PageRank

Jedním ze zajímavých důsledků Markovovy teorie řetězců je to, že jak se délka řetězce zvyšuje (tj. Zvyšuje se počet přechodů státu), pravděpodobnost, že přistaneš v určitém stavu, se sbližuje na pevném počtu a tato pravděpodobnost je nezávislá na tom, kde začnete v systému.

To je nesmírně zajímavé, když uvažujete o celém světě jako o Markovově systému, kde každá webová stránka je stát a odkazy mezi webovými stránkami jsou přechody s pravděpodobností. Tato věta v podstatě říká, že bez ohledu na to, na které webové stránce začnete, je vaše pravděpodobnost přistání na určité webové stránce X pevná pravděpodobnost, za předpokladu, že “dlouho” surfování.

Obrázek Kredit: 345 Kai přes Wikimedia

A to je základ toho, jak Google řadí webové stránky. Algoritmus PageRank je ve skutečnosti modifikovanou (přečtenou: pokročilejší) formou algoritmu Markovova řetězce.

Čím vyšší je “pevná pravděpodobnost” čím se dostanete na určitou webovou stránku, tím vyšší je PageRank. Je to proto, že vyšší pevná pravděpodobnost znamená, že webová stránka obsahuje mnoho příchozích odkazů z jiných webových stránek - a Google předpokládá, že pokud webová stránka obsahuje mnoho příchozích odkazů, pak to musí být cenné. Čím více příchozích odkazů, tím cennější je.

Je to samozřejmě mnohem složitější, ale dává to smysl. Proč mají stránky jako About.com na stránkách s výsledky vyhledávání vyšší prioritu? Protože se ukáže, že uživatelé mají tendenci tam dorazit, když procházejí web. Zajímavé, že??

Psaní predikce slov

Mobilní telefony mají prediktivní psaní po celá desetiletí, ale můžete hádat, jak se tyto předpovědi vytvářejí? Ať už používáte Android (alternativní možnosti klávesnice Co je nejlepší alternativní klávesnice pro Android? Jaká je nejlepší alternativní klávesnice pro Android? Podíváme se na některé z nejlepších klávesnic v Obchodě Play a testujeme je.) nebo iOS (alternativní možnosti klávesnice 9 Alternativní klávesnice iOS, které vám usnadní psaní nebo více zábavy 9 Alternativní klávesnice iOS, které vám usnadní psaní nebo více zábavy Když Apple konečně přestal jednat jako nadřazený rodič a představil klávesnice třetích stran, všichni šli na klávesnici - blázen.), je tu velká šance, že vaše aplikace výběru používá řetězy Markov.

To je důvod, proč se aplikace klávesnice zeptají, zda mohou shromažďovat data podle vašich zvyků při psaní. Například v Klávesnici Google se volá nastavení Sdílet úryvky to vyžaduje “sdílejte úryvky toho, co a jak píšete v aplikacích Google, abyste vylepšili klávesnici Google”. V podstatě jsou vaše slova analyzována a začleněna do pravděpodobnosti aplikace Markovova řetězce.

To je také důvod, proč aplikace pro klávesnice často nabízejí tři nebo více možností, obvykle v pořadí od nejpravděpodobnější po nejméně pravděpodobnou. Nemůže to s jistotou vědět, co jste chtěli napsat dál, ale je správnější častěji než ne.

Simulace subreddit

Pokud jste nikdy nepoužili Reddit, doporučujeme vám, abyste se alespoň podívali na tento fascinující experiment nazvaný / r / SubredditSimulator..

Jednoduše řečeno, Subreddit Simulator přebírá obrovskou část VŠECHNY komentářů a titulů napříč četnými komunitami Redditu a poté analyzuje jednotlivé věty každé slovo. Použitím těchto dat se generují pravděpodobnosti mezi jednotlivými slovy - poté se pomocí těchto pravděpodobností generují tituly a komentáře od nuly.

Jednou zajímavou vrstvou tohoto experimentu je to, že komentáře a tituly jsou roztříděny podle komunity, ze které data pocházejí, takže druhy komentářů a titulů generovaných datovým souborem / r / food se výrazně liší od komentářů a titulů generovaných pomocí / r / fotbalové údaje.

A nejzábavnější - nebo možná nejvíce znepokojující - součástí toho všeho je, že generované komentáře a tituly mohou být často nerozeznatelné od těch, které vytvořili skuteční lidé. Je to naprosto fascinující.

Znáte nějaké jiné skvělé využití pro Markovovy řetězce? Máte nějaké otázky, na které je třeba odpovědět? Dejte nám vědět v komentáři níže!




Bisher hat noch niemand einen Kommentar zu diesem Artikel abgegeben.

O moderní technologii, jednoduché a cenově dostupné.
Váš průvodce ve světě moderních technologií. Naučte se, jak používat technologie a pomůcky, které nás každý den obklopují, a naučte se, jak objevovat na internetu zajímavé věci.