Skip to content

Instantly share code, notes, and snippets.

@jirutka
Last active December 20, 2016 22:52
Show Gist options
  • Save jirutka/d3ad6b78765c01f2fd233090ba30941a to your computer and use it in GitHub Desktop.
Save jirutka/d3ad6b78765c01f2fd233090ba30941a to your computer and use it in GitHub Desktop.
Vyhledávání myšlenkou :: Úvaha na téma vyhledávání informací, kterou jsem napsal při studiích na FIT ČVUT v roce 2012.

Vyhledávání myšlenkou

Úvaha na téma vyhledávání informací, kterou jsem napsal při studiích na FIT ČVUT v roce 2012.

Úvod

Společnost IBM již šest let vydává na konci roku přehled pěti technologických inovací, tzv. „IBM Five in Five“, které mají potenciál v následujících pěti letech přinést významnou změnu do způsobu, jakým lidé žijí, pracují a baví se. Minulý rok se v tomto přehledu objevil fenomén čtení myšlenek. Fascinující technologie, která ještě před pár lety byla pouhým snem spisovatelů sci-fi románů, by se nyní měla stát skutečností. Jaké změny přinese do života lidí? Jak se například změní způsob, jakým vyhledáváme a zpracováváme informace?

„Život je hledání“, tak zní slogan společnosti, která na hledání založila svůj byznys. Každý den hledáme informace. Někdo hledá informace o technologických novinkách, o filmových trhácích, o dění v Japonsku nebo třeba o kamarádech a známých. Jiní hledají informace, které jim pomohou s vyřešením různých problémů, zodpoví zapeklité otázky. Díky globální internetové síti a „World Wide Webu“ máme většinu vědění lidstva na dosah kliknutí myší. Zdá se být až neuvěřitelné, že ještě před dvěma desetiletími se o něčem takovém lidstvu ani nesnilo. Jediný problém je se v té záplavě informací vyznat a najít odpovědi na otázky. S tím se nám snaží pomoci právě internetové vyhledávače.

Motivace

Představme si nyní motivační příklady. Trinity by se ráda podívala na jeden film, který kdysi viděla, ale nemůže si vzpomenout na jeho název. Matně si vzpomíná, že v něm byl jakýsi virtuální svět, ve kterém byli lidé uvězněni pod nadvládou strojů. Vybavují se jí útržky několika scén – zpomalený záběr muže vyhýbajícího se kulkám, robot vypadající jako chobotnice a proud padajících písmenek na obrazovce. Kdyby tak měla po ruce svého kamaráda, filmového kritika, ten by určitě hned věděl, který film má na mysli. Jenže nemá, tak ji nezbývá než googlit. Náhle má problémy dva. Jak tyto útržkovité informace přetavit do klíčových slov, aby podle nich našla kýžený film? Kdyby tak počítač věděl, co má na mysli…

Neo se zrovna nudí, a tak si řekl, že si vyzkouší nějaký nový programovací jazyk a napíše v něm jednoduchou hru. Po chvíli narazí na problém, neví jak se určitá věc v daném jazyce řeší. Má jasnou představu, čeho potřebuje dosáhnout, ale neví jak. Zkouší štěstí s Googlem, ale zřejmě ho nenapadají ta správná klíčová slova, kterými by tento problém popsal. Ovšem je si jistý, že stejný problém už muselo řešit mnoho lidí před ním a určitě je někde i dobře popsané řešení, jenom ho najít…

Současná omezení

Tyto příklady demonstrují jeden zásadní problém, které se pojí s fulltextovým vyhledáváním. Abychom vůbec mohli začít vyhledávat, musíme nejprve naše myšlenky a představy zformulovat do slov v přirozeném jazyce a vyseparovat z nich reprezentativní klíčová slova. Tímto procesem ovšem přijdeme o podstatnou část sémantické informace. Zbytek sémantiky poté zabije vyhledávač, neboť ten naše slova interpretuje víceméně jen jako posloupnosti znaků. Problém je, že i když máme jasnou představu o tom, co potřebujeme najít, tak bývá někdy poměrně složité ji formulovat slovy. Nevíme, jak se daná věc nazývá nebo ji lze popsat mnoha různými způsoby a jazyky. Stejná slova mohou mít různou sémantiku v závislosti na kontextu, který ovšem v klíčových slovech nelze dostatečně postihnout.

Vize

Nyní se pokusím nastínit vizi, jakým způsobem bychom mohli pracovat s počítačem, až budeme mít technologii pro čtení myšlenek. Záměrně nebudu zabíhat do detailů, neboť o fungování mozku mnoho nevím, pokusím se tedy poskytnout pouze abstraktní představu. Také se nebudu zabývat přímo vlastní technologií pro čtení myšlenek, takže jen naznačím, co si pod tím představuji. V zásadě by se mělo jednat o přenosné zařízení pro snímání mozkové činnosti, které dokáže zaznamenávat aktivitu neuronů a generovat z ní nějakou charakteristickou sadu signálů, tzv. „myšlenkovou stopu“.

Myšlenkové anotace

Dnes jsme na Internetu zvyklí k vizuálnímu, zvukovému i textovému obsahu přidávat tzv. tagy – slovní značení dodávající nějakou explicitní sémantickou informaci. Díky tomu je můžeme snáze kategorizovat a poté podle nich i vyhledávat. Tyto tagy je navíc možné zařadit do ontologie a provádět nad nimi odvozování.

Obdobně bychom mohli k obsahu přidávat myšlenkovou odezvu, kterou náš mozek vygeneruje při jeho analyzování. To znamená, že když budeme například sledovat video na Youtube, tak přitom budeme nahrávat svou mozkovou aktivitu a vzniklou myšlenkovou stopu automaticky odešleme indexovací službě. Jakmile bude mít stopy od dostatečného počtu uživatelů, tak pomocí speciální heuristiky najde často se vyskytující vzory, které budou pro dané video charakteristické. Tím se do určité míry eliminují ryze osobní asociace a rušivé vlivy z nesoustředěné pozornosti. Zároveň se mohou automaticky analyzovat pocity, které video v divácích vyvolává, zejména tedy zda se jim líbilo či nikoli.

Nyní máme u všech videí zaznamenané charakteristické myšlenkové vzory a pokročíme k vyhledávání. Představte si, že jste se právě vzpomněli na nějaké video, které jste před lety viděli, ale nemůžete si vzpomenout na jeho název ani žádnou další význačnou informaci. Zato si zřetelně vybavujete útržky několika scén, ale nic takového, co by se dalo jednoznačně popsat. Zapnete si nahrávání mozkové činnosti, zavřete oči a snažíte si vybavit všechny útržky vzpomínek, které si k danému videu pamatujete. Vzniklou myšlenkovou stopu odešlete vyhledávací službě, která ji porovná se záznamy v databázi a vrátí odkazy na konkrétní videa.

Myšlenkové stopy k řešení problémů

Další perspektivní možnost využití vidím v hledání řešení typických problémů, které už před námi řešila spousta dalších lidí. Oprosťme se nyní od etických otázek a představme si, že budete při každé konstruktivní práci na počítači, třeba programování, nahrávat svou mozkovou aktivitu. Jakmile narazíte na nějaký problém, jehož řešení neznáte, tak stiskem klávesy odešlete svoji myšlenkovou stopu za posledních několik minut do zvolené vyhledávací služby. Tato stopa bude obsahovat celý myšlenkový proces, který vedl až do bodu, se kterým si nevíte rady. Vyhledávač ji porovná se všemi stopami v databázi a pokud už někdo před vámi řešil stejný problém, tak vrátí jeho řešení. V opačném případě vám s politováním oznámí, že nic nenašel a vyzve vás, abyste zaslali vlastní řešení, až na nějaké přijdete. Jakmile pak někdo další bude řešit stejný problém, tak mu vyhledávač s trochou štěstí okamžitě vrátí vaše řešení. Spíše ale bude potřeba nejprve dostatečné množství myšlenkových stop k danému problému, aby se mohly odfiltrovat rušivé vlivy.

Automatická zpětná vazba

Nejspíš už jsem příliš ve sci-fi představách, takže uvedu ještě jeden příklad využití, které se drží trochu více při zemi a v podstatě už v dnešní době je technologicky realizovatelné. Tím je poskytování automatické zpětné vazby. Lidé jsou většinou líní vyplňovat multikriteriální hodnocení, stěží kliknou alespoň na líbí/nelíbí. Díky sledování mozkové aktivity v průběhu činností by se zpětná vazba mohla poskytovat zcela automaticky. Počítač by zaznamenával pocity, které daný článek, video nebo obrázek v uživateli vyvolá, extrahoval z nich několik základních údajů a odeslal jako zpětnou vazbu. Neocenitelný přínos by to měla i pro vývojáře aplikací, zejména při návrhu uživatelských rozhraní.

Závěr

Svou vizi jsem pojal trochu nekonvenčně, spíše jako sci-fi. Věřím však, že vedle záplavy vizí na sémantické vyhledávání zboží v e-obchodech, bude tato zajímavým zpestřením.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment