0405algorytm_podcast.md

WEBVTT

00:00.000 --> 00:28.720 ja mul on täna sünnipäev , nii et võite õnne soovida . aitäh , aitäh . et , et saade on küll eetris homme , aga siis on juba vaja , siis homme ootame juba järgmist . mis saab olema vähe ümmargusem number . igaüks võib omad järeldused teha siit . no tore . no ja kui ümmargune saab olla on ju . täpselt . aga ma ei tea , siis paneme leekima .

00:30.000 --> 00:30.240 tere jälle algoritmi kuulama eetris on meie saja kaheksakümne teine episood ja mina olen Tiit Paanonen Eesti Langeväe klubist . täna minuga koos veab saadet Martin Kapp , Pait Rävis . nii ja , ja tänase saate teema , no ja tehisintellekt tuleb siin mürinaga ja on kindlasti ütleme sellise hype kurvi tipus praegu .

01:00.000 --> 01:30.000 võib-olla isegi juba vaikselt hakkab sealt mäest alla sõitma . et noh , siin inimesed koostavad nimekirju ametitest , mis kaovad ja , ja ma arvan , täna algoritmid kujundavad ühiskondlikku arvamust palju rohkem kui poliitikud või muud asjapulgad üldse kokku suudavad , eks ju , et muidugi meil on parim saade , algoritmid mõjutavad kõike . need rüvid on meil väga head ja , ja täna võtame siis jälle sellise helikoptervaate nagu kogu tehisintellekti teemale ja , ja selleks oleme palunud

01:30.000 --> 02:00.000 külla Taavi Tammiste Fimast . tere , Tavi ja Taavi on meil saates teist korda , et kui kuulajad tahavad minna tagasi , siis üheksakümne kaheksas episood rääkis Fimast ja , ja see oli eetris kahekümne kolmandal septembril kaks tuhat kakskümmend üks aastal . Jõhker meil on nagu nii palju episoode ja see on üheksakümmend episoodi tagasi . ma jäin ise sama mõtlema , et väga pikk aeg on seal vahepeal . no aeg lendab , eks ju , et aga , aga Taavi nüüd praegu tuletad

02:00.000 --> 02:09.080 kuulajatele kiiresti meelde , et millega , millega Fima tegeleb ja , ja kuidas , kuidas juhtus nii , et sina seda nagu vead , et .

02:30.000 --> 02:59.960 jah , ja tegelikult me sattusime ühe projekti otsa Tallinna linnaga , kus Tallinna linn tahtis omal ajal liikluskaameratest siis tuvastada , kui mitu autot sõidab tänaval . ja , ja see projekt võttis üllatavalt kaua aega , vist kaheksa kuud kokku ja , ja tänaseks me oleme loonud siis niisuguse toote , et seda konkreetset lahendust saaks teha näiteks kahe , kahekümne sekundiga . see ei ole küll ka enam meie nagu tegevusvaldkond , et me väga linnadega ei tööta , et me oleme siin viimase .

03:00.000 --> 03:30.000 kaheksa või üheksa kuuga leidnud oma niši just kinnisvaraarendajate valdkonnas . kuule , aga nüüd on mulle hea võimalus küsida siin . noh , eks me siin Tallinnas ringi sõites ise tunneme , kuidas need asjad siin on sätitud , et praegu on sisuliselt võimatu siin mere ääres liigelda , aga , aga räägi natuke seda vahele korraks , et kui palju nagu fooride intervallid sõltuvad liikluskoormusest

03:30.000 --> 04:00.000 kas seal on mingisugune algoritm , mis nagu seda optimeerib . üllatavalt vähe , kusjuures seda ma olen ka tunnetanud , et tõesti , et nagu see on nagu the thing , et kõik seisavad , midagi ei toimu ja keegi ei liigu ja kõik ootavad . ja , ja me oleme , kusjuures sellega me esimest korda puutusime kokku omal ajal Dubais , kui me käisime Dubai kiirendis ja , ja seal oli selles suhtes erakordne võimalus seda katsetada , sellepärast et

04:00.000 --> 04:30.000 kes Dubais on käinud , seal on üks suur see Sheikh Zayed Boulevard on ju , seal on nii-öelda alguses ja lõpus on siis ristuvad teed , et seal oleks ideaalne seda kasutada , sellepärast et noh , peamine liiklus on ühe tee peal ja siis noh , millal iganes liiklus kõrval tee peal tuleb , saad sa siis seda foore muuta ja neil oli isegi see automaatika valgsooridesse sisse ehitatud , et nad saaksid seda kontrollida , aga seal on erinevad liiklusstandardid , millele sa pead , liiklusohutuse standardid , millele sa pead järgima ja see on selline noh , ütleme , et võrdlemisi keeruline

04:30.000 --> 05:00.000 on valdkond , kuhu sisse minna ja seal on ka bürokraatiat omajagu taga , et seda otsust teha lõpuks . ja , ja ma mõtlen lihtsalt ühiskondlik raiskamine on nagu päris tohutu , et , et see , see kaotatud käive , mis sinna ootamisse läheb , nagu päris , mitte ainult käive , seal on ka nagu nii-öelda kliima tagajärg , et noh , kui me näiteks Ülemiste keskusesse kunagi hakkasime parkimist tegema , siis selle arvelt , et autod otsisid vähem parkimist ,

05:00.000 --> 05:30.000 hoiti päris korralik kogus CO kahte kokku . no täpselt sama asi on punased foorid taga istumine on ju , et ja täpselt niimoodi , aga , aga sa mainisid , et nüüd olete kinnisväga peale läinud , et jälgite siis mängu kuidagi kinnisväe kinnistute lõikes ja no ütleme , et sellised meid , meid võib vaadata kui sihukest Google Analyticsi , aga füüsilise ruumi jaoks , et iga ettevõte , kellel on mingisugune füüsiline ruum , kus liigub käive ,

05:30.000 --> 06:00.000 sõbralikult , mida saab optimeerida seda , seda saab tegelikult teha siis , et noh , tänaseks meie me oleme näiteks live'is Helsingi sadamas , Helsingi lennujaamas vaatame hästi lihtsaid asju nagu näiteks mingisugust äri- täituvust kuni keerulisemate asjadeni , konteiner sadamate täituvuseni ja nii edasi , nii edasi , nii edasi , aga noh , selle kõige nii-öelda alustala ongi see , et selle meie süsteemi saab püsti panna niimoodi paari minutiga , et sa ei pea eraldi andmeteadustiimi palkama .

06:00.000 --> 06:30.000 hakkama treenima seal mudeleid ja kogu sihukest asja ja , ja see töötab iga kaameraga , et noh , meil ongi hästi-hästi , aga edasi , meie partner Soomes on Elisa , kes siis kuna Elisel on Soomes üleriigiline viis G võrk , mis nad teevad , on see , et nad võtavad tavalise Samsungi telefoni viis G telefoni , prindivad selle kolmde kolmde prindivad sinna kesta ümber ja laetavad neid kui kaameraid igal pool üles ja tegelikult selle A I tarkuse panevad siis nii-öelda läbi meie sinna külge , kus palju kohe kõige karmima küsimuse ,

06:30.000 --> 07:00.000 kas need business lounge täituvuse analüüsiks võetavad video freimid , kas seal on inimeste näod udustatud ? jah , ütleme niimoodi , et et isegi mitte ei ole udustatud , vaid meie ei salvesta video data üldse ehk meie pipeline on niimoodi ehitatud , et ta töötab justkui selline funnel , et data tuleb sisse , tuvastused toimuvad ära ja nii-öelda kõik , mis sealt välja läheb , siis kustub noh , kustub ise automaatselt ära , mis , kus ,

07:00.000 --> 07:30.000 praatsuse teema tuleb veel olulisemaks on see , et kuidagi sa pead ju selle mudeli valmis treenima , mis tuvastab inimesi onju ja vaata seal pead sa olema küll hästi ettevaatlik , et et sellest hetkest , kui andmed jõuavad nagu sinu kätte , praktiliselt enne seda peavad olema need andmed anonüümiseeritud , muidu sa neid kasutada ei või . ja omal ajal , kui me seda teenust ehitasime , siis me rääkisimegi AKiga asju läbi , me oleme AKiga laval isegi käinud sellest rääkimast , kuidas see koostöö sujus , see oli hästi meeldiv tegelikult ja tänaseks me oleme rääkinud ka

07:30.000 --> 08:00.000 UK selle andmekaitseagentuuriga läbi , et , et , et noh , me oleme suhteliselt nii-öelda turvaline GDPRi safe lahendus , küll aga see tähendab , et meil võib-olla mõni funktsionaalsus vähem , näiteks me ei tohi jälitada üht objekti kaamerast kaamerasse , sest see on ka nii-öelda biomeetriline tuvastus ja nii edasi , nii edasi , et ma arvan , et me oleme üks , üks väheseid startup Eestis , kes on väga suure hunniku oma eelarvet pannud nii-öelda juristide alla , et see asi oleks suhteliselt kurikindel .

08:00.660 --> 08:06.540 kuule , aga kui sa ütlesid , et te olete ikkagi startup , kas see tähendab seda , et te olete endiselt nii-öelda investeeringufaasis ?

08:08.340 --> 08:29.180 ma arvan küll jah , selles suhtes , et me kaasa või okei , ütleme , et võib-olla varsti tuleb uudiseid , ütleme siis niimoodi . aga , aga me oleme ka tegelikult nii nagu kõik Eesti ülejäänud startupid , need nii nagu Ragnar siis ütles , et back to reality on ju . et , et praegune fookus läheb ikkagi käibe kasvatamisele ja nii-öelda cashflow positiivi jõudmisega , et noh .

08:29.180 --> 08:29.200 eelmine aasta vist kasvatasime kuus , kuusikesi oma käivet ja , ja see aasta on loodetavasti plaanis sama teha . nii et , aga see on jah naljakas , et , et kuskilt poolteist aastat me ehitasime oma toodet , enne kui me üldse hakkasime käivet teenima . nii et . jaa . no nii , aga nüüd tagasi saate teema juurde ja , ja no ütleme , masinõpe , tehisintellekti areng . ma ei tea , seda tehisintellekti kui sellist vist ei olegi ikkagi kohane kasutada , sest ta ei ole tegelikult .

08:59.180 --> 09:29.180 tegelikult intellekt , eks ju . ta ei suuda ise omal initsiatiivil otsuseid vastu võtta . et jagaks nagu ära , et ütleme , ühed on need nii-öelda suurandmemudelid või kuidas siis jah , suured on ei , no , large language , suured keelemudelid , suured keelemudelid , eks ju . siis on , siis on igasugused sellised nagu väiksed fiatuurid , noh , arendajatele , gopilote , eks ju , GitHub'ile on ju .

09:29.180 --> 09:59.180 siis on igasugune visuaalide genereerimine ja noh , fildid , tõenäoliselt tuleb ka mingil hetkel video ja siis on , ütleme , kõnesüntees , et kas ma nüüd midagi jätsin siit välja , ütleme sellistest suurtest tükkidest . no ütleme , et selle traditsioon , kõige traditsioonilisema ja kõige vanema valdkonna ehk igasuguste aegandmete ennustamisega just just selline just see predictive analüütika , mis enam ei ole üldse seksikas on ju , keegi sellest väga ei räägi , aga kuskil viis aastat tagasi noh , kõik tahtsid sellega tegeleda .

09:59.180 --> 10:29.180 et , et kõik rääkisid , et kogume järjest rohkem andmeid , andmeid , andmeid , et küll neid kunagi vaja on . noh , tulemus on see , et andmeid on nii palju , et me ei oska midagi peale hakata nendega . ja , ja minu enda enda kogemus selle predictive analüütikaga on , on just seotud põhjalaga , kus tegelikult Amazoni QuickSight võimaldab sulle andmete pealt prognoosida siis tuleviku mingisuguseid väärtusi . aga siis tuli Covid peale ja andmete nagu perioodil siis muutus nii räigelt , et

10:29.180 --> 10:59.180 ma arvasin , läheks niimoodi suureks . et noh , mingit kasu pole sisuliselt , eks ju . no nii , aga ühesõnaga need on need suured tükid , on ju . kus me siis täna nagu oleme , kas saad meile mingi väikse sellise ütleme , large language mudelid , eks ju .

10:59.180 --> 11:29.180 kui ma tulin kuskil viis-kuus aastat tagasi , kui toimus pildituvastuses hüpe . see on tegelikult see hüpe peale , mida Faima sündis . nüüd ja see on siis nüüd ütleme rohkem kui lihtsalt , just just , et see tähendab seda , et objektituvastus , segmentatsioon , et , et me suudame nii-öelda arvutile selgeks teha , mis objekt on , mis sisuliselt , et kui ma tahan laua pealt küünalt tuvastada , siis ta teab , et see on küünal ja seda , ja mis on olulisem , on see , et seda on võimalik teha odavalt on ju , et noh , masinahüpet sai teha

11:29.180 --> 11:59.180 see , kui sul olid nagu me meeletu võimsus taga ja nii-öelda järeltöödelda , ehk see toimunud live video pealt . nüüd viimased paar kuud on siis toimunud suurem muudatus just nende suurte keelemudelitega või large language mudelitega . noh , tegelikult selle kallal on juba töötatud ammu-ammu-ammu , see on see , mis nüüd chat GPD OpenEA poolt välja lasti , see on noh , lihtsalt nii-öelda selle avalikustamine , minu arust väga hea viis , kuidas , kuidas nii-öelda tarbijani tuua . aga sisuliselt , mida see tähendab , on see ,

11:59.180 --> 12:29.180 et uus tehnoloogia või uus eurovõrgu arhitektuur tegelikult , mis võimaldab teksti õppida hästi suures koguses . et kui vanasti kasutati teksti õppimiseks RNN ehk siis recurring neural network , siis nende häda oli see , et neid , selle õppimist ei olnud väga lihtne paralleeliseerida , tähendab seda , et sa ei saanud sinna väga-väga suuri andmekoguseid sisse sööta .

12:29.180 --> 12:59.180 Generatiiv-Free-Train-Transformerid nüüd või GPD-d teevad , ongi see , et neid on võimalik sinna võimalik meeletus kogustes andmeid sisse sööta , et kui sa vaatad GPD kolme , mis noh , tänaseks on ajalugu , sinna läks kuskil nelikümmend viis terabaiti data sisse , et seda treenida ja sada seitsekümmend viis miljardit parameetrit . noh , kui me räägime GPD neljast , see on juba üks triljon parameetrit on ju .

12:59.180 --> 13:29.180 näiteks , eks ju , et et sa põhimõtteliselt annad oma koodibaasidele ette ja siis ta hakkab sulle nii-öelda ettepanekuid tegema .

13:29.180 --> 13:59.180 sa saad kirjutada ju skripti selleks , et mis nii-öelda võtaks sisendpildi , söödakse selle OpenAI appisse ja saaks kümme variatsiooni sellest pildist tagasi . kuidas ma seda alguses alustasin , oli see , et noh , ikka saad tiimiga kokku , jagad ülesanded ära , kes teeb skripti on ju , kes teeb mida . noh , kuskil paar nädalat hiljem ma kirjutasin chat GPD-sse , et palun kirjuta mulle skript , mis võtaks sisendiks pildi ja väl- , väljundiks saaks kümme variatsiooni sellest pildist ja see skript tuli mulle ette niimoodi .

13:59.180 --> 14:29.180 selleks , et API integratsioone teha , sa ei pea isegi arendustööd tegema , sa lased ta lihtsalt kirjutada selle valmis . ehk see fundamentaalselt muudab , ma arvan seda , kuidas , kuidas kõik inimesed hakkavad tööd tegema , see saab väga-väga põnev olema . ja , ja nüüd ütleme see , see piltide genereerimine just , et , et põhimõtteliselt ma mäletan siin mõned kuud tagasi mul poiss hakkas ka selle vastu huvi tundma , ta on neljateistaastane on ju .

14:29.180 --> 14:59.180 pani noh , suht kiiresti hablas välja , et kuidas teha leekidest läbi põrutavat Ferrari't eks ju . ja triikis neid pilte , kuni tal see mingisugune limiit seal otsa sai , et , et , et noh , kas see on , kas seal on veel nüüd arenguruumi või on see ikkagi juba noh , see juba läheb , ma ei tea , seda kasutatakse juba kunsti tegemiseks , eks ju , et , et mis , mis nende piltidega praegu toimub ?

14:59.180 --> 15:29.180 või ma arvan , sihuke pool aastat tagasi , ma lihtsalt mainin , mina olen sihuke AI praktik , et ma , ma ei lähe nende hype idega väga kiiresti kaasa , et selles suhtes , kui kõik räägivad siin LLM-idest , siis noh , jah , okei , ma ka mängin nendega natuke , aga praegu Faimas meie noh , nii-öelda paneme siis production'isse just seda pildi , data set generation nagu mootori . ja , ja see on nagu selles suhtes huvitav , et , et praegu see töötab väga hästi ühe objekti nii-öelda tekitamiseks , et .

15:29.180 --> 15:59.180 kui sa tahad saada pilti , kus on mitu erinevat objekti peal , siis ta selleks väga hea veel ei ole . et ta on pigem hea selleks , et kui ma tahan saada pilte näiteks mingisugusest autost , siis ta , ta , ta annab sulle pildi , mis on auto ja sa võib-olla saad talle veel lisaks on seda , et ta annab mulle mingi kontekst , kus see auto on , mis valgustustingimustes ta on ja nii edasi , nii edasi , nii edasi . kui sa tahad ühe pildi peale saada autot , bussi , jalgratast ja kastiratast , siis sellega ta väga hästi hakkama ei saa .

15:59.180 --> 16:29.180 kui sa tahad öelda , et genereeri mulle keskaegne lahing tuhande viiesaja sõduriga , siis ta võib-olla saab selle kunagi hakkama . jah , põhimõtteliselt küll . et sihuke multimodaalsus on hetkel sihuke asi , mille , mis tundub selle nõrk koht olevat , aga noh , seda on näha , et see on lihtsalt andmete puudus , et kui neid andmeid sinna sisse rohkem söödetakse , siis see läheb ka kohe nagu , nagu käest ära . ja kõnesüntees , ma tean , eile oli vist Aktuaalses Kaameras , meil räägiti sellest eesti keele nagu kõnesünteesi arengust

16:29.180 --> 16:59.180 ja vist Riigikogu stenogrammid on juba automaatselt nii-öelda transkribeeritavad . et , et kuidas me nagu üldises mõttes seal oleme , kus eesti keel on ? no ma tean seda , et , et eesti keele puhul riik on nagu pannud väga palju efortit just sellega , et , et nii-öelda seda kõnesünteesi ja tekstist arusaami , teksti sünteesi ja kõike siukest asja nagu arendada Eestis .

16:59.180 --> 17:29.180 ma ei ole ise näinud veel ühtegi väga head , ei inimtekstist arusaamise nii-öelda lahendust ega ka sellist , mis suudaks ka täiesti nii-öelda usutavat versiooni genereerida ja ma ütlen nüüd sada protsenti usutavat versiooni genereerida näiteks oma häälest või mingisugusest kuulsuse häälest või midagi nagu deep fake idega natukene , et , et kõik tundub viie meetri pealt nagu väga ilus , aga kui sa hakkad nagu lähemale vaatama või väga kõrge resolutsiooniga vaatama ,

17:29.180 --> 17:59.180 sa saad päris suurt aru , et midagi , miski on , miski on nagu valesti on ju , et kõnesünteesiga mul on sihuke tunne , et see on sama teema ja ma arvan , et see on üks valdkond , kus võib-olla andmete lisamine ei ole nagu lahendus , et seal on võib-olla vaja ka natukene tavatarkvara nii-öelda maagiat sisse visata , tarkvaranaise maagiat sisse visata ja ka võib-olla teistsugust nii-öelda andmeteaduse lahendust täiesti nagu kasutada . just just ja nüüd see viimane , see predikti vene on lõtiks või , või mis on siis eesti keeles jälle ?

17:59.180 --> 18:16.860 ühesõnaga ma toon näite , mina ei saa praegu aru , miks Eesti Energia ei paku mulle tarbimisgraafikul temperatuuri ja ei ennusta mulle ette järgmise kuu arvet .

18:16.860 --> 18:17.100 selle , selle lähtuvalt sellest , mis on minu selle nii-öelda konkreetse objekti baas nagu küttevajaduseks ja siis korreleeritud vastu prognoositavat temperatuuri ja siis annab mulle nagu selle arvenumbri umbes ette , kuhu see nagu sihid , eks ju . et , et nagu ma ei tea , see on nagu nii basic asi ära teha ja nad ei ole seda teinud ja ma olen seda küsinud neid

18:46.860 --> 19:16.860 ja ma ei ole ka vastust saanud . noh , ma ei hakka ilmselt Eesti Energia arendusosakonna Tšiira tiketite backlog'i ette ennustama , onju . aga , aga , aga , aga noh , väga suur probleem . see ongi Akkentoni teema tegelikult , see on lihtsalt nagu kahe päevaga tehtud . aga , aga väga suur probleem tegelikult on igasuguse andme nagu , ma ise ma vaatan täpselt sama asjaga igasuguse dashboard'i andmevisualiseerimisega , on ka see tegelikult , et on okei , kuskil viis aastat tagasi oli nagu hästi

19:16.860 --> 19:46.860 suur popasi , on see , et kogume kõike . ma ise käisin , esinesin ja rääkisin seda , et kui te tahate masinõppega tegeleda , tuleb koguda kõiki andmeid , mis vähegi tekib . noh , tagantjärgi mõeldes , mis see nagu põhjustas , on see , et andmeid on liiga palju , andmed ei ole lihtsasti töödeldavad , mitte isegi selle poolest , et nad ei oleks , et meil ei oleks ressurssi seda teha , vaid lihtsalt andmeteadlaste ajumaht ei , ei , ei habla seda nagu kuskohast mida tuleb võtta . noh , ilmaandmetega ideaalne näide , ma olen ise nendega nii

19:46.860 --> 20:16.860 enamus ilmaandmeid , mis on vabalt kättesaadavad , on ennustuste salvestused , mitte päris mõõte tulemused , mis on , mis on selles suhtes nagu keeruline , et , et , et me ei tea sada protsenti , kas see ilmastik , mis nagu oli , päriselt mätšib sellega , mis nagu oli ja siis , kui sa hakkad selle andmete pealt ennustama , siis seesama viga , mis sa enne rääkisid , noh , läheb niimoodi on ju ja , ja see on niisugune asi , millega nagu noh , tava tavainimesed ei , ei mõtle selle peale , et , et , et

20:16.860 --> 20:46.860 ja , ja kui sa tahad nii-öelda päris ilmaandmeid saada , siis esiteks sa maksad nende eest , noh , mis tähendab seda , et sul peab kohe mingi roi tekkimiselt , et kus ma selle raha tagasi saan ja teine asi on see , et okei , sa saad selle näiteks Eestis neljast ilmajaamast ja siis sa pead ikkagi hakkama ennustama nüüd kuskilt Kesk-Eestist nagu Tallinnasse näiteks , no okei , Tallinn on ka ilmajaamast , aga ikkagi ma tahaks Eesti Energiaga siin jätkata , et nagu müü mulle sisse jubin , mis on patarei toitel ja istub wifi's ja registreerib kohaliku

20:46.860 --> 21:16.860 kasub ja ja saadab andmeid pilve ja ennusta nende pealt , noh , ja ei ma osta nagu teiega osta mingisugune kolmkümmend üheksa eurot näiteks mingi eest , noh kui ma saaks , kui ma saaks ennustada nagu oma elektritarbimist selle pealt hea meelega ostaks selle jubin , on ju , täpselt , sa hoiad sealt kohe kokku , et no väga äge , saime suured tükid kaetud , et vaataks no natukene sellist veel kõrgemale , tõuseks helikopteriga , et et siin on mitmed nagu

21:16.860 --> 21:46.860 sellised alarmeerivad uudised , eks ju , et , et alustame võib-olla sellest , et et siin mõni kuu tagasi või kuuke tagasi vist Google insenerid ei osanud selgitada nagu , mida see nende asi neile tegi , et nad ei osanud seda nagu põhjendada , miks just nii , et sa enne saadet ettevalmistust ütlesid ka , et sa oled sama nagu sama kohta jõudnud , et räägi natuke sellest , no see on , ütleme , et kui me räägime eurovõrkudest , siis see on täiesti tavaline ,

21:46.860 --> 22:16.860 tavaline nähtus on ju , et seesama igivana probleem , et kui , kui isesõitav auto on ju ei ole varianti , satub õnnetusse , kas ta nagu , kuhu ta valib , kas ta sõidab puusse või ta või ta sõidab inimestesse või mida iganes on ju , et kui ta selle otsuse teeb , kes on süüdi on ju , et , et , et tegelikult sama on näiteks igasuguse eurovõrguga masin nägemises on hea näide on selles , et kui masin nägemises kasutades eurovõrke , me tuvastame mingi objekti ,

22:16.860 --> 22:46.780 ma saatan sama pildi viis korda läbi , mul tuleb viis erinevat , natukene erinevat tuvastust sealt välja , see põhjus on selles , et see , kuidas nagu need eurovõrgud oma otsuseid teevad , on see , et neil on hunnik kaalusid , weights inglise keeles on ju , mis siis nii-öelda , kui see pikslijada läheb sinna eurovõrku sisse , ta tegelikult iga kaalu pealt natukene iga neurooni koha pealt teeb erineva otsustuspunkti on ju ja meil ei ole võimalik sada protsenti täpselt öelda , miks .

22:46.860 --> 22:47.100 nii-öelda see konkreetne pilt läks mööda seda neuronihada , see on sama nagu inimaju . et kui inimene , inimene õpib midagi tegema , siis kahe neuroni vaheline nii-öelda elektronimpuls süveneb on ju , aga nagu miks just see muster tekkis sellel konkreetsel inimesel , tegelikult on seda nagu väga raske endiselt nagu põhjendada ja , ja see on ka see , miks neurovõrkudesse musta kasti nagu sündroom on endiselt natukene alles . see on ka see , miks nagu äri või emissiooni kriitiliselt

23:16.860 --> 23:46.860 selles valdkondades kasutatakse lihtsamaid mudeleid nagu ma tean lineaarregressiooni mingid siuksed asjad , et sul on vaja , vaja seda nii-öelda seletatavust natuke rohkem . iroonilisel kombel meditsiinis kasutatakse ainult neurovõrke näiteks . et noh , see on siuke jah . aga kas see nagu sarnaselt inimesega , et vaata Tiit teeb midagi imelikku , eks ole , ma küsin ta käest , aga miks sa tegid niimoodi ? kas , kas me nagu nende masinate käest ei saa

23:46.860 --> 24:16.860 -da , et , et tal jääb nagu see protsessist nagu mingisugune jälg maha , et , et miks , kuidas ta sellise tulemuseni jõudis niimoodi ?

24:16.860 --> 24:17.520 usutavusega ta arvas , et see post on nüüd inimene ja siis ma lähen tegelikult sisendandmetesse ja hakkan analüüsima , et okei , kui palju mul on nüüd selliseid inimese pilte , mis on sarnased selle postiga . noh , selleks on ka nagu automaatsed meetodid olemas , et ma ei pea , ma ei pea hakkama seda käsitsi tegema . aga probleem tekib siis , kui need suured keelemudelid on , kus meil on , on ju triljon parameetrit , et kuidas sa lähed nendesse algandmetesse nüüd otsima seda , et , et mis , mis põhjustas sellise käitumise on ju ?

24:46.860 --> 25:16.860 et see läheb väga-väga keeruliseks ja noh , ma olen enam kui kindel , et sellega töötatakse , et seda põhjendatavust teha . aga noh , praegu tuleb sellega nagu vaeva näha , sest siin on nagu teine keeruline osa on see , et , et need suured keelemudelid , nad ei oska , nad ei tea väga palju eetikast ega moraalist midagi , mis nagu tähendab seda , et kui sa küsid näiteks see keelemudeli käest , et ma mõtlen mingi hea näite .

25:16.860 --> 25:46.860 okei , näiteks üks asi , et kust ma saan või kuidas , kuidas panka röövida , siis keelemudel , mudelisse on sisse ehitatud see , et ütleb , et ma olen keelemudel , ma selliste ebaeetiliste asjadega ei tegele ja , ja ma ei , ma ei , ma ei anna sulle infot , onju , aga kui sa sõnastad oma küsimuse niimoodi , et kuidas mitte panka röövida või kuidas , kuidas vältida seda , et ma kunagi ei rööviks panka , siis ta ütleb sulle samm-sammult kõik selle ette .

25:46.860 --> 25:47.520 et see oli see sama näide oli ka noh , täna tavainimesele võib-olla lihtsam , et kust tõmmata tasuta torrent , teid on ju , ma tahan seda vältida , aga jah , see oli , see oli jah , ja , ja siis , et jah , et vastus keeru , teistpidi kirjata , et mida ma saan teha , et kuhu , milliseid saite ma peaksin vältima ja siit tekib täiesti uus probleem on see , et , et et noh , nagu ma ütlesin , et kui ma palun tal kirjutada mingisuguse API skripti , ta teeb seda kohe .

26:16.860 --> 26:45.380 või ära on ja kui ma nüüd tahan , kui ma lähen mingisugusesse natukene nagu ma lihtsalt siin , ma siit ees ütlen , et kuidas ma saan näiteks Windowsi masinasse sisse häkkida , ta ütleb sulle jälle , et ma ei ole , ma ei tee seda , kuid kuidas ma saan , kuidas ma tean , kui keegi või sisse häkib nagu ja skript tuleb sulle niimoodi ja see küberturva ja see saab olema ka väga huvitav , et nii-öelda need script kidid , kes vanasti nagu kellel ei olnud siuksed tööriist ja need muutuvad järjest ohtlikumaks ja ohtlikumaks .

26:45.380 --> 27:15.100 jaa , vot siin lähemegi järgmise point'i juurde , et , et siin vist tuli eile uudis , et Google'ist lahkub nii-öelda närvikurkude vanaisa Geoffrey Hinton , et , et tema siis noh , põhjendus oli see , et saada nagu vabad käed selleks , et nagu nende ohtudega siis võidelda , et mis sellest teise intellekti kasutamisest tulenevad , et , et , et kas noh , see on , see on selge , selge .

27:15.380 --> 27:22.980 nagu sõnum teistele , eks ju , et asi ei ole nagu niisama tilulilu , eks ju , et siin oht , ohud on suured , on ju .

27:45.380 --> 28:15.300 et nagu enamus inimesi , kes sellest nagu räägivad , et me peaks , et sellel asjal peaks olema mingi regulatsioon . Nad otseselt ei taha võib-olla takistada seda , vaid nad tahavad seda , et nagu kõik töötavad nende uute mudelite kallal väljas , keegi selle regulatsiooniga veel ei tööta nagu . ja see asi jookseb nii kaugele eest ära , et me oleme nagu üks hetk nagu hädas . et noh , jällegi tulles tagasi selle juurde , et mina olen natuke praktik , siis ma nagu näen seda , et , et iga niisuguse uue tehisintellekti .

28:15.380 --> 28:15.880 nagu tehnoloogia rakendamine ei ole päris nii lihtne on ju . ainukene probleem , mis nüüd selle , selle uue nii-öelda suurte keelemudelitega tekkis , on see , et , et noh , see tõesti nii-öelda on kõigi kätte tulnud ja , ja see , seda tuleks nagu võib-olla kuidagi kontrollida , et noh . aga , aga siin on ka noh , see , see piir on nii hägun , et noh , see , mida Itaalia üritas teha , et me keelame teatud FBT ära on ju noh , tänaseks on jälle Itaalias tagasi . et see nagu ka ei tööta , et , et siin , siin , siin pigem

28:45.380 --> 29:15.380 no tuli ju välja siis nii-öelda ettepanek , et korraks peatada nagu võimsamate mudelite arendamine kui chat- , eks ju . et seal oli mingi kolmkümmend tuhat allkirja , et , et , et no selle kohta ma ütlen nagu seda , et seal on mul kaks väga tugevat arvamust . üks on see , et kui sa vaatad seda nagu allkirja listi , see võib-olla on natuke selline , ma ei tea , eestlaslik suhtumine , aga siis esimene mõte oli see , et enamus allkirjastajad olid need , kes nagu võib-olla

29:15.380 --> 29:45.380 tahaksid ka siukest tehnoloogiat omada , aga neil on natuke aega veel vaja , on ju . et teine , teine asi , mis on , on see , et noh ega OpenAI on ka otseses välja öelnud , et nemad praegu chat- või GPT-5 ei arenda , et , et see GPT-4 , mis on nagu väljas , on piisavalt nii-öelda võimekas , et sellega saab veel kaua-kaua sõita , on ju . ja noh , ei noh , GPT-4 ei ole ainus on ju , Google'i pard ja , ja , ja nii-öelda kõik need asjad on nagu

29:45.380 --> 30:15.380 ka ikkagi väga erakordselt võimekad , mis on natukene scary , on see , et meil on , ma olen ka näinud esimesi suure keelemudeleid open source ituna kättesaadaval ja kaasa arvatud see , et GPT-3 ju lekkis nii-öelda piraat , piraatturgudel igale poole laiali , et GPT-3-e kaalusid on võimalik nagu alla tõmmata ja neid ise kuskile käima panna , küll illegaalselt , aga siiski on ju . et , et see on palju hullem , et kui see noh , praegu me vaatame , kuidas need asjad arenevad , siis ta ikkagi areneb nii-öelda

30:15.380 --> 30:45.380 Vene ühiskonnas sellepärast , et andmed on nii vabalt kättesaadavad ja võib-olla nii-öelda Hiina ja Vene , Vene nii-öelda ühiskondades ta nii hästi ei , ei arene , sest seal lihtsalt ei ole treenitavaid andmeid nii palju . küll , kui need kaalud nüüd lekivad igale poole , noh siis , siis juhtub igasugu halbu asju võib-olla , aga , aga noh , seda on raske ette ennustada , et mul , mul ei ole nagu endal isiklikku arvamust selle kohta , sest see on täpselt samamoodi nagu tulirelvade regulatsioon põhimõtteliselt . et noh , ega keeg

30:45.380 --> 30:47.380 nad halbade inimeste kätte ei saaks kuidagi .

30:47.380 --> 31:12.380 jah , aga nüüd see oht , et need keelemudelid on internetiga ühenduses , räägi natuke sellest ühendusest , et , et noh , ütleme tavatatsaja , temal nagu tekib see moodi , et okei , aga ma saan igast faktiinfot nagu hästi kiiresti , eks ju , kasutada . ja noh , ja siis ta mõtleb , et okei , aga siis see next step ongi siis nagu Skype näpp , eks ju .

31:12.380 --> 31:12.400 noh , ütleme , et need keelemudelid ise tegelikult ongi täpselt see , neil on sisend ja väljund , et nad ei ole nagu mõtlevad ajud kui sellised ja nad ei suuda nagu teha otsuseid . kunagi , kui ma nagu rääkisin täis intellektist , siis ma nagu ütlesin , et ühtegi täis intellekti rakendust , rakendusest ei tohi eeldada , et tal on talupoja mõistes . et , et , et ta on väga lihtne asi ja nüüd need , millest , millest viimasel ajal on rääkida , rääkima hakatud , kuidas siis nii-öelda panna see GPT kolm ja GPT neli

31:42.380 --> 31:49.040 päriselt mingisuguse keskkonnaga nagu interakteeruma , väga kehv eesti keeles .

31:50.920 --> 31:58.480 Neid kutsutakse siis nagu ai-agentideks või siis noh , nendel on ka üks niisugune ühine nii-öelda termin nagu auto GPT onju .

31:58.480 --> 32:06.600 auto GPT on konkreetselt jupp koodi , aga millegipärast see on nagu , nagu kliin , eks onju , et kõik kutsuvad neid ai-agente auto GPT-ks millegipärast .

32:07.580 --> 32:29.740 mida need siis võimaldavad teha , ongi see , et , et sa saad öelda näiteks mingisuguses chati aknas , et palun puki mulle kaks kinopiletit . ta saab aru sellest nii-öelda , mida sa tahad teha , kuhu kinno sa tahad minna ja nüüd see need ai-agendid lähevad ja nii-öelda ühi- , ühilduvad selle konkreetse infosüsteemiga , et ja nii-öelda ostavad sulle need kinopiletid ära , onju .

32:29.740 --> 32:57.680 iroonilisel kombel mega palju startup'e on tulnud neid , neid , kes nii-öelda lihtsalt on tegelikult noh , sihuke clarified ai-agent tegelikult , kes läheb ja teeb mingisuguseid asju ja , ja neid ai-agente kutsutakse ka sihukesteks nagu , mis mulle üldse ei meeldi , sihukesteks beebi AGM-ideks või artificial general , AGI-deks , artificial general intelligents , mis ta noh , tegelikult ei ole , ta on jupp koodi tegelikult lihtsalt . ja noh , ta on natukene teistsugune kui API , aga põhimõtteliselt jah .

32:59.740 --> 32:59.760 aga ma mõtlesin selle ka , et siis , kui see chat kepetee nüüd läks väga lendu , eks ole . et kui need andmed , sisendandmed tulevad ikkagi noh , raamatutest , internetist , aga just sellest internetist , et kui sa tahad nagu lõpuks midagi saada , tarka selle käest teada , onju . et mille põhjal ta otsustab , et kas Vikipeedia artikli põhjal , kas ta võtab selle Redditist , mis tähendab seda , et mis , mis mu mõte oli nagu see , et kas ei ole oht , et nagu me .

33:29.740 --> 33:59.740 hakkame kontrollimata data pealt genereerima uut kontrollimata data't ja inimesed võtavad seda täiesti tõepõhe , põhe nagu , sest et noh , see AI ütles mulle niimoodi , järelikult nii on . ja mis tähendab seda , et eriti veel noh , ma sõbraga vestlesin üks hetk , et aga mõtle , kui ta hakkaks veel Vikipeedia artikleid ka ise koostama . mis tähendab , et sul on juba väga subjektiivsed andmed .

33:59.740 --> 34:29.740 või täna põhjal tehakse uut siukest nagu teisendatud artikleid , mis on järjest kaugemal sellest , mis võib-olla asi päriselt on , eks ole , ma räägin , siin tuleb kiiresti mõelda välja sisu allkirjastamise lahendusena ja see , kus ei ole üldse paha mõte ja , ja tegelikult see asi OpenAI tegevjuht ütles ka , et neil on näha seda , et , et kui mingisugune inimene koostab näiteks mingi emaili vastuse ,

34:29.740 --> 34:59.740 ChatGPT-st saab sisestatakse email , palun vasta sellele emailile , siis see sisend , mida ChatGPT kirjutab , kaob ära korraks ajaks ja siis nad näevad seda , kuidas teiselt poolt seesama sisend , mida ChatGPT kirjutas , tuleb uuesti sisse ja inimene kirjutab , palun vasta sellele . ehk nii-öelda , ma olen hirmuga mõtelnud , mida keskastme juhid igal pool ettevõtetes , kes nagu emaili kirjutavad , tegelikult noh , kui palju nad päriselt nagu süvenevad sellesse , mida see GPT seal kirjutab ja vastab .

34:59.740 --> 35:29.740 ja nüüd selle kohta , mis puudutab seda , et , et me hakkame nii-öelda AI poolt genereeritud info pealt uuesti treenima AIDS noh , see tähendab seda , et see nii-öelda mudel läheb järjest lollimaks , nii et seda tuleb kindlasti vältida ja see ja see on selles suhtes nagu väga suur probleem , sellepärast et suured firmad nagu näiteks Reddit , Redditi ju ütles otse välja , et nendel on kõige suurem kogus inimeselt inimesele kirjutatud teksti , mida noh , tavaliselt räägitakse

35:29.740 --> 35:56.820 psühholoogiga onju , et , et noh , see väga väärtuslik andmekogus ja nemad panid oma abi tasuliseks sellepärast , et nad nägid , et tegelikult kõikide suure mudeli tegijad kasutasid seda ära tuimalt ja nii-öelda treenisid mudelit selle peal , eks see nii-öelda treenitava mudeli treenitavate andmete kogus ajas , ma arvan , muutub raskemini kättesaadavamaks , tähendab seda , et et nii suurt hüpet , nagu me nägime praeguste suurte keelemudelitega , ilmselt mõnda aega enam jälle ei tule .

35:57.780 --> 36:12.860 mhm , no nii , aga siia vahele siis pistaks mõned sellised personaalsed kogemused ka , et Martin , alustaks sinust , et mida sa oled teinud , no ütleme siis nende LLM-ide pealt , mis on nagu kõige huvitavam lõik võib-olla .

36:13.840 --> 36:38.180 ma pean ütlema , et ma olen natukene nagu ürit- , natuke nagu vältinud seda teemat , et ma nagu väga-väga tõsiselt ei olegi pigem nagu võib-olla mänginud lihtsalt natuke niisama , aga küll aga on tõesti huvitav , et ma nagu pigem eeldaks või tahaks leida mingit väga head praktilist nagu võib-olla igapäevakasutust sellele .

36:38.180 --> 37:08.120 et , et ta on tore vestluskaaslane ja siin noh , et mängida sellega , aga aga tegelikult tahaks midagi nagu noh , et millest mul nagu kasu oleks , et või ma ei saa tema käest küsida , et kuule , et kuidas sa mulle kasulik olla saad , sest et ega ta väga palju must ei tea on ju , seda ma pean ikkagi ise välja mõtlema , aga aga mõte on jah , et noh , et kui mul üks sõber rääkis , et tema laseb koostada menüüsid , et kui on sõbrad külla tulemas .

37:08.180 --> 37:28.220 ütled , mis sõbrad , mis on allergia kriteeriumid , eks ole , mis toiduained olemas on , et siis väga tore , mul pole kahjuks omal sellist kasutusjuhti olnud on ju , aga , aga et midagi taolist , et , et siis võiks sellest päriselt nagu mingit kasu olla ka , et .

37:28.220 --> 37:32.680 nii , aga Taavi , kas sul on igapäevane kasutusjuht välja kujunenud ?

37:58.220 --> 38:27.840 FAIMA case study'd , et see , kui , kus , kuidas meid kasutatakse , kus me väärtust loome , meil on kodulehel üleval niisugused , ma ei tea , kahe A4 pikkused , pikad case study'd , kui müügiosakond , kui klient küsib case study'sid , siis enamus nii-öelda kordi me laseme chat kõigepealt teel lihtsalt kirjutada lühikokkuvõtte sellest , viis lauset , sellest case study'st , töötab väga hästi , selles suhtes kuni selleni välja , et turunduse jaoks teeme varsti ühe teise hästi suure ettevõttega ühe niisuguse ühisturundus video .

38:28.220 --> 38:52.160 mis on tehniline siis arendajatele mõeldud video . selle skripti , noh , mul polnud aega seda kokku kirjutada , ma lasin , panin bullet point'id , lasin selle videoskripti kirjutada kokku tegelikult chat kõigepealt teel ja nii edasi , nii edasi , nii edasi , et noh , me oleme selle ikkagi oma ettevõtte nagu tuumikusse väga palju sisse kirjut- , kirjutanud kogu selle kasutamise .

38:59.200 --> 39:15.160 ütleme niimoodi , et turunduse , see nii-öelda müük kasutab ikkagi seesama nii-öelda tasulist chat kõigepealt teed , et seal , sinna mingit interface'i ehitada polnud nagu väga mõtet . aga mis puudutab nendesse pilti , piltide genereerimisse ja uute dataset'ide tekkimisse ja automaatse anoteerimise , kõige sellepärast see on jah , meil nii-öelda maja sees ehitatud .

39:15.160 --> 39:45.140 nojah , minu kogemused on ka päris , päris põnevad . ma arvan , asi läks huvitavaks , kui ma andsin lihtsalt andmebaasi tabeli struktuuri ja ütlesin , et ju mul on vaja siit selliseid andmeid . ja kuna tal oli kõikide andmeväljade noh , tüübid ja nimed teada , siis ta kirjutas mulle SQLi , siis ma ütlesin , et jõu selle sellise SQLiga ma saan ise ka hakkama , ma tahan perioodiseeritud andmeid niimoodi , et kuud oleks kolum- nagu vergude peal .

39:45.160 --> 40:11.820 siis ta tegi selle , sellest , et kuule , et kui ma siit see , see , see SQL ei arvesta nagu suvalise andmete perioodi hulgaga , eks ju , et see nagu , ma pean nagu umbes iga kord manuaalselt juurde kirjutama ja siis ta sai sellest ka aru ja tegi siis sellise SQL lause , mis arvestab , mis sobib suvalise tabeli peal nagu perioodiseeritud andmete nagu kokkuliitmiseks .

40:11.820 --> 40:41.120 ja siis ma näitasin seda SQLi lauset , ma ise sellest enam aru ei saanud , sellest kolmandast versioonist , näitasin nagu , noh , inimesele , kes on ise kirjutanud , ta ütles , et ta ei oleks suutnud seda kirjutada . et ja , ja ongi ja töötab ja ongi väga universaalne lahendus . ja siis teine case oli siis see , et oli , oli vaja defineerida privacy by disain policy .

40:41.820 --> 41:00.960 ja , ja kasutasin siis kolme erinevat prompti . ja siis võrdlesin nende tulemust ja need kümme printsiipi tulid seal kõik välja ilusti , valisin sealt parimad sõnastused , valideerisin spetsialistidega üle ja põhimõtteliselt kahe päeva töö laias laastus oli viieteist minutiga tehtud .

41:11.820 --> 41:12.800 onju , et ma ei tea , kas keegi on vaadanud seda Microsofti Copiloti pressrelease'i , kus nad näitasid , mida uus Excel hakkab tegema , kuni selleni välja , et , et näiteks andmete mudeldamine , kui sul näiteks mingid müügiandmed ja sa kirjutad talle lihtsalt , et kuule mudelda mulle selline nagu uus dataset , kus näiteks müügid kasvavad month on month mingi kaks koma kolm protsenti ja ta loob sulle selle data niimoodi , teeb sulle graafiku niimoodi , paneb sulle

41:41.820 --> 42:11.820 trendline'id sinna peale , teeb kõike sellega . noh , et see , see , see , kuidas Microsoft võtab nagu kasu sellest , et tal on OpenAI-s osalus , see saab olema mega , noh , me räägime sellest , et Samsung tahab vahetada oma telefonidel otsingumootori pingi vastu , et kaks aastat tagasi see , noh , see oleks väljanaerdav , kui keegi sellist asja teeb . aga see on täpselt see , et kui sa pead leidma selle praktilise nagu nurga , eks ole , et millest nagu tegelikult kasu on , et muidu ta on ikkagi nagu selline uhke töö ,

42:11.820 --> 42:41.820 uhke mänguasi lihtsalt , eks ole , aga kui sa päriselt oma oma nagu eraelus või tööelus leiad sealt mingisuguse noh , aegu kõige väärtumala on ju , teda tuleb kasutada ka nagu tööriist , et kui sa nagu ütled talle , et lahenda see ülesanne ära minu jaoks , siis ta ei tee seda , pead talle õige sisendi andma , täpselt nii nagu sa tegid , Tiit , on ju , et , et mul on see , see tulp , mul on vaja seda , seda tulemust , ma tahan kasutada selleks selle , seda , seda metoodikat on ju , et siis ta töötab hästi , et

42:41.820 --> 42:46.140 pettumus , et ah , et see ikka ei tööta nii hästi , sest nad ei oska seda Eesti kasutada on ju .

43:11.820 --> 43:41.800 see on väga spetsiifiline selles mõttes ja , ja siis ma ütlesin , ei , kuule , aga ma tahaks logimist ka juurde saada . ja kuule , siia ma tahaks error handlingut saada ja lihtsalt tuleb ja töötab ja ma ja Pythonit kirjutasin viimati , ma ei tea , siis kui ma ei tea , viisteist või kaheksateist aastat tagasi ja , ja jällegi nagu ma saan aru , mis ta teeb , ma saan aru , mida see kood teeb , aga ma ei ole pidanud seda koodi ise kirjutama , aga sa märksid ka seda , et kood on pahatihti kommenteeritud , et ja väga hästi kommenteeritud .

43:41.820 --> 43:46.800 siia pane API , see on sinu sisendandmestik , kõik on nagu olemas , et noh , täpselt .

43:46.800 --> 43:57.320 et see on mega jah , no ühesõnaga , see on see koht , kus ta läheb juba selliseks nagu ütleme , räägime veel lugusid veel läheb veel lahedamaks kõik onju .

43:58.300 --> 44:24.300 ma pean nüüd lähe nagu siuke tavainimese poole , et , et kuidas tema oleks kõige lihtsam seda chatGPT kasutada üldse , et seal ma saan aru , et on mingi tasuline versioon , kuhu sa saad subscribe ida , aga on mingisugused saidid , mis pakuvad tasuta versioone , kas need saidid tegelikult üritavad oma mudeleid teha siis selle pealt , mida kasutajad teevad , et või miks nemad tasuta on ja miks ?

44:24.300 --> 44:26.300 ma pean tunnistama , et ma olen nendega väga kokku puutunud .

44:26.300 --> 44:56.280 mina olen kasutanud , alguses kasutasin GPT kolme , mis on tegelikult siis mingisuguste päringute hulga neid tasuta kätte saadav Open EIA poolt ja noh , praegu me kasutame siis seda tasulist GPT nelja , mida nagu ülejäänud saidid teevad , eks nad niikuinii kasutavad mingisugust noh , see peab mingi äri loogika taga olema onju , kui nad kasutavad , kui neil ei ole oma LLM-i , mida noh , oleme ausad , väga vähestel on ehk nüüd tänapäeval , siis on see ikkagi see API , nad ikkagi maksavad selle API eest päringut .

44:56.300 --> 45:26.300 päringu eest suure tõenäosusega ja nad teevad midagi nende andmetega , mis sa sinna sisse sööda . et see on ka üks asi , mis tegelikult millega inimesed väga tihti arvestanud see , et , et noh , see küsib , kuidas tavainimesed võivad seda kasutada . minu arust mingi paar kuud tagasi oli mingisugune suur skandaal , et Samsungi töötajad söötsid mingit väga proprietäärid koodi chat GPT-sse , et nad seda aitaks lahendada seda , miks see kood katki on . aga nad ei arvestanud sellega , et niipea , kui nad selle koodi sinna panevad ,

45:26.300 --> 45:56.300 see on ka nii-öelda OpenAI rahulikult kättesaadav . et , et noh , ärisaladuste söötmine , OpenAI-le saab olema ka väga huvitav ja põnev probleem , millega tegeleda ettevõtetes varsti . ja mis , mis muidugi tähendab seda , et järjest enam tekib vajadus suurtel korporatsioonidel , eriti see nii-öelda in-house host , et LLMide jaoks . ja vaata , see saab olema huvitav äri . nii , aga nüüd need kõige vingemad startupid , sa kindlasti oled siin nagu täielik spetsialist ,

45:56.300 --> 46:26.300 me lihtsalt , info tulv on lihtsalt nagu , sa ei eralda enam ära , mis on mis . et , aga mida , mida tasuks päriselt proovida nagu ? võib-olla nendest agentidest äkki mõned oleksid huvitavad ?

46:26.300 --> 46:56.300 nagu huvitav kohati , sellega saab igasugu , igasugu toredaid rakendusi ehitada . see on põhimõtteliselt nagu võtad , siis sa põhimõtteliselt teed siis , mis seal siis oli nüüd , ütle nende API integratsioonidest , Zapieri nagu turbo versioon põhimõtteliselt . põhimõtteliselt jah , aga noh , ta ei ole nii võib-olla lihtne , on ju , et natukene keerulisem nagu üles seada . aga , aga , aga jah , ja noh , praegu on juba noh , see nii-öelda uus , uus startupi mulje on ka sündimas , et võib-olla see , miks ma ei ole nagu kokku puutunud ni

46:56.300 --> 46:56.960 praegu USA-s oli mingisugune suur artikkel selle kohta , kuidas mingi kümme start-upi nädalaga osteti ära . ehk keegi tegi selle auto GPD baasil mingisuguse toreda agendi nädalaga , palkas sinna niisuguse tõsise nii-öelda LLM ja Aieksperdi , maksis sinna väga palju raha sisse ja nädalaga flipped selle firma mingile suurele korpile maha lihtsalt . mis noh , noh , kui ma oleks praegu mingi VC investor , ma praegu väriseks , sest ma ei saa enam midagi aru ,

47:26.300 --> 47:56.300 mis toimub turule . nii et auto , auto GPD-d võiks , võiks ise , ise näppida . aga nüüd masinõpe ja , ja probleemid , et ma ise suutsin välja mõelda mõned niisugused noh , andmete kättesaadavus on alati probleem , nende usaldusväärne , usaldusväärsus , nende märgendamine on tihti nagu mahukas töö , eks ju . mis on veel sellised nagu rasked küsimused praegu sinu laual , masinõppega tegeled ?

47:56.300 --> 47:56.960 no ütleme , et , et konkreetne minu , minu laual on alati on , on täpsus on ju , et noh , kuna kuna meie tegeleme nagu noh , pildi , piltide , siukeste asjadega , siis meie mudelid peavad olema , esiteks nad peavad olema hästi , hästi nagu performant ehk nii-öelda see price per frame , mida me GPU-des töötleme , peab olema erakordselt madal . ja teiseks nad peavad olema ka erakordselt täpsed ehk noh , kaks , kaks väga halba asja , mida kokku panna on ju . et kas ,

48:26.300 --> 48:56.300 kas odav ja mittetäpne või kallis ja hästi täpne on ju , et noh , kuskil tuleb see kesktee leida sinna ja , ja noh , tegelikult ma ütlen , et see kesktee tegelikult märk nagu määrab ära , kas sul on business case või mitte on ju , just just ja , ja noh , praegu ongi tegelikult see , et kui me räägime , mis , mis mind nagu hirmutab selle puhul , on see , et nendes masinõppelahendustes me oleme jõudnud sellisesse kohta , kus intellektuaalomand on kas open source või suurte

48:56.300 --> 49:26.300 torpide käes , mis tähendab seda , et kui mina tahan näiteks oma masin nägemise mudelit palju täpsemaks muuta , siis või , ja , ja palju kiiremaks muuta , siis ma saan seda teha oma pipeline'i unikaalsusega , see tähendab seda , et see , kust ma andmeid kogun , kuidas ma andmeid märgendan , kuidas mu andmete kvaliteet on , aga kui ma jõuan neurovõrgu arhitektuurini , siis seda ma saan timmida oma eelarvega ainult nii palju selleks , et ma , et ma seda neurovõrgu

49:26.300 --> 49:56.300 arhitektuuri muudaks nii nagu ma ei tea , OpenAI seda teeb , see eelarve peab mul olema meeletu ehk ma startup'ina teda ei saagi teha , mis tähendab seda , et , et noh , nende suurte tükkide kontroll läheb väga väheste ettevõtete kätte ja see saab olema jällegi niisugune triki natuke , õnneks on ka nii-öelda , nii-öelda ettevõtted maailmas , kes tegelevad open source imisega ja noh , OpenAI mõte oli ju ka tegelikult algusest peale see , et nad tegelikult äri ei tee , onju , mul on niisugune tunne , et see viimasel ajal on

49:56.300 --> 50:00.060 natuke muutunud nende jaoks , aga noh , ma ei tea .

50:00.060 --> 50:26.260 jah , võib-olla viimase sellise keerukama küsimusega , et ma olen aru saanud , et seal on nagu ütleme , inimesed vaatavad seda , et oo , joo , üks mudel , üks lahendus , üks vastus ja kõik onju , tegelikult see on nagu , nagu sari ja järjekord ja , ja üks teeb ühte ja siis viidib järgmisse ja nii edasi ja siis osa nendest peab töötama nii-öelda reaalselt .

50:26.360 --> 50:36.460 reaalaja tempos ka onju . võib-olla lahkaks natukene seda , seda arhitektuurilist keerikust nagu just mudelite vahel , et võib-olla mõned näited äkki , mis kirjeldaksid .

50:38.100 --> 50:52.140 noh , ütleme niimoodi , et , et enamus selliseid keerukaid lahendusi , mis on nii-öelda production'is , käsitlevad siis mitut erinevat mudelit mitmel erineval eesmärgil .

50:52.920 --> 50:56.940 ideaalne , võib-olla kõige lihtsam inimesele arusaadav näide on näiteks isesõitvad autod .

50:57.700 --> 51:07.820 selleks , et isesõitv auto teeks mingisuguse auto juhtimist mõjutavate otsust , peab ta võtma andmed autolidarist .

51:08.380 --> 51:17.660 autolidaris olevad andmed tegelikult tõlgendatakse auto asukohaks väga lihtsate konvolutsiooniliste nõuerevõrkudega .

51:17.660 --> 51:47.620 see tähendab seda , et tal on õpetatud lihtsalt selgeks , et kui lidaarist tuleb niisugune number , see tähendab seda , et auto on nii kaugel . imelihtne asi tegelikult . ja seda on võimalik ka kontrollida tagantjärgi , mitte nagu neid must , musti kaste , mis enamasti on . nüüd see info , mis sealt tuleb , sõidetakse nüüd järgmisesse masinõppemudelisse , milleks on siis näiteks mingi suur neurovõrk . ja see neurovõrk , sellel on nüüd nagu andmemaht on umbes kümme , sada X-i rohkem kui sellest ühest .

51:47.660 --> 52:16.820 Lidaari mudelist ja ta muidu ei töötakski selles suhtes ehk kui me räägime nagu sellest erinevate mudelite otsustusjadast , siis neid on vaja selleks , et noh nagu nagu tarkvaraarenduseski , iga jupp teeb erinevat osa ja selleks , et panna see konstruktor kokku , sul on vaja erinevatest andmeallikatest tulenevaid lõppväärtusi ja neid lõppväärtusi on vaja kokku panna mingisuguse suure neurovõrgu jaoks sisuliselt .

52:16.820 --> 52:46.800 et jah , just case on nagu palju erinevaid ja , ja noh , pahatihti tekib seal ka nagu igas masinaõppemudeli tulemus või noh jadas tekib ka uus määramatus on ju , sest noh masinaõpe ei ole ideaalne , alati on sul mingi täpsusprotsent , mida rohkem sul neid mudeleid on , seda suurem sul see määramatus tekib on ju , et ja selle hindamine on ka omaette kunst nagu , et kuidas see hindada , et kui palju nüüd see määramatus ajas mõju muutub on ju , sest erinevalt nagu tarkvaraarendusest .

52:46.820 --> 53:16.820 kui sul on mingisugune algoritm , mis funktsioneerib päris keskkonnas , siis keskkond ei ole kunagi stabiilne , see alati muutub , mis tähendab seda , et sinu mudeli määramatus ajas samuti muutub on ju , ehk siis tekib küsimus , et kui tihti sa pead neid mudelid üle treenima ja mis osi kogu sellest pipeline'ist sa pead uuesti üle treenima on ju . ja , ja kogu see nii-öelda , nii-öelda masinaõppemudelite ja masinaõppe pipeline'ide ja data ops'i pipeline'ide .

53:16.820 --> 53:46.820 ja management on erakordselt keeruline valdkond tegelikult . ja , ja kuidas nüüd tehnoloogiatega on , et noh , ütleme Python'ist on saanud nagu de facto standard , eks ju , kuskil mõned aastad tagasi oli R oli ka nagu teema , ma ei tea , kuidas täna , ma ei . no R on niisugune nagu matemaatiline keel on ju , et , et kui Python'iga , siis Python'is sa kirjutad kenasti production grade asju , siis see R on pigem niisugune võib-olla hea koht , kust alustada on ju .

53:46.820 --> 54:16.820 nagu , nagu Matlab võib-olla rohkem on ju . et Aari häda minu arust tuleb väga kiiresti siis sisse , kui su andmemassiivid lähevad nagu väga suureks , et siis ta ei performi enam nii palju . mis puudutab veel tehnoloogiaid , noh , ma räägin , de facto on , on Python , seal kõrval on üks niisugune väike keel , ma ei tea , kas te olete kuulnud nagu Julia . Julia on selles suhtes hästi põnev .

54:16.820 --> 54:46.820 üldiselt nagu masinaõppe maailma C . ta on hästi madala tasemega ja tal on sisseehitatud GPU toed , kuudakernerid , kõik siuksed asjad , et teda on nagu väga lihtne kasutada . aga neid , neid arendajaid , kes nagu Juliat oskab kirjutada , on suhteliselt vähe , selles suhtes . aga ta on natuke sihuke vabamüürlaste keeleks muutunud , kus nii-öelda noh , ütleme , et need inimesed , kes ikka Julius midagi kirjutavad , need kirjutavad ikka väga siukseid nagu high performance , väga advanced asju . aga jah , noh , ütleme , et

54:46.820 --> 55:16.820 Python on ja kõik raamistikud , mis sinna ümber on , on tehtud , on ju , et Nvidia on väga suure toe andnud just avatud lähtekoodiga asjadele . ja , ja , ja kõik need nii-öelda muud raamistikud , mis sinna ümber käivad , et on suhteliselt . aga kuidas see infrapool , et palju nagu tüüpiline masinaõppeinsener oma masinast teeb versus nagu kuskil pilves arvutab ? masinaõppeinsener , andmeinsener või , või , või andmeteadlane on ju .

55:16.820 --> 55:46.820 et ajalooliselt on kujunenud niimoodi , et andmeteadlased kipuvad ikkagi kuskil oma masinas asju tegema , neid on väga raske panna kuskil serverisse mudeleid tegema ja muid siukseid asju , et noh , meie , me oleme üritanud ka niimoodi teha , et kõik asjad toimuvad meil nii-öelda samas klastris , kus meil on staging environment , on ju , et seal on kõik hästi , aga meil on ikkagi üks nii-öelda oma development pc ka kuskil , kus sul on paar GPU-d sees ja kus nii-öelda tegelikult enamus treenib .

55:46.820 --> 56:16.820 mis toimub ikka on ju , et mis on nagu meeldiv , on see , et on , on väga palju tööriistu tehtud selleks , et jälgida oma masinõppemudeli nii-öelda treenimis performance'it , alustades sellest , et kas su dataset on okei , tähendab seda , et kuidas sul andme dataset on balansis , kas noh , meie puhul siis näiteks pildivalgustatused , erinevate objektide arvud , mudelised , kõik oleks kenasti tasakaalus ,

56:16.820 --> 56:46.820 välja siis , et iga nii-öelda treeningrun , mida sa teed , automaatselt kõik nii-öelda jookseb kenasti mingisugusesse keskkonda nagu waits and biases , kus siis nii-öelda sa näed , et okei , ma panin nüüd uue mudeli treenima nii mitme epokiga , selle on selline ja sa saad võrrelda ja teha neid asju , mis omal ajal oli noh , jällegi käsitöö on ju . ühesõnaga sul on võimalik aru saada , et jah , et kas su õpetus , mis meetodid on head või , või võiks paremad olla .

56:46.820 --> 57:16.820 just , just ja mis on äge , on ka see , et , et , et uutes nii-öelda nendes raamistikes on pahatihti integratsioon nendesse tööriistadesse sisse kirjutatud , sa ei pea ise neid nagu tegema , viskad oma appi võtma sisse ja , ja nii-öelda kõik hakkab automaatselt tööle .

57:16.820 --> 57:46.820 kas meil on mingi hinnanguline võimalik , mingi hinnang võimalik teha , et kui palju on nagu võib-olla privaatkasutuses või kuskil enterprise des sees mingisuguseid niisuguseid suuremaid mudeleid , mis võib-olla nagu väga ei teagi . kuhu ma jõudu tahan , on pigem nagu see , et , et ma mäletan , et mingi mõni aasta tagasi , kas mingi autotootja vist analüüsis oma autode .

57:46.820 --> 58:16.820 kuidas nad seda nimetavad siis õhutakistust , indeksit , arvutas seda masinõppega , sellepärast et matemaatiline mudel on hiilgelt keeruline ja iga muudatuse arvutamine võttis lõpuks meeletult aega . et masinõppega olid nad treeninud kuidagi siis selle mudeli , saanud väga hea tulemuse põhimõtteliselt selle eest noh . võrreldes siis nagu selle matemaatilise mudeli

58:16.820 --> 58:46.820 arvutamisega noh , põhimõtteliselt väga väikse ajaga , eks ole . et , et see , aga see tundub , et see on ikkagi korralik teadvus ja korralik töö , mis sinna sisse on läinud , on ju . et kui palju niisuguseid asju veel võiks kuskil nagu peidus olla , millest võib nagu midagi välja kasvada ?

58:46.820 --> 59:16.820 väga lihtsate mudelite peal , aga see on kõik praegu ju puhas masinõpe on ju . tulles siis välja selleni , et noh nii-öelda korporatsioonid juba kasutavad näiteks mingit HR-i , tööriistu selleks , et palgata õige inimene õige koha peale on ju ja nii edasi , nii edasi , nii edasi . et , et tegelikult on , on , on väga palju niisuguseid asju , tootmises eriti . ennustamine ette , kui palju mingeid juppe vaja on mingisugusel perioodil noh , väga palju on noh , et , et ka Eesti ettevõtted noh .

59:16.820 --> 59:17.060 kõik kasutavad , et nagu seal on , ma arvan , nii palju neid erinevaid nagu kõigil , kellel on oma oma masinõppetiim , kindlasti on iga igas nagu ärivaldkonnas midagi , mis võib nagu väga suurt väärtust pakkuda . niimoodi , kas on nüüd mingi asi või küsimus , mis on jäänud küsimata Taavi , aga sul oli kohe mõttes , et sellele sellest peaks rääkima . oi , neid küsimusi on palju , aga mul praegu praegu küll midagi meelde ei tule . ja et me oleme tegelikult siin ma , ma , ma , ma olen mingis uues entusiasmi levelil praegu ma kindlasti siin järgm

59:46.820 --> 01:00:16.820 midagi jälle ehitan . et , et , et selles mõttes see saade täitsa oma eesmärk . et aitäh , aitäh , Taavi ja aitäh , Martin , et aitasid saadet vedada ja , ja tänud ka kuulajatele . teema juurde kindlasti tuleme tagasi uute külaliste uue kontekstiga ja ilmselt pigem varem kui hiljem , sest siin on nagu nädalatega juhtub asju . kuigi mul on , pean märkima , et Taavi ütles siin mõned asjad hästi , et ,

01:00:16.820 --> 01:00:46.820 et tegelikult nüüd on mingisugune platoo võib-olla , et siit edasi mõneks ajaks see , mis nagu seal kirjas kirjutati , et see võib-olla ongi realiseerumas . aga no vaatame , kindlasti jõuab ka laia tarbe kasutusse ja , ja , ja inimeste loodetavasti elu muutub lihtsamaks , aga samas ka võib-olla ohtlikumaks . hea küll , tänud kõigile ja jääme kuulmiseni järgmisel nädalal .

01:00:46.820 --> 01:00:49.560 aitäh

alumae/0405algorytm_podcast.md