tavainimene

Minule jälle on rehkendus raske

Posted in * by tavainimene on 05/10/2021

Magistritöö juhendaja arvas, et ma peaks minema üldisemaks ja teoreetilisemaks. See tähendab, et tuleb lugeda, lugeda, lugeda. Ostsin Rimist 15 euro eest 1,0 lugemisprillid. Jah, kui teil on eluaeg olnud küsimus, kes ostavad prille toidupoest, siis minap see nüüd olen. Olgu, see on ajutine lahendus, aga juba on nii palju parem. Hakkab tekkima kohutav kahtlus, et minu viimase aasta paberraamatute lugemise ikaldus ongi olnud tingitud udusevõitu nägemisest.

Tööintervjuul sain teise vooru. Vist. Hetkel on vaikus. Vesteldes tundsin ennast täitsa asjalikult, seevastu koolitöid tehes olen hev- ja lõk-õppija. Öökapiraamat, millega ma ennast nüüd magama nutan, on “Python for Data Science”. Saiensist on asi muidugi kaugel, mul jooksutab juba lihtne andmete puhastamine juhtme kokku. Kui sotsiaalteadlased muretsevad, et alaesindatud gruppide skoore ei tohiks lihtlabaselt kaaludega korrutada (need kaks tüüpi, kes viitsisid su ankeedi avada ja lõpuni täita, on ilmselgelt millegi poolest erandlikud), siis ärianalüütikutel käib asi umbes nii, et “pohh, yolo, paneme igasse lünka mingi keskmise”. See seletab vähemasti, miks kõik veebipoed üritavad mulle reklaamida mitme numbri võrra väikseid kleite. Siis pusisin napaka visadusega mitu õhtut liigendtabeli (!) ja kuumuskaardi (!!) kallal, saades järjest eksootilisemaid veateateid, mis vihjasid sellele, et mul on vale andmetüüp. Ei ole, noh, pagan seda püütonit võtku. Lõpuks otsustasin: mis kinni ei jää, saab kinni löödud. Kirjutasin iga rea lõppu errors=’coerce’ ja saatsin töö ära. Väga vaevarikas on abi küsida ja oodata Moodli foorumi kaudu; see on ikka aine, mida peaks õppima oskaja inimese vahetul juhendamisel. Ja kui Stackoverflow peaks sama kaua maas olema kui Facebook, siis variseks tsivilisatsioon tõenäoliselt kokku.

9 kommentaari

Subscribe to comments with RSS.

  1. nodsu said, on 05/10/2021 at 20:54

    “ärianalüütikutel käib asi umbes nii, et “pohh, yolo, paneme igasse lünka mingi keskmise”. See seletab vähemasti, miks kõik veebipoed üritavad mulle reklaamida mitme numbri võrra väikseid kleite.” –

    äkki seletab see ka, miks majandusteadlased majanduskriise prognoosida ei suuda ja need tulevad alati nagu “ups, juhtus.”

    • _kaur_ said, on 05/10/2021 at 21:29

      Minu arust küll suudavad. Aga keegi ei taha neid uskuda, sest see oleks nii tüütu. Riigid arvestavad oma poliitikas majanduskasvuga, ja selle eelduse vastu ennustamine on lihtsalt ketserlus. Nagu need Itaalia teadlased, kes hoiatasid mingi konkreetse maavärina eest ja valitsus sundis nad kõigepealt vait, sest mingeid õnnetusekuulutajaid pole ometi vaja rahastada, ja siis pärast õnnetust pani kinni, kuna nad ei suutnud maavärinat ennustada.

    • kaarnake said, on 06/10/2021 at 20:48

      Riigieelarvega sama…

  2. _kaur_ said, on 05/10/2021 at 21:25

    Kõige kõige esimene füssa praks (ülikoolis) oli andmetega manipuleerimise õpetus, ametliku nimega “mõõtmisteooria ja veaarvutus”. Pmst mõõtsid sa sada juhuslikku arvu ja pidid neist koostama normaaljaotuse sarnase histogrammi. Plaks ja kaikaga tehti selgeks, et andmed – need ei ole midagi püha ega reaalset, vaid lihtsalt vahend sulle meeldiva tulemuse saamiseks.

    Aga veidi üldisemalt – kõik sõltub eesmärgist. Milleks sa seda analüüsi teed? (Ilmselt kursuse / kooli lõpetamiseks, aga teeme näö, et ei.) Kas sa saad reaalseid, kasulikke tulemusi? Kas maailm muutub su analüüsi tulemusel paremaks? Kui jah, siis see vabandab igasugu trikid välja.

    Ühtlasi kahtlustan, et mistahes ankeetide andmeid on normaalseks analüüsiks alati liiga vähe, kui just polegi eesmärk ala-andmetega opereerida. Eesti ühiskond on juba olemuslikult tilluke. Kas teile mingeid päris andmeid ei anta? Kõikide hiinlaste asukoht ja mõtted millisekundi ja millimeetri täpsusega viimase tuhande aasta jooksul, või midagi sarnast? Mu arusaam andmeanalüüsist on pärit Skypest, headel aegadel sada miljonit paralleelset kasutajat, täiesti reaalne oli ühe turunduskampaaniaga samuti paarsada miljonit uut kontot saada (kõik pätid seejuures). Kaks vastajat… eeee.. ee.

  3. epp said, on 06/10/2021 at 02:55

    Mina ka ostan prille toidupoest.

  4. Indigoaalane said, on 06/10/2021 at 08:06

    See on nüüd ilmselt koht, kus ma saan üles tunnistada, et täitsin üht statistikaameti ülipikka tabelit samamoodi, suva, mis tuleb.
    Ma ausõna alustasin entusiastlikult, aga see ei lõppenud ega lõppenud ja ega ma õigeid vastuseid ei teadnud ka, selleks oleks pidanud tegema ettevõttes uurimistööd, sest ilmselgelt pole keegi neid kulusid eraldi kirjendanud ja…
    paningi 0, 0, 0, 0….
    Loodetavasti ei kuku Eesti riik kokku ja keegi vastas ikkagi õigesti ka.

    • _kaur_ said, on 06/10/2021 at 08:40

      Stat amet võiks ilma pealt lihtsalt ära kaduda ja Eesti riik ei paneks tähele ka. Poliitilisi otsuseid tehakse niikuinii kokkulepete, mitte analüüsi pealt. Ja kõige muu mõttes on nad selline nice-to-have butiik.

  5. tavainimene said, on 06/10/2021 at 13:26

    Jahnoh. Õigem oleks vist, kui neisse vormidesse saaks ausalt kirjutada “ei tea”, mis on ikka hoopis teine asi kui 0. Null, mitte null. Mina sidusin mind kinni. Hõõhõõhõõõõ.

    Statistikaamet on butiik, kus jätkub kaupa igale maitsele. Võta näiteks ja arvuta välja, et vaktsineeritud inimesed surevad suurtel kiirustel ja hulgakaupa … See tuletab natuke meelde Švejki: “Kuid ka mina tahaksin teile, mu härrad, ühe mõistatuse anda: neljakordne maja, majal on iga korra peal kaheksa akent, katusel kaks pööninguakent ja kaks korstnat, igal korral on kaks üürnikku. Nüüd ütelge mulle, härrad, mis aastal suri kojamehe vanaema?” Kusjuures. See ei ole üldse niisama nali. See on üsna vana ja tõsine nali. Mitmel pool maailmas on korratud eksperimenti “matemaatikaülesandega” stiilis “laeval on 26 kitse ja 10 lammast, kui vana on kapten?” Väidetavalt umbes 3/4 õpilastest annab vastuseks 36. Nüüd on vaatleja maailmavaate küsimus, kas see peegeldab õpilaste rumalust, pealiskaudsust ja kriitilise mõtlemise puudust või piiritut usaldust või veendumust, et täiskasvanute maailm ongi napakas.

  6. tavainimene said, on 06/10/2021 at 14:58

    Aga majanduskriisid — seal on vist rohkem see komplekssuse ja emergentsuse teema. Eks ikka võib ju loota, et eriti suured suurandmed ja eriti intelligentne tehisintellekt, aga mina selle peale kihla ei veaks.


Lisa kommentaar

Täida nõutavad väljad või kliki ikoonile, et sisse logida:

WordPress.com Logo

Sa kommenteerid kasutades oma WordPress.com kontot. Logi välja /  Muuda )

Google photo

Sa kommenteerid kasutades oma Google kontot. Logi välja /  Muuda )

Twitter picture

Sa kommenteerid kasutades oma Twitter kontot. Logi välja /  Muuda )

Facebook photo

Sa kommenteerid kasutades oma Facebook kontot. Logi välja /  Muuda )

Connecting to %s

%d bloggers like this: