Premija už duomenų minkymą

Jau 6 mėn. (nuo 2011 m. balandžio mėn.) vyksta pasaulinis dvejų metų trukmės „Heritage Health“ konkursas, kurio laimėtojui bus skirta 3 mln. dolerių vertės premija, kuris yra organizuotas Kaggle svetainėje, kuri yra buvusio Australijos iždo ir rezervo banko darbuotojo A. Goldbloom kūrinys. Premiją įsteigė Los Andželo „Heritage Provider Network“ ir svetainėje realiu laiku pateikiami daugiau nei 400 komandų sukurtų algoritmų efektyvumai. Paskatinamosios premijos (50-100 tūkst. dolerių) bus skiriamos kas 6 mėn.

Analizuojami per 100 tūkst. pacientų medicininiai duomenys, kad būtų nuspėta, kurie iš jų susirgs greičiausia. Gydytojai galėtų panaudoti tokias prognozes ir pradėti gydyti pacientus anksčiau, nelaukiant, kol teks taikyti brangų hospitalizavimą. Pvz., JAV kiekvienais metais daugiau nei 71 mln. asmenų yra paguldomi į ligonines – o tai dukrat daugiau, nei gyvena Kanadoje. Nemaža dalis jų nėra būtini ir išlaidos jiems siekia 30 mlrd. dolerių. Krizės laikotarpiu tai dideli pinigai. Data Mining

Pirmąją paskatinamąją 50 tūkst. dolerių premiją O‘Reilly Media‘s Strataconf‘2011 duomenų analizės konferencijoje Niujorke 2011 m. rugsėjo 23 d. įteikė „Heritage Provider Network“ prezidentas R. Merkin‘as. Ją (po 30 ir 20 tūkst. USD) pasidalino „Market Makers“ komanda, kartu su Olandijos IT analitiku William Mestrom‘u. Laimėjusios komandos privalo sutikti, kad atskleis savo metodus, kad būtų galima patobulinti algoritmus.

Inžinierius iš Melburno Phil Brierley, dirbantis IBM kaip duomenų analitikas (o anksčiau dirbęs Nacionaliniame Australijos banke, kur analizavo klientų mokumo rizikas), o taip pat pardavinėjantis savo sukurti duomenų analizės sistemą „Tiberius“, konkurse pradėjo dalyvauti vienas, tačiau vėliau sujungė jėgas su Floridos fondo valdytojo ir biržų analitiku David Vogel bei Virginijos sveikatos pramonės konsultantu Randy Axelrod, - tai suformuojant „Market Makers“ komandą. Komanda naudoja mašininio apsimokymą, kai algoritmai mokosi iš anksčiau pasiektų rezultatų. Kompiuteriai yra pranašesni už žmones, nes gali tiksliau įvertinti įvairių veiksnių (pvz., padidėjusio kraujo spaudimo ar cukraus kiekio) svarbą. Dėl tokių apsimokančių algoritmų lankstumo visai nebūtinas medicininis išsilavinimas – tad nereikia stebėtis, kad komandoje tik vienintelis R. Axelrod‘as jį turi. Taip ir ankstesniuose konkursuose laimėdavo nebūtinai specialistai: astronomijos srityje sėkmė lydėjo glaciologus, šachmatų reitingavimo sistemą įveikė nežaidžiantys šachmatais, o bioinformatikos problemas išsprendė paieškos internete (SEO) specialistai.

Dar kitos trys Australijos komandos paskutinį mėnesį buvo tarp 10-ies pirmaujančių, tačiau negavo premijos. Du tyrinėtojai iš Kanberos, J. Petter ir T. Caetano, liko antroje vietoje. Trečioje vietoje liko „Opera Solutions“ iš JAV.


William Mestrom‘as dirba duomenų agregatoriumi. Kas naktį jis konkursui skiria po 30-60 min. Jis sako: „Kiti žmonės žiūri TV, o aš darau tai“. Praeitais metais jis buvo komandoje, užėmusiai antrąją vietą „Netflix“ organizuotame konkurse.

Duomenų analizė (data mining) yra paslaptinga, sausa ir nuobodi veikla, kurią už „uždarų durų“ atlieka pasamdytos kompanijos, duomenų analitikai, mokslininkai ir inžinieriai, kurie neretai naudoja labai brangias programinės įrangos sistemas. Prieš keletą metų tai buvo įkandama tik stambioms kompanijoms, turinčioms ne tik didelį biudžetą, bet ir galingus kompiuterius. Tačiau šiandien net ir su pigiais darbiniais kompiuteriais, naudojant atviro kodo programas, darbuotojai, turintys inžinerinį, matematinį ar IT išsilavinimą, gali nesunkiai išgauti vertingą informaciją iš kompanijos turimų duomenų.

„Heritage Provider Network“ tinklas iš Kalifornijos (JAV), jungianti apie 100 ligoninių bei 32 tūkst. gydytojų) kuria programas ir paslaugas, reikalingas sveikatos apsaugai, o taip pat organizuoja ir prižiūri medicinines grupes bei nepriklausomas organizacijas, jas integruodamas su ligoninėmis.

Kaggle svetainėje konkursus su prizais rengia „Deloitte“, NASA, šachmatų federacija, „Wikipedia“, JAV ir Australijos universitetai. Kai kurie tų konkursų laimėtojai gana viliojančius darbo pasiūlymus.

Matematika ir kalba

2012 m. birželio pradžioje L. Tolstojaus muziejuje-sodyboje Jasnaja Polianoje Vladimiras Uspenskis, MVU mechmato ir filologijos fakultetų profesorius, skaitė paskaitą „Kioningsbergo tiltai ir geometrija diletantams“, kurios pagrindas buvo jo knyga „Matematikos apologija“.

Garsiojo A. Kolmogorovo mokinys filologijos fakultete prieš 52 m. įkūrė taikomosios teorinės lingvistikos skyrių, kurį baigė daug garsių akademikų. V. Uspenskio dėka mokyklose, be tradicinių rusų kalbos olimpiadų, pasirodė lingvistikos varžybos – su užduotimis, kurių sprendimui mokėti kalbas nėbūtina. O jie lavina loginį mąstymą.

„Duoti keli žodžiai irokėzų kalba, o greta keli žodžiai ivritu – visi sumaišyti. Jie vienas kito vertimas. Reikia juos išdėlioti teisinga tvarka. Kaip tai įmanoma? O štai – ir išsprendžia” – pasakojo jis.

Paskaitos klausė vos keli matematikai. Pagrindiniai klausytojai – humanitarinių fakultetų studentai iš Tulos, mokiniai ir turistai. Tokiems diletantams jis ir skyrė savo knygą - apie lygiagrečias tieses, Lobačevskio geometrją, homeomorfiją. „Matematika – ne nuobodus tikslasis mokslas, o bendražmogiškos kultūros dalis“, - mano Uspenskis.

Papildomai skaitykite:   Minkšta ir kieta kalbos
Kibernetikos istorijos etiudai, V. Nalimovas

Matematika ir biologija

Matematika tampa vis svarbesniu darbiniu įrankiu biologams. Dviejų tipų matematiniai modeliai panaudoti ypač sėkmingai: a) vyksmo laike modeliai, išvesti iš diferencialinių lygčių (DE), naudojami biocheminių reakcijų kinetikai apibrėžti; b) diskretaus laiko algebriniai modeliai, sudaryti iš funkcijų su baigtinio būsenų skaičiaus kintamaisiais (pvz., 1 ir 0), nusako tinklų sujungimų logiką.

Matematika padeda nuspėti ląstelių elgseną

Teksaso universiteto Austine mokslininkai parodė, kad matematiniai modeliai, sudaryti pagal duomenis iš Žmonių Genomo projekto, gali teisingai nuspėti anksčiau nežinomus ląstelių mechanizmus.

2004 m. „Proceedings of the National Academy of Sciences" paskelbtame O. Alter straipsnyje, parašytame kartu su Stanfordo un-to prof. G. H. Golubu, įkvėpta kvantinėje mechanikoje naudojamų metodų, panaudojo panašius matematinius metodus, kad nuspėtų reguliavimo mechanizmus DNR replikavimosi pradžioje – proceso, kai DNR informacija perduodama RNR.

Šiuos 4 m. biomedikė Orly Alter su savo studentais bendradarbiavo su Londono Vėžio tyrimų instituto (Anglijoje) direktoriumi J. X. Diffley ir jo Chromosomų replikavimo laboratorija, kuri tikrino tų modelių prognozes. Testų rezultatai paskelbti 2009 m. spalio 13 d. „Nature Molecular Systems Biology" žurnalo numeryje.

Suprachiazmatinis branduolys Vidinio laikrodžio veikimo principas

Mičigano universiteto matematikai su kolegomis iš Britanijos sakosi nustatę signalą, kurį smegenys siunčia kūnui biologinių ritmų sureguliavimui. Vidinio žmogaus laikrodžio veikimo supratimas gali padėti išspręsti miego sutrikimų problemas (nemigą ar laiko juostos pasikeitimo sindromą) bei gydyti su juo susijusias ligas (vėžį, Alzeimerio ligą, depresiją ir pan.).

Kūno pagrindinis laikrodis yra smegenų srityje, kuri vadinama suprachiazmatiniu branduoliu (SCN), besirandančiu ant smegenų vidurio juostos, pogumburyje. Jau kelis dešimtmečius mokslininkai tikėjo, kad SCN tam tikru dažniu (dieną dažniau, naktį lėčiau) siunčia elektros impulsus, kurie reguliuoja laike kūno procesus, vadinamuosius cirkadinius ritmus.

Tačiau dabar D. Forgerio ir jo komandos surinkta informacija gali pakeisti tą įsivaizdavimą. SCN siunčiamas signalas yra užkoduojamas sudėtingu formatu. Apie tai jie paskelbė 2009 m. spalio 9 d. „Science" žurnale.

Siekdami nustatyti spėjimą, britų mokslininkai sukaupė 400 pelių SCN siųstus signalus (visiems žinduoliams laiko užtikrinimo sistema panaši). Tada Mičigano matematikai pagal tuos duomenis patikrino savo modelį ir nustatė, kad jie jį beveik tenkina.

SCN sudaro tiek laiko ląstelės (vadinamos per1), tiek ne laiko. Metų metais buvo registruojami jų abiejų mišriai generuojami elektriniai signalai. Tačiau britai sugebėjo atskirti signalus, siunčiamus vienų ir kitų ląstelių. Tada buvo nustatyta, kad dienos metu SCN per1 ląstelės išlaiko įelektrintą būseną, tačiau nesiunčia signalų. Signalų siuntimas vyksta tik trumpą laiką ateinant nakčiai, - ir tai dar kartą pasikartoja auštant. Tas siuntimas yra kodas, kurį smegenys siunčia kūnui.

Taigi, viskas tarytum vyksta visai kitaip. Ir kartu tai iškelia papildomą klausimą – smegenys veikia analoginiu ar skaitmeniniu būdu?

Papildomai skaitykite: Laikrodžiai mūsų kūne

Nulaužtas smegenų skaitmeninis kodas

Prancūzijos INSERM tyrinėtojai atrado, kad smegenų veiklos jie gali pasakyti, kokį skaičių žmogus ką tik matė – kiek taškų jam buvo parodyta. Apie tai pranešta 2009 m. rugsėjo 24 d. "Current Biology" leidinyje. Tai patvirtina, kad skaičiai yra koduojami smegenyse specifiniu veiklos „raštu", ir atveria duris į sudėtingesnę žmogaus skaičiavimo galimybių studiją.

Evelyn Eger sakė, kad pas beždžiones vieną ar kitą skaitinę reikšmę atitinkantys neuronai buvo labai susipynę tarpusavyje bei su kitais neuronais, tad atrodė mažai tikėtina, kad fMRI (funkcinis magnetinio rezonanso įrašymas) su 1,5 mm skiriamąja geba (kai vienas pluoštą sudaro keli tūkstančiai Mathematical Brain neuronų) sugebės nustatyti veiklos skirtumus, susijusius su skirtingais skaičiais. Kad tai suveikė, reiškia, kad greičiausiai yra kažkoks labiau struktūrizuotas darinys, kurį dar reiks nustatyti.

Tyrinėtojai 10-čiai dalyvių rodė skaitmenis arba taškus. Tada panaudojo multivariantinę analizę, stengdamiesi nustatyti, kokį skaičių dalyviai matė. Ir nors smegenų veiklos raštas kiek skyrėsi, kai buvo matomi skaitmenys ir taškų skaičius, matytų taškų skaičių nustatyti sekėsi lengviau. Jie iš jo galėjo nustatyti skaičių eiliškumą, tarkim, kad 6 yra tarp 5 ir 7.

Kaip žema radiacija veikia širdį?

Londono Imperatoriškojo koledžo tyrinėtojai sukūrė matematinį modelį, leidžiantį įvertinti širdies ir kraujagyslių sistemos susirgimų (infarktų, insultų) riziką, atsižvelgiant į žemo lygio radiacijos dozes. Modelis rodo, kad rizika kinta labiausiai priklausomai nuo dozės dydžio. Tyrinėjimai paskelbti 2009 m. spalio 23 d. žurnale „PloS Computational Biology", 5 (10).

Jau kurį laiką mokslininkai žinojo, kaip aukštos radioterapijos (RT) dozės sukelia širdies ir pagrindinių kraujagyslių uždegimus. O paskutiniais metais tyrinėjimai parodė, kad ir žemos radiacijos dozės (pvz., kurias gauna atominių elektrinių darbuotojai) padidina širdies ir kraujagyslių ligų riziką, tačiau liko neaišku, kokie biologiniai mechanizmai už tai atsakingi.

Britų tyrinėtojai, kuriems vadovavo Markas Little's, spėjo, kad radiacija žudo monocitus (baltųjų kraujo kūnelių atmainą) arterijų sienelėse, kurie susijungia į proteiną MCP-1. Padidėjęs proteino kiekis sukelia uždegimą, sukeliantį susirgimą.

Matematika padeda nuspėti ląstelių elgseną

Teksaso universiteto Austine mokslininkai parodė, kad matematiniai modeliai, sudaryti pagal duomenis iš Žmonių Genomo projekto, gali teisingai nuspėti anksčiau nežinomus ląstelių mechanizmus.

2004 m. „Proceedings of the National Academy of Sciences” paskelbtame O. Alter straipsnyje, parašytame kartu su Stanfordo un-to prof. G. H. Golubu, įkvėpta kvantinėje mechanikoje naudojamų metodų, panaudojo panašius matematinius metodus, kad nuspėtų reguliavimo mechanizmus DNR replikavimosi pradžioje - proceso, kai DNR informacija perduodama RNR.

Šiuos 4 m. biomedikė Orly Alter su savo studentais bendradarbiavo su Londono Vėžio tyrimų instituto (Anglijoje) direktoriumi J. X. Diffley ir jo Chromosomų replikavimo laboratorija, kuri tikrino tų modelių prognozes. Testų rezultatai paskelbti 2009 m. spalio 13 d. „Nature Molecular Systems Biology” žurnalo numeryje.

Meilės sinusoidė
Algebra akimirksniu
Gyvenimo gėlelė
Jų begalinė išmintis
Laikrodžiai mūsų kūne
Didžioji Ferma teorema
Iniciatyva: Matematikos keliu
Matematikos šlovė ir garbė
Matematikos pradžia Lietuvoje
Statistikos sąvokų pristatymas
Mokslininkui nereikia matematikos!
Šiuolaikiniai iškilūs matematikai
Surasta trilijonas trikampių
Kombinatorika, polinomai, tikimybės
Ar jau rūksta dūmai? Navier Stokes lygtys
Semantinės derybos: Dviprasmybių modeliavimas
Laimėti pralaimint: „dviejų vokų“ paradoksas
Džordžas Birkhofas - matematikas ir meno matuotojas
Netiesinis mąstymas: išspręsti neišsprendžiamą
Naujas pirminių skaičių dėsningumas
Moksleivis „perkando“ I. Niutono uždavinį
Nauji picos pjaustymo būdai
Matematikos atgimimas Lietuvoje
Diagramos, pakeitusios pasaulį
Matematikai: Davidas Hilbertas
Matematinė kalba ir simbolika
Golbacho teiginio įrodymas?
Skaičių simbolika Vedose
Matematika ir muzika
Perkoliacija
Topologija
Vartiklis