Premija už duomenų minkymą  

Jau 6 mėn. (nuo 2011 m. balandžio mėn.) vyksta pasaulinis dvejų metų trukmės „Heritage Health“ konkursas, kurio laimėtojui bus skirta 3 mln. dolerių vertės premija, kuris yra organizuotas Kaggle svetainėje, kuri yra buvusio Australijos iždo ir rezervo banko darbuotojo A. Goldbloom'o kūrinys. Premiją įsteigė Los Andželo „Heritage Provider Network“ ir svetainėje realiu laiku pateikiami daugiau nei 400 komandų sukurtų algoritmų efektyvumai. Paskatinamosios premijos (50-100 tūkst. dolerių) bus skiriamos kas 6 mėn.

Analizuojami per 100 tūkst. pacientų medicininiai duomenys, kad būtų nuspėta, kurie iš jų susirgs greičiausia. Gydytojai galėtų panaudoti tokias prognozes ir pradėti gydyti pacientus anksčiau, nelaukiant, kol teks taikyti brangų hospitalizavimą. Pvz., JAV kiekvienais metais daugiau nei 71 mln. asmenų yra paguldomi į ligonines – o tai dukrat daugiau, nei gyvena Kanadoje. Nemaža dalis jų nėra būtini ir išlaidos jiems siekia 30 mlrd. dolerių. Krizės laikotarpiu tai dideli pinigai. Data Mining

Pirmąją paskatinamąją 50 tūkst. dolerių premiją O‘Reilly Media‘s Strataconf‘2011 duomenų analizės konferencijoje Niujorke 2011 m. rugsėjo 23 d. įteikė „Heritage Provider Network“ prezidentas R. Merkin‘as. Ją (po 30 ir 20 tūkst. USD) pasidalino „Market Makers“ komanda, kartu su olandų IT analitiku William Mestrom‘u. Laimėjusios komandos privalo sutikti, kad atskleis savo metodus, kad būtų galima patobulinti algoritmus.

Inžinierius iš Melburno Phil Brierley, dirbantis IBM kaip duomenų analitikas (o anksčiau dirbęs Nacionaliniame Australijos banke, kur analizavo klientų mokumo rizikas), o taip pat pardavinėjantis savo sukurtą duomenų analizės sistemą „Tiberius“, konkurse pradėjo dalyvauti vienas, tačiau vėliau sujungė jėgas su Floridos fondo valdytojo ir biržų analitiku David Vogel bei Virginijos sveikatos pramonės konsultantu Randy Axelrod, - tai suformuojant „Market Makers“ komandą. Komanda naudoja mašininio apsimokymą, kai algoritmai mokosi iš anksčiau pasiektų rezultatų. Kompiuteriai yra pranašesni už žmones, nes gali tiksliau įvertinti įvairių veiksnių (pvz., padidėjusio kraujo spaudimo ar cukraus kiekio) svarbą. Dėl tokių apsimokančių algoritmų lankstumo visai nebūtinas medicininis išsilavinimas – tad nereikia stebėtis, kad komandoje tik vienintelis R. Axelrod‘as jį turi. Taip ir ankstesniuose konkursuose laimėdavo nebūtinai specialistai: astronomijos srityje sėkmė lydėjo glaciologus, šachmatų reitingavimo sistemą įveikė nežaidžiantys šachmatais, o bioinformatikos problemas išsprendė paieškos internete (SEO) specialistai.

Dar kitos trys Australijos komandos paskutinį mėnesį buvo tarp 10-ies pirmaujančių, tačiau negavo premijos. Du tyrinėtojai iš Kanberos, J. Petter'is ir T. Caetano, liko antroje vietoje. Trečioje vietoje liko „Opera Solutions“ iš JAV.


William Mestrom‘as dirba duomenų agregatoriumi. Kas naktį jis konkursui skiria po 30-60 min. Jis sako: „Kiti žmonės žiūri TV, o aš darau tai“. Praeitais metais jis buvo komandoje, užėmusiai antrąją vietą „Netflix“ organizuotame konkurse.

Duomenų analizė (data mining) yra paslaptinga, sausa ir nuobodi veikla, kurią už „uždarų durų“ atlieka pasamdytos kompanijos, duomenų analitikai, mokslininkai ir inžinieriai, kurie neretai naudoja labai brangias programinės įrangos sistemas. Prieš keletą metų tai buvo įkandama tik stambioms kompanijoms, turinčioms ne tik didelį biudžetą, bet ir galingus kompiuterius. Tačiau šiandien net ir su pigiais darbiniais kompiuteriais, naudojant atviro kodo programas, darbuotojai, turintys inžinerinį, matematinį ar IT išsilavinimą, gali nesunkiai išgauti vertingą informaciją iš kompanijos turimų duomenų.

„Heritage Provider Network“ tinklas iš Kalifornijos (JAV), jungianti apie 100 ligoninių bei 32 tūkst. gydytojų) kuria programas ir paslaugas, reikalingas sveikatos apsaugai, o taip pat organizuoja ir prižiūri medicinines grupes bei nepriklausomas organizacijas, jas integruodamas su ligoninėmis.

Kaggle svetainėje konkursus su prizais rengia „Deloitte“, NASA, šachmatų federacija, „Wikipedia“, JAV ir Australijos universitetai. Kai kurie tų konkursų laimėtojai gana viliojančius darbo pasiūlymus.

Matematika ir biologija

Matematika tampa vis svarbesniu darbiniu įrankiu biologams. Dviejų tipų matematiniai modeliai panaudoti ypač sėkmingai: a) vyksmo laike modeliai, išvesti iš diferencialinių lygčių (DE), naudojami biocheminių reakcijų kinetikai apibrėžti; b) diskretaus laiko algebriniai modeliai, sudaryti iš funkcijų su baigtinio būsenų skaičiaus kintamaisiais (pvz., 1 ir 0), nusako tinklų sujungimų logiką.

Matematika ir nemirtingumas

Daugelį metų moksle vyravo nuomonė, kad gyvų būtybių neįmanoma aprašyti mechanikos, fizikos ir matematikos metodais, nes jos pernelyg sudėtingos ir jų elgesys neprognozuojamas. Vienu pirmųjų šį teiginį paneiimągė prancūzų gydytojas ir filosofas Ž. Lametri, 1747 m. parašęs „Žmogus-mašina“, kurioje išdėstė samprotavimus, kad žmogaus kūno organai paklūsta mokslo dėsniams. Vis tik jis suprato kiek sudėtingas gyvas organizmas.

O matematika pamažu prasiskverbė ne tik atskiro organizmo sandarą, bet ir jų bendriją. Jau 20 a., italų matematikas ir fizikas Vito Voltera1) išleido „Matematinę kovos už egzistavimą teoriją“ (1931), kurios pratarmėje rašė: „šių tyrinėjimų sritis apima visas kurios nors bendrijos individuumų kovos apraiškas; vienų prieaugis vyksta kitų žuvimo dėka, ir, beje, prieaugį ir žūtį galima įvertinti skaitiškai“. Tad jas galima paskaičiuoti sudėtingų diferencialinių ir integracinių lygčių, pavadintų Volteros lygtimis, pagalba.

Pvz., jei miške renki uogas, tai jų rinkimo sparta priklauso nuo jų kiekio uogyne, nuo rankų judesių greičio ir judėjimo per uogyną. Uogų pildymąsi pintinėje galima išreikšti diferencialine lygtimi, o sumarinis kiekis pintinėje aprašomas integralu pagal laką nuo rinkimo spartos. Jei atsižvelgsime. Kad gausėjant uogų intinėje judėjimas po uogyną lėtėja, nes pasireiškia nuovargis, tai paaiškėja, kad uogų rinkimas aprašomas integracine-diferencialine lygtimi.

Vito Voltera parodė, kad tokios lygtys aprašo, pvz., ciklinius plėšrūnų ir žolėdžių skaičiaus svyravimus. Būna laikotarpių, kai medžiotojai pristato daug kiškių kailiukų, tačiau mažai lapių. Ir atvirkščiai, maisto gausa skatina lapių skaičiaus didėjimą, o tai mažina kiškių populiaciją. Tad matematika savo lygtimis gali spręsti apie biologinių procesų vyksmą, pvz., žuvų tarpe. O 20 a. pradžioje amerikietis Alfredas Lotka2) atliko analogišką žmonių populiacijos svyravimų analizę.

N. Gorkavio trilogijos „Astrovitianka“ (2008) 3-e knygoje siūlomas toks matematinis „nemirtingumo sprendinys“: „Homo sapiens organizmui buvo sudaryta neįtikėtinai sudėtinga diferencialinių-integralinių-tenzorinių-grupinių lygčių sistema. Šios sistemos sprendinys aprašo visus organizme vykstančius gyvybinius procesus. Šio ‚gyvybės sprendinio‘ suradimas buvo neįtikėtino sudėtingumo užduotis, tačiau dar didesnio dantų skausmo problema tapo ‚nemirtingumo sprendinys‘. Dėl jo reikėjo surasti ir uždėti ant pradinės lygčių sistemos – tokias sąlygas, kurioms esant gyvybiniai procesai žmoguje yra neriboti laiku, pvz., ląstelių dalijimasis praėjus dešimtims metų nenusloptų apoptozės mėšlungiuose, o tęstųsi neribotai“.

Matematika padeda nuspėti ląstelių elgseną

Teksaso universiteto Austine mokslininkai parodė, kad matematiniai modeliai, sudaryti pagal duomenis iš Žmonių Genomo projekto, gali teisingai nuspėti anksčiau nežinomus ląstelių mechanizmus.

2004 m. „Proceedings of the National Academy of Sciences" paskelbtame O. Alter straipsnyje, parašytame kartu su Stanfordo un-to prof. G. H. Golubu, įkvėpta kvantinėje mechanikoje naudojamų metodų, panaudojo panašius matematinius metodus, kad nuspėtų reguliavimo mechanizmus DNR replikavimosi pradžioje – proceso, kai DNR informacija perduodama RNR.

Šiuos 4 m. biomedikė Orly Alter su savo studentais bendradarbiavo su Londono Vėžio tyrimų instituto (Anglijoje) direktoriumi J. X. Diffley ir jo Chromosomų replikavimo laboratorija, kuri tikrino tų modelių prognozes. Testų rezultatai paskelbti 2009 m. spalio 13 d. „Nature Molecular Systems Biology" žurnalo numeryje.

Suprachiazmatinis branduolys Vidinio laikrodžio veikimo principas

Mičigano universiteto matematikai su kolegomis iš Britanijos sakosi nustatę signalą, kurį smegenys siunčia kūnui biologinių ritmų sureguliavimui. Vidinio žmogaus laikrodžio veikimo supratimas gali padėti išspręsti miego sutrikimų problemas (nemigą ar laiko juostos pasikeitimo sindromą) bei gydyti su juo susijusias ligas (vėžį, Alzeimerio ligą, depresiją ir pan.).

Kūno pagrindinis laikrodis yra smegenų srityje, kuri vadinama suprachiazmatiniu branduoliu (SCN), besirandančiu ant smegenų vidurio juostos, pogumburyje. Jau kelis dešimtmečius mokslininkai tikėjo, kad SCN tam tikru dažniu (dieną dažniau, naktį lėčiau) siunčia elektros impulsus, kurie reguliuoja laike kūno procesus, vadinamuosius cirkadinius ritmus.

Tačiau dabar D. Forgerio ir jo komandos surinkta informacija gali pakeisti tą įsivaizdavimą. SCN siunčiamas signalas yra užkoduojamas sudėtingu formatu. Apie tai jie paskelbė 2009 m. spalio 9 d. „Science" žurnale.

Siekdami nustatyti spėjimą, britų mokslininkai sukaupė 400 pelių SCN siųstus signalus (visiems žinduoliams laiko užtikrinimo sistema panaši). Tada Mičigano matematikai pagal tuos duomenis patikrino savo modelį ir nustatė, kad jie jį beveik tenkina.

SCN sudaro tiek laiko ląstelės (vadinamos per1), tiek ne laiko. Metų metais buvo registruojami jų abiejų mišriai generuojami elektriniai signalai. Tačiau britai sugebėjo atskirti signalus, siunčiamus vienų ir kitų ląstelių. Tada buvo nustatyta, kad dienos metu SCN per1 ląstelės išlaiko įelektrintą būseną, tačiau nesiunčia signalų. Signalų siuntimas vyksta tik trumpą laiką ateinant nakčiai, - ir tai dar kartą pasikartoja auštant. Tas siuntimas yra kodas, kurį smegenys siunčia kūnui.

Taigi, viskas tarytum vyksta visai kitaip. Ir kartu tai iškelia papildomą klausimą – smegenys veikia analoginiu ar skaitmeniniu būdu?

Papildomai skaitykite: Laikrodžiai mūsų kūne

Nulaužtas smegenų skaitmeninis kodas

Prancūzijos INSERM tyrinėtojai atrado, kad smegenų veiklos jie gali pasakyti, kokį skaičių žmogus ką tik matė – kiek taškų jam buvo parodyta. Apie tai pranešta 2009 m. rugsėjo 24 d. "Current Biology" leidinyje. Tai patvirtina, kad skaičiai yra koduojami smegenyse specifiniu veiklos „raštu", ir atveria duris į sudėtingesnę žmogaus skaičiavimo galimybių studiją.

Evelyn Eger sakė, kad pas beždžiones vieną ar kitą skaitinę reikšmę atitinkantys neuronai buvo labai susipynę tarpusavyje bei su kitais neuronais, tad atrodė mažai tikėtina, kad fMRI (funkcinis magnetinio rezonanso įrašymas) su 1,5 mm skiriamąja geba (kai vienas pluoštą sudaro keli tūkstančiai Mathematical Brain neuronų) sugebės nustatyti veiklos skirtumus, susijusius su skirtingais skaičiais. Kad tai suveikė, reiškia, kad greičiausiai yra kažkoks labiau struktūrizuotas darinys, kurį dar reiks nustatyti.

Tyrinėtojai 10-čiai dalyvių rodė skaitmenis arba taškus. Tada panaudojo multivariantinę analizę, stengdamiesi nustatyti, kokį skaičių dalyviai matė. Ir nors smegenų veiklos raštas kiek skyrėsi, kai buvo matomi skaitmenys ir taškų skaičius, matytų taškų skaičių nustatyti sekėsi lengviau. Jie iš jo galėjo nustatyti skaičių eiliškumą, tarkim, kad 6 yra tarp 5 ir 7.

Kaip žema radiacija veikia širdį?

Londono Imperatoriškojo koledžo tyrinėtojai sukūrė matematinį modelį, leidžiantį įvertinti širdies ir kraujagyslių sistemos susirgimų (infarktų, insultų) riziką, atsižvelgiant į žemo lygio radiacijos dozes. Modelis rodo, kad rizika kinta labiausiai priklausomai nuo dozės dydžio. Tyrinėjimai paskelbti 2009 m. spalio 23 d. žurnale „PloS Computational Biology", 5 (10).

Jau kurį laiką mokslininkai žinojo, kaip aukštos radioterapijos (RT) dozės sukelia širdies ir pagrindinių kraujagyslių uždegimus. O paskutiniais metais tyrinėjimai parodė, kad ir žemos radiacijos dozės (pvz., kurias gauna atominių elektrinių darbuotojai) padidina širdies ir kraujagyslių ligų riziką, tačiau liko neaišku, kokie biologiniai mechanizmai už tai atsakingi.

Britų tyrinėtojai, kuriems vadovavo Markas Little's, spėjo, kad radiacija žudo monocitus (baltųjų kraujo kūnelių atmainą) arterijų sienelėse, kurie susijungia į proteiną MCP-1. Padidėjęs proteino kiekis sukelia uždegimą, sukeliantį susirgimą.

Matematika padeda nuspėti ląstelių elgseną

Teksaso universiteto Austine mokslininkai parodė, kad matematiniai modeliai, sudaryti pagal duomenis iš Žmonių Genomo projekto, gali teisingai nuspėti anksčiau nežinomus ląstelių mechanizmus.

2004 m. „Proceedings of the National Academy of Sciences” paskelbtame O. Alter straipsnyje, parašytame kartu su Stanfordo un-to prof. G. H. Golubu, įkvėpta kvantinėje mechanikoje naudojamų metodų, panaudojo panašius matematinius metodus, kad nuspėtų reguliavimo mechanizmus DNR replikavimosi pradžioje - proceso, kai DNR informacija perduodama RNR.

Šiuos 4 m. biomedikė Orly Alter3) su savo studentais bendradarbiavo su Londono Vėžio tyrimų instituto (Anglijoje) direktoriumi J. X. Diffley ir jo Chromosomų replikavimo laboratorija, kuri tikrino tų modelių prognozes. Testų rezultatai paskelbti 2009 m. spalio 13 d. „Nature Molecular Systems Biology” žurnalo numeryje.

Išvesta universali kiaušinio formos formulė, 2021 Kiaušinių formos

Anglijos Kento un-to, Aplinkos priežiūros ir „Vita-Market Ltd“ tyrinėtojai pagaliau išvedė formulę, kurios nebuvo pavykę iki šiol. Kiaušinio forma jau senai traukė matematikų, fizikų, inžinierių ir biologų dėmesį. Ilgai evoliucionavusi forma pasiekė tai, kad ji pakankamai didelė, kad talpintų embrioną, pakankamai maža, kad paliktų kūną efektyviausiu būdu, kad nenusiristų padėtas ir tiktų beveik 10500 rūšų dauginimosi užtikrinimui. Jis tam yra „tobulos formos“.

Visų kiaušinių analizei buvo panaudotos 4 geometrinės figūros: sfera, elipsoidas, ovalas ir pyriforma (kūginė), kuriai matematinę formulę dar reikia išvesti. Kad tai pakoreguotų, tyrinėtojai įvedė papildomą funkciją, atitinkančią visiškai naują geometrinę formą, apibūdinamą kaip paskutinį sferos-elipsoido evoliucijos etapą, pritaikomą bet kuriai kiaušinio formai. Ši funkcija remiasi 4-iais parametrais: kiaušinio ilgiu, maksimaliu pločiu, vertikalios ašies nuokrypiu, skersmeniu ketvirtyje kiaušinio ilgio.

Matematiniai kiaušinių formų apibrėžimai jau rado pritaikymus maisto produktų tyrimuose, mašinų pramonėje, žemės ūkyje, biomoksluose, architektūroje ir oreivystėje. Pvz., formulę galima taikyti plonasienių indų (kurie patvaresni už sferinius) gamyboje.

Formulės turėjimas leidžia: 1) moksliškai aprašyti biologinį objektą; 2) nustatyti tikslias biologinio objekto charakteristikas; 3) užtikrini būsimą biologiškai pagrįstą inžineriją (pvz., kiaušinio formos pavidalo elementus architektūroje).


Matematika ir kalba

2012 m. birželio pradžioje L. Tolstojaus muziejuje-sodyboje Jasnaja Polianoje Vladimiras Uspenskis, MVU mechmato ir filologijos fakultetų profesorius, skaitė paskaitą „Kioningsbergo tiltai ir geometrija diletantams“, kurios pagrindas buvo jo knyga „Matematikos apologija“.

Garsiojo A. Kolmogorovo mokinys filologijos fakultete prieš 52 m. įkūrė taikomosios teorinės lingvistikos skyrių, kurį baigė daug garsių akademikų. V. Uspenskio dėka mokyklose, be tradicinių rusų kalbos olimpiadų, pasirodė lingvistikos varžybos – su užduotimis, kurių sprendimui mokėti kalbas nėbūtina. O jie lavina loginį mąstymą.

„Duoti keli žodžiai irokėzų kalba, o greta keli žodžiai ivritu – visi sumaišyti. Jie vienas kito vertimas. Reikia juos išdėlioti teisinga tvarka. Kaip tai įmanoma? O štai – ir išsprendžia” – pasakojo jis.

Paskaitos klausė vos keli matematikai. Pagrindiniai klausytojai – humanitarinių fakultetų studentai iš Tulos, mokiniai ir turistai. Tokiems diletantams jis ir skyrė savo knygą - apie lygiagrečias tieses, Lobačevskio geometrją, homeomorfiją. „Matematika – ne nuobodus tikslasis mokslas, o bendražmogiškos kultūros dalis“, - mano Uspenskis.

Papildomai skaitykite:   Minkšta ir kieta kalbos
Kibernetikos istorijos etiudai, V. Nalimovas


1) Vito Volterra (1860-1940) – žydų kilmės italų matematikas ir fizikas, žinomas indėliu į matematinę biologiją ir diferencinių lygčių teoriją. Pirmojo pasaulinio karo metu pasiūlė dirižabliuose vietoje degaus vandenilio naudoti helį. Matematikos taikymais biologijoje užsiėmė po Pirmojo pasaulinio karo. Jo garbei pavadintas krateris nematomoje Mėnulio pusėje.

2) Alfredas Lotka (1880-1949) – ukrainiečių kilmės (Lvovo) amerikiečių matematikas, statistikas, fizikinės chemijos mokslininkas, žinomas darbais apie populiacijos kitimo ir energetikos dėsningumus, pasiūlęs plėšrūno-aukos modelį, išvystytą nepriklausomai nuo V. Volteros. 1907 m. parodė, kad visuomenė, didėjanti nekintančiu tempu ir išlaikanti pastovų mirimų kiekį slenka prie tam tikro amžiaus sudėties ir pastovių gimimo ir mirimo koeficientų. Jis nagrinėjo kartų kaitą, pateikė kartos trukmės išraišką, analizavo šeimos vystymosi demografinį procesą.

3) Orly Alter (g. 1964 m.) – žydų kilmės amerikiečių teorinės fizikos ir skaitmeninės genetikos mokslininkė. Gimusi Izraelyje, 2003 m. natūralizuota JAV. Jutos un-to profesorė, „Eigengene“ bendrasteigėja ir CTO. Ji nustatė teorines kvantines ribas, kurias galima pasiekti matuojant vienetinę fizikinę sistemą (apie tai parašė knygą „Quantum Measurement of a Single System“, 2001; kartu su Y. Yamamoto). Taip pat ji sukūrė pirmuosius genomo mastelio molekulinių biologinių duomenų modelius, panaudojant matricinius ir tenzorinius paskaičiavimus ir parodant, kaip tie modeliai gali būti panaudoti teisingam prieš tai nežinomų gamtos principų nuspėjimui.
Ji eksperimentiškai patvirtino genomo DNR kopijų pokyčių kiekį, aptiktą smegenų glioblastomos augliuose, kaip gyvenimo trukmės įvertinimą, statistiškai tikslesnį ir nepriklausomą nuo asmens amžiaus.

Meilės sinusoidė
Gyvenimo gėlelė
Augalai - chemikai
Algebra akimirksniu
Jų begalinė išmintis
Laikrodžiai mūsų kūne
Didžioji Ferma teorema
Iniciatyva: Matematikos keliu
Matematikos šlovė ir garbė
Kolmogorovo DI alfa ir omega
Matematikos pradžia Lietuvoje
Statistikos sąvokų pristatymas
Meilės ir matematikos ritualai
Šiuolaikiniai iškilūs matematikai
Mokslininkui nereikia matematikos!
Kombinatorika, polinomai, tikimybės
Lietaus uždavinys ir matematinis mąstymas
Ar jau rūksta dūmai? Navier Stokes lygtys
Laimėti pralaimint: „dviejų vokų“ paradoksas
Semantinės derybos: Dviprasmybių modeliavimas
Džordžas Birkhofas: matematikas ir meno matuotojas
Netiesinis mąstymas: išspręsti neišsprendžiamą
Moksleivis „perkando“ I. Niutono uždavinį
Naujas pirminių skaičių dėsningumas
Matematikos atgimimas Lietuvoje
Diagramos, pakeitusios pasaulį
Matematinė kalba ir simbolika
Golbacho teiginio įrodymas?
Nauji picos pjaustymo būdai
Skaičių simbolika Vedose
Matematika ir muzika
Topologija
Vartiklis