A Chilei Egyetem és Johns Hopkins (USA) kutatói kimutatták, hogy az elhízás elterjedését meg lehet jósolni gépi tanulási technikák alkalmazásával az egyes országok élelmiszer-vásárlási adataira.

Megjósolhatom az elhízás elterjedtségét kizárólag az élelmiszerek értékesítésén alapulva? "Ezt a kérdést tette fel magának a Chilei Egyetem és Johns Hopkins (USA) kutatócsoportja, mielőtt megkezdte legújabb tanulmányát." A válasz igen ", mondja. És nemcsak ez lehetséges: ráadásul a Dunstan és csapata által kidolgozott módszer az országok hosszú listájához is alkalmazkodik.

hogyan

Ezek a jóslatok nem kis teljesítmény. Egyrészt segítenek közvetlen kapcsolatot kialakítani azok között az élelmiszerek között, amelyek a legnagyobb pusztítást okozzák, amikor a kosárba kerülnek. Másrészt lehetővé teszik az elhízás prevalenciájának megállapítását azokban az időszakokban, amelyek elválasztják az egyik egészségügyi felmérést a másiktól, és lehetővé teszik az előrejelzések elkészítését anélkül, hogy megvárnák ugyanezen felmérések befejezését. És mindez egy olyan bolygón, amely az 1980-as 857 millió túlsúlyos lakosról alig három évtizeddel később elérte a 2,1 milliárdot.

Hogyan működik ez a kristálygömb? 48 ország élelmiszer- és italkategóriájának 79 ország vásárlási adataival és egy kis gépi tanulással. "Amit tettünk, különféle algoritmusokat teszteltünk ebben a gyakorlatban, hogy megpróbáljuk megjósolni az elhízott népesség arányát. És azt találtuk, hogy ezen országok 47-ben 10% -nál kevesebb hibával volt lehetséges.".

A Dunstan által tanulmányozott, az Euromonitorból kivont élelmiszer-vásárlásokban minden belefér: csokoládé, joghurt, tojás, hús, gyümölcslé, kávé, gabonafélék. De nem az adatok tengeréről beszélünk, amelyhez az idők hozzászoktak. "Ez nem olyan nagy adatbázis. Egyáltalán nem nagy adat. Kicsi. De még így is ki lehet szorítani" - mondja a kutató.

  • Minimalista algoritmusok

Valójában az erre az előrejelzésre kiképzett algoritmusok egyike felajánlotta az elhízás előfordulása szempontjából legmeghatározóbb változók listáját is. E kis rangsor szerint sütemények, lisztek, sajtok és szénsavas italok a legfontosabb kártyák a túlsúlyos tarotban. Ha az algoritmust ennek a háromnak a vásárlási adataira alkalmazzuk, akkor még a hibahatár enyhe csökkentése is lehetséges.

Kiderült, hogy a gépi tanulásban a kevesebb is több. "Ezt nevezzük dimenziósságcsökkentésnek vagy változócsökkentésnek. Az ötlet" mindezt megadva, melyek azok a változók, amelyek a legjobban magyarázzák az adataim változékonyságát ". A csökkentésről szól" - magyarázza Dunstan. Ennek a szintézisnek a hasznossága túlmutat azon, hogy megtakarítson bennünket abban, hogy a legyeket ágyúlövésekkel végezzük: ha tudjuk, hogy egy felmérés mely kérdései a legmeghatározóbbak, akkor lerövidíthetjük a kérdőíveket és enyhíthetjük a száz összeállított kérdés elsöprő taszító hatását.

Továbbá ebben a fő változók listájában az országok étrendjét mutatjuk be. "Ott láthatja, hogy Németország és Hollandia sokat osztozik. Kelet-Európa összes országa olyan, mint egy nagy felhő, Spanyolország nagyon közel van Portugáliához. Az egyik észreveszi az országok történelmi és földrajzi hatását" - mondja Dunstan.

  • Jó gyakorlatok

A replikálható és könnyen újrafelhasználható eredmények biztosítására irányuló erőfeszítések állandóak Dunstan és munkatársai kutatási módszertanában. Egyrészt a három alkalmazott algoritmus biztosítja, hogy a kapott eredmények ne legyenek délibáb. Másrészt közzéteszik a képzéshez kifejlesztett összes kódot és az előrejelzéseket. "Arra törekedtek, hogy minél több gépi tanulást juttassanak el a közegészségügybe, ahol ez még nem annyira elterjedt, és ezeket az eszközöket eljuttassuk minden kutatóhoz, aki el akarja kezdeni annak használatát" - magyarázza Dunstan.

Ennek a kutatásnak az esete példázza azokat a változásokat, amelyeket a tudományos termelés a gépi tanulással és a mesterséges intelligenciával kapcsolatos teljes fellendülésű publikációkban tapasztal, és ebből adódó aggályokat a vizsgálatok eredményeinek igazolásának nehézségei miatt. "Egyre szabályozottabbá válik. Amikor elhagytam az Egyesült Államokat, emlékszem, hogy a csoport közzétett egy cikket, ahol egy módszert, egy algoritmust használtak. A munka kevésbé szigorú volt".

Most a bevett címsorokban történő közzététel feladata annak bemutatása, hogy a lehető legjobb tanulmány készül. "Amikor elküldtük ezt a papírt a magazinnak, elkezdtek további dolgokat kérni tőlünk" - magyarázza Dunstan. "Már egyre nehezebb közzétenni, ha nem tartja be a gépi tanulás jó gyakorlatának bizonyos szabályait".

Kutatói tevékenységének tapasztalatai alapján, amelyet most a Chilei Egyetem Műszaki és Orvostudományi Karán osztogat, Dunstan bizonyos egyenlőtlenségeket észlel az ügyben. "Olyan területeken, mint a mérnöki tudomány, a matematika, a fizika, már régóta dolgoznak így. De másokban, például a társadalomtudományokban vagy az orvostudományban ez egy kicsit újabb. Azt hiszem, ezen az úton járunk. Minden alkalommal, amikor jobban kell tennie ".