iPon Hírek

Hanghatásokat jósol meg az MIT új algoritmusa

Dátum | 2016. 06. 14.
Szerző | Jools
Csoport | EGYÉB

Ahhoz, hogy a robotok képesek legyenek irányítás nélkül boldogulni a világban, fel kell tudniuk mérni környezetüket, és képesnek kell lenniük arra, hogy megjósolják, egy bizonyos eseménysor milyen következményekkel járhat. Az emberek ezeket készségeket tárgyak tapintása, mozgatása, nézése és nem utolsó sorban hallgatása révén sajátítják el. Az MIT kutatóiban pontosan ennek kapcsán merült fel az, hogy talán a gépeket is meg lehet tanítani ezzel a módszerrel bizonyos események végkimenetelének megjóslására. A mesterséges intelligenciák kutatásával foglalkozó CSAIL labor munkatársai ezt meg is tették, majd látványosan tesztelték, az általuk fejlesztett algoritmust. A program képes volt arra, hogy néma videoklipekhez (amelyeken különböző objektumokat értek ütések) olyan hangokat hozzon létre, amelyek alkalmasak voltak az emberi hallgatók megtévesztésére is. Amikor végighúzzuk az ujjunkat egy borospohár peremén, a képződő hang magassága a folyadékmennyiségtől fog függeni, mondja Andrew Owens, a kutatás vezetője. A szakértő magyarázata szerint az algoritmus hasonló módon lehet használható arra, hogy a szimulált hang alapján megítélhető legyen egy-egy objektum alakja, anyaga és az azt ért mechanikai hatás jellege is.
A csapat gépi tanulással érte el célját, vagyis programjukat egy hatalmas adathalmazzal ismertették meg, amelyben a rendszer aztán maga igyekezett mintázatokat felfedezni. Ehhez durván 1000 videót és ezeken belül 46 ezer hanghatást tápláltak be a rendszerbe a kutatók. A felvételeket maguk készítették el, és ezeken különböző anyagú, formájú és nagyságú tárgyakat ütöttek, karcoltak és böködtek meg egy dobverővel. Az algoritmus elemezte, hogy az egyes események képkockákra bontott szakaszai során pontosan milyen hanghatás tapasztalható. Amikor a rendszer elkészült az elemzéssel, hasonló videókat mutattak meg neki, de ezúttal hangok nélkül. A hanghatás szimulálása az algoritmus feladata volt, amely ismét apró egységekre bontotta fel a látottakat, majd minden egyes szakaszhoz megkereste adatbázisában az arra akusztikailag a leginkább hasonlító szituációt, és a hangmintákból egy koherens hanghatást fűzött össze. A rendszer várakozásokon felüli minőségben szimulált olyan hangokat, mint például egy sziklán zajló dobpergés, vagy egy puha tárgy ütögetése.
A létrehozott hanghatások realisztikusságát egy online teszttel mérték fel a kutatók. Ennek során részben az eredeti hanggal, részben pedig a szimulált hanganyaggal láthattak a résztvevők különböző eseményeket, és azt kellett eldönteniük, hogy melyik a valódi hanghatás. Az eredmények a szakértőket is meglepték, az alanyok ugyanis nagy százalékban választották ki a szimulált hangot a valódi helyett, különösen az olyan esetekben, ahol „kevert” hangokat hallottak, például a kutatók a dobverővel leveleket vagy a puszta földet ütöttek, nem pedig fát vagy fémet. Az algoritmus a hangszimuláláson kívül arra is képessé vált a gépi tanulás eredményeként, hogy az ütés hangja alapján nagy biztonsággal megállapítsa az objektum egyes anyagi jellemzőit. A rendszer ugyanakkor még korántsem tökéletes. Ha a dobverő nagyon rendszertelenül mozgott a néma képeken, az algoritmus hajlamos volt ütéseket „hallucinálni” oda is, ahol ezek nem is történtek meg. A program ráadásul egyelőre csak a vizuális hatásra bekövetkező hangokkal bír el, vagyis csak azokkal, amelyek látható fizikai hatásra következnek be. A környezetben azonban rengeteg „láthatatlan” forrású hang is akad a szél zúgásától kezdve a laptop duruzsolásáig, amelyek szintén nagyban befolyásolják, hogyan mérjük fel környezetünket mondja Owens.
Új hozzászólás írásához előbb jelentkezz be!

Eddigi hozzászólások

9. ChoSimba
2016.06.14. 12:22
Némi szarkazmussal vegyítve mondanám, hogy brit tudósok
Tudom, nem britek és tulajdonképpen elég ügyes megoldás.
 
Válasz írásához előbb jelentkezz be!
8. Supra
2016.06.14. 12:58
Hát, egyébként simán lehet hogy jobb effekteket csinál, mint az eredeti alá kevernek - mert azok néha nagyon rettenetesek: csak nézek, hogy ez biztos ennek a filmnek a hangsávja?

Külön kedvenceim az autók: Minden autó, mindenhol csikorogva indul el, sárban, kavicson, porban, és alapjáraton, gázadás nélkül poroszkálva is.
 
Válasz írásához előbb jelentkezz be!
7. Renhoek
2016.06.14. 13:02
Ez baromi jó.... most én is pont ilyesmivel kezdtem el foglalkozni, Deep Learning és konvolúciós neurhálók. Főként ezeket képfeldolgozásra használják, arcfelismerés, objektumfelismerés - gépi látás. de engem most pont az érdekel, hogy ilyen hullámformákra hogyan lehet használni. Alvási orsók detektálására, vagy különféle agyból elvezetett jelek és mintázatok felismerésére.

A cél, hogy feltörjük az agy "kódját".
Mert ezeket kézzel kielemezni masszív brainfuck Hiába ültetsz elé egy diákot, van amikor szemre is nehéz észrevenni valamilyen jelenséget a "mátrixban", de egy gép meg automatikusan kivonhatja a lényeget az adathalmazból.
 
Válasz írásához előbb jelentkezz be!
6. Renhoek
2016.06.14. 13:04
és ez is Deep Learning:

"The team used techniques from the field of “deep learning,” which involves teaching computers to sift through huge amounts of data to find patterns on their own. Deep learning approaches are especially useful because they free computer scientists from having to hand-design algorithms and supervise their progress."

Kb ez most az AI és a gépi tanulás legfontosabb területe. Google és Elon Musk is nagyon ráfeküdt...
 
Válasz írásához előbb jelentkezz be!
5. ChoSimba Renho...
2016.06.14. 13:34
Pont a múltkor volt egy cikk, amiben egy primo CPU működését kellett volna értelmezni bárminemű belső funkcionális ismeret nélkül, csak az által, hogy kívülről figyelik, méregetik. Mondanom sem kell nem jutottak semmire és szerintem az agynál dettó ugyanez van.
A lényeg valószínűleg azokban a dolgokban rejtőzik, amiket szinte nem is detektálunk méréssel.
Nyilván nagy vonalakban meg tudták mondani, hogy adott rész sacc miben vesz részt, de az összefüggéseket nem látták.
És akkor még ott van az is, hogy a CPU-t emberek rakták össze világos matematika és logika mentén, az agyra ez nem feltétlenül igaz
 
Válasz írásához előbb jelentkezz be!
4. Renhoek ChoSi...
2016.06.14. 14:24
Persze még gyerekcipőben jár a dolog, de pl az élőállatos CA-imaging alapján szépen lassan haladunk alulról építkezve:

https://www.youtube.com/watch?v=FMFSH8JSDdA

Ilyen képet kaphatunk, ha egy egér éppen csinál valamit, és a lézermikroszkóp belelát a szövetbe Ca jeleket rögzítve - mi az aktivitást jól jelzi) Most indulnak be ezek a kísérletek igazán... és az a jó benne, hogy nem kell hozzá altatni sem az állatot (ami torzítja rendesen a dolgokat), se tűket szúrni a fejébe.

Kezd kiderülni, hogy pl a látókéreg nagyon nem úgy működik ahogy gondoltuk, hiszen óriási a belső világunk által generált mintázat. Ennek csak szinte elenyésző része külső hatás. Na ebből már lehet építkezni, csak egyre újabb dolgok derülnek ki, hogy a neuronok melyik része hogyan járul hozzá a "számításokhoz", a dendritfa pl. Viszont ezeket 3D-ben egyre nagyobb mélységben tudjuk már szkennelni az agyban.

A retina-LGN-Látókéreg egy fontos vizsgálati terült, mert a beadott képre egyből látod hogyan reagálnak a sejtek. Köv 10 évben sokminden kifog derülni... és ehhez kellenek ilyen automatikus tanulóhálózatok, amik megfejtik a kódot.

https://www.youtube.com/watch?v=ZHpDH061gT4

Ez pl egy agyszelet...de mi tudjuk az élő állat agyát is szkennelni. Pl amikor kajál, vagy futkározik.
 
Válasz írásához előbb jelentkezz be!
3. Renhoek
2016.06.14. 14:29
Ha érdekel még akkor itt van erről is szó: [LINK] - konkrétan élő tevékenykedő egérkéből. (...és nem is kell nyugatra menni, itthon is van 3 nagyon jól felszerelt lab, sőt a magyar "agyaknak" és mérnököknek hála, több élenjáró szabadalma is van ezen a téren egy cégnek.) Folyamatosan jelennek meg a Nature-ben is cikkek erről.
 
Válasz írásához előbb jelentkezz be!
2. Asagrim ChoSi...
2016.06.14. 16:08
Az a cikk csak azt bizonyította, hogy nem lehet egy faék szintjén levő mikroprocesszorra alkalmazni az agykutatás módszertanát. Biztos vagyok benne, hogy például az állatenyészésre sem.
 
Válasz írásához előbb jelentkezz be!
1. Renhoek Asagr...
2016.06.14. 19:21
Meg egy procin lehet méregetni egyes pontokat, de mint itt a 2-foton mikroszkóp, vagy nagyobb léptékben az fMRI gondolom nem volt. Sőt most pár éve robbanásszerűen kezdték használni az optogenetikai vírussal való jelölést, teljes pályákra, vagy ki-bekapcsolhatóvá tehető részeket létrehozva. (Ezzel élő kísérletben tesztelhető mit csinál az adott hálózat)

Szerintem a neurobiológia kb az utóbbi pár évben jutott el oda, hogy megjelentek ezek a teljesen új technológiák, 2-foton, optogenetika, fejlett fMRI, hálózatos MRI, amikkel megfejthető lesz az agy. Ehhez még hozzávesszük a nagyléptékű szimulációkat és modellezést... Az eszközök most kezdenek kiforrottá válni. 5-10 év alatt nagyságrendekkel nőtt (Akár 10^6 is) az imaging sebessége, területe.. 2p esetén pl. Ehhez képest egy elektróda, amit az utóbbi pár évtizedben használtak. Néhány sejt tüzel a környékén, nagyon jó időbeli felbontással, de az egészről alig ad képet.

A munka kb most kezdődik.
 
Válasz írásához előbb jelentkezz be!