Örülünk, Vincent?

Kazahsztán felett száll a dal...

Troll proximity


Orbanisztán Infochart

P/c szerint a világ

  • Hibás feed URL.

Rovataink

Viccországban Gengszterkrónikák Gasztrowhat Focitörténelem Borzalmasvers Hülyeország Színház A nap idézete Zene-bona


nem felejtünk.jpg

Jobban teljesít...


Orbán Pinocchio thumb.jpg

FRISSÍTVE!

Itt az újabb történelmi csúcs

A központi költségvetés bruttó adóssága: 2010. május: 19.933,4 Mrd Ft; 2011. május: 21.116,5 Mrd Ft; 2012. május: 21.180,9 Mrd Ft; 2013. május: 21.765,4 Mrd Ft; 2014. október 24.736 Mrd Ft;2015. június 6. 24 847 Mrd F

 

Szűjjé má'!
tumblr_nzd85jlxqr1qd6fjmo1_1280.jpg

 

Híres utolsó szavak

 




 

Te már bekövetted?

 

Vincent tumblr Falus.JPG

 


 

Vincenzúra

Troll Vincent.jpg

Figyelem! A Vincent szerzői — főszabályként — maguk moderálják a posztjaikra érkező hozzászólásokat. Panaszaitokkal vagy a mellékhatásokkal a poszt írójához forduljatok!

Köszönettel: Vincent Anomália

Címkék

abszurd (39) áder (5) adózás (11) alkotmány (45) alkotmánybíróság (10) államosítás (7) arcképcsarnok (14) ascher café (24) a létezés magyar minősége (6) bajnai (16) bank (7) bayer (23) bayerzsolt (14) békemenet (7) bkv (7) bloglossza (14) borzalmasvers (156) cigány (7) civilek (5) civil társadalom (8) demokrácia (24) deutsch tamás (6) devizahitelek (9) dogfüggő (10) egyház (10) ellenzék (7) erkölcs (17) érték (19) Érvsebész (11) eu (13) eu elnökség (8) felsőoktatás (15) fidesz (76) fideszdemokrácia (7) film (12) filozófia (13) foci (12) focijós (19) focikvíz (54) focitörténelem (94) fritztamás (6) gasztrowhat (9) gavallérjános (10) gazdaság (8) gengszterkrónikák (14) gyurcsány (27) hangfal (98) heti válasz (19) hétköznapi történetek (32) hétvége (44) hoax (5) hülyék nyelve (16) hülyeország (165) idézet (768) igazságszolgáltatás (6) imf (26) indulatposzt (11) interjú (7) járai (12) jobbik (17) jogállamiság (33) kampány (12) kampányszemle (9) katasztrófa (5) katonalászló (21) kdnp (9) kétharmad (16) költségvetés (21) könyvszemle (9) konzervatív (18) kormányváltás (22) kormányzás (42) kósa (8) kövér (11) kultúra (21) kumin (14) lánczi (5) lázár jános (12) levelező tagozat (12) lmp (8) magánnyugdíj (25) mandiner (15) március 15 (8) matematika (9) matolcsy (44) mdf (5) média (48) melegek (8) mesterházy (7) mnb (5) mosonyigyörgy (7) mszp (32) mta (5) napitahó (7) navracsics (14) nedudgi (15) nekrológ (11) nemigazország (5) nemzeti együttműködés (5) ner (11) nyugdíj (5) oktatás (12) önkormányzatok (6) orbán (46) orbanisztán (15) orbánizmus (101) orbánviktor (65) országgyűlés (6) pártállam (23) politika (14) polt (5) program (9) retró (22) retro (115) rettegünk vincent (14) rogán (9) sajtó (22) sajtószemle (6) schmitt (38) selmeczi (8) semjén (6) simicska (7) sólyom (7) spoof (19) stumpf (5) szász (6) századvég (7) szdsz (9) szijjártó (16) színház (35) szlovákia (5) szszp (5) tarlós (12) társadalom (50) törökgábor modul (8) történelem (5) tudjukkik (22) tudomány (17) tüntetés (17) ügyészség (9) választás (37) vb2010 (19) vendégposzt (68) videó (11) vincent (10) voks10 (7) vörösiszap (16) zene (23) Címkefelhő

Szélhámosság-e a hálózatelmélet?

2018.02.18. 11:07 | jotunder | 96 komment

 

       Nem, nem hiszem, hogy a hálózatelmélet szélhámosság, de úgy gondolom, hogy itt lenne az ideje annak, hogy a tudományos közösség komolyabban kezd foglalkozni a hálózatelmélettel kapcsolatos kijelentésekkel.

       Egy Aaron Clauset nevű kutató (tulajdonképpen maga is hálózatelmélész) és Ph.D  diákja Anna Broido  feltett egy cikket az arXiv-ra (ez a világ legnagyobb preprintszervere). A cikkben egy nagyjából ezer adathalmazt vizsgáltak meg, amelyekben különböző hálózatok (biológiai, szociális, technológiai) vannak leírva. Alapvető megállapításuk az, hogy ezen hálózatok töredéke, összesen 4 százaléka az, amire jó szívvel azt lehet mondani, hogy nagyjából skálafüggetlenek. Annak ellenére van ez így, hogy minden idők egyik legidézettebb dolgozatában Barabási és munkatársai azt állították, hogy a hálózatok nagy hányada skálafüggetlen. 

      A cikkről beszámolt a Quanta Magazin is, és ennek kapcsán kisebb vita alakult ki a Twitteren Barabási-Albert László és Aaron Clauset között. Egészen világosan látszik, hogy a hálózatelmélet alapító atyái közült hárman: Mark Newman,  Steve Strogatz és Duncan Watts támogatják Clauset-t. (Newmannak van egy sokat idézett közös cikke Clauset-val, amelynek a témája hasonló a Broido-Clauset cikkhez). Alessandro Vespignaniról azt mondanám, hogy elemében van....

      Megpróbálom összefoglalni a kételyeimet a hálózatelmélettel és különösen a skálafüggetlenség definíciójával kapcsolatban. 

       1. A skálafüggetlenség definíciója tisztázatlan, de alapvetően a fokszám  approximatív "power-law" eloszlását jelenti. Ugyanakkor van bizonyos kísértés arra, hogy minden "heavy-tail " fokszám eloszlású rendszert skálafüggetlennek nevezzenek.  Abban is van némi igazság, hogy egy log-log diagramon aránylag sok heavy-tail eloszlás látszhat power-lawnak, különösen ha kicsit segítünk is neki. A lényeg az, hogy a fokszám-eloszlás szinte semmit sem mond egy gráfcsalád szerkezetéről. Egy Ito nevű japán számítógéptudós olyan totálisan skálafüggetlen hálózatokat konstruált és vizsgált meg, amelyek hipervégesek. Ez azt jelenti, hogy olyan messze vannak elemi tulajdonságaikban az erősen expandáló skálafüggetlen modellektől, amilyen messze csak lehetnek. Az ég és föld kategóriakülönbségről van szó. 

        2.  Nagyon gyakran, amikor skála-független hálózatokról beszélnek, akkor valójában egy konkrét power-law családra a preferential-attachment hálózatokra gondolnak. Szó szerint azt történik, hogy a konkrét, egyszerűen generálható PA-hálózatra néznek, és közben nagyívű fejtegetéseket tesznek közzé skála-független hálózatokról, mintha a PA-nak valamiféle különös helyzete lenne a skála-független családban, és hát nincs neki. Az az igazság, hogy a PA nagyon könnyen vizsgálható, és érdekes tulajdonságokkal rendelkező hálózatcsalád. Azt sejtetik, hogy az összes hálózat a PA-hoz hasonló egyszerű metódussal jött létre. Ezt nem mondják ki, de sejtetik. Sőt,  valójában ez a legfontosabb üzenete a Barabási-féle hálózatelméletnek. 

        3.   A hálózatelmélet legklasszikusabb ígérete az volt, hogy az Internet skála-független. Ezzel szemben az Internet NEM skála-független.  Pont. Mint azt Clauset-tól tudjuk az Internet ebben nincs egyedül. Nagyon nincs. Itt szeretném hozzátenni, hogy az elmúlt évtizedekben mindig volt egy hype a tudományos világban, és ezek a hype-ok egymásra épültek. Közvetlenül a katasztrófaelmélet bebukása után jöttek a fraktálok (Mandelbrot) majd a self-organizing criticality (Per Bak) és aztán skálafüggetlen hálózatok elmélete, ami jelen volt a Mandelbrot- és Bak- féle nyelvben is. 

       4.   A hálózatelméletet nagyrészt fizikusok alapozták meg, akik egy szép, világos, egységes elméletet kerestek. A fizikusoknak ez a foglalkozásuk, szép, világos, egységes elmélet keresése. És amikor VAN egy szép, világos és egységes elmélet, akkor igen gyakran meg szokták találni. A relativitáselmélet egyszerűsége és pontossága szinte felfoghatatlan.  A fizika félelmetes dolgokra tudja használni a matematikát.  Minden arra mutat, hogy a matematika alkalmazhatóságának erős határai vannak a hálózatelméletben. Legalábbis a szép, világos, egységes keretek között. 

       5.  Clauset és társai nem csak arra mutattak rá, hogy a valóságos hálózatok nem igazán skálafüggetlenek, hanem arra, hogy a hálózatoknak nincs egységes tudománya, legalábbis ma még nincs, és azok a módszerek, amelyekkel valódi tudást nyerhetünk ezekről a hálózatokról statisztikai jellegűek. Mégpedig a "tűrjük fel az inget és essünk neki egy excel file tisztításának" szintű hardcore statisztikai módszerek alkalmazásáról van szó. Ezek komoly dolgok, nagyon komoly dolgok, évekig készítenek fel rá embereket, de tiszta matematikai szempontból sokkal kevésbé vonzóak, mint egy két perc alatt leírható modell, amiről klasszikus kombinatorikai és valszám módszerekkel gyönyörű dolgokat lehet bebizonyítani, akár van közük a valósághoz, akár nem, és ugye kit érdekel a valóság. 

    A Clauset-Barabási féle twitter beszélgetésben Barabási olyan módszereket használt, hogy Gulyás Gergely megirigyelné (Barabási azért ezerszer okosabb, mint Gulyás Gergely, és itt hozzá kell tennem, hogy Barabási-Albert László példamutató módon viselkedett CEU-ügyben, nem gyávult be,az biztos, a tanítványai imádják, szóval emberileg nem olyan egyszerű ez az egész).  Ez bizony egy sajátos válsághelyzet. Majdnem azt mondtam, hogy paradigmaváltásnak nézünk elébe, de én ilyet nem szoktam mondani. Az biztos, hogy eljött az ideje a komoly beszédnek a hálózatelmélettel kapcsolatban.  

 

A bejegyzés trackback címe:

https://orulunkvincent.blog.hu/api/trackback/id/tr9513678304

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Gattamelata lovasszobra 2 2018.02.18. 11:43:45

A twitteres eseményekre kérhetünk linket? Nem találom.

fortin2 2018.02.18. 12:06:26

@poszt: Paradigmaváltás, honnan? A matematikusok már korábban is eléggé kritizálták, most nem tudom megkeresni, de kb 2009-ben Willinger és még tsai jelentettek meg cikket a skálafüggetlen interenet mítoszáról (nyilván leginkább csak ezt a részt értettem belőle valamelyest), aztán 2011-ben Christakisék még határozottabn kritizálták stb., az előrejezethetőségről szóló dolgai Barabásinak pedig már leginkább csak mosolyt keltettek a társadalomtudományokban – márpedig ezek tíz évvel se voltak a Nagy Hálózetelméleti Paradigma kezdeti után, vagyis hol is volt itt a megszilárdult paradigma?
Nem inkább arról van szó, hogy egy erős heurisztikával bíró szemléleti eszköz (hálózatelmélet) egy amúgy kiváló és nagyon rendes ember (Barabási) vezérletével sok érdekes és hasznos belátáshoz vezetett, aztán megpróbált túlterjeszkedni a lehetséges hatókörén és paradigmává válni, de az már nem ment, például azért sem, mert az alapállításai is itt-ott problémásak?
Ha a paradigma terminust az eredeti értelmében használjuk akkor sztem itt nem használható, akkor inkább Lakatos versengő projektjei jobban illenek ide, de méginkább lehetne egy nagyon erős metafórának tekinteni a hálózatelméletet, ami sok jó dologhoz vezet el.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 12:45:49

@fortin2: valójában többféle hálózatelmélet van, én a skála-függetlenségre alapozott hálózatelméletről beszélek. nem tudom mi az érdekes dolog, aminek a belátásához vezetett. ez egy ígéret. a megszilárdult paradigma az egyszerűen az volt, hogy a hálózatok skála-független jellegűek. a social networkok esetében emellett igen erős érvek is lehetnek, hiszen voltak bizonyos argumentumok amelyek miatt valóban erre lehetett következtetni. mondjuk a Facebook belépési hálózatáról gondolhatja az ember, hogy valamilyen PA mechanizmus van mögötte. de úgy tűnik a probléma magával az adatok kezelésével van. nem egyszerű megvizsgálni a hálózatokat, zajos és koszos az egész, lásd Clauset cikkét. fogalmam nincs, hogy mi maradna ebből az egészből, ha rendet vágnának benne. nem tudom kizárni, hogy valami értékes is nőhetne belőle, egyáltalán nem.

én most egy kicsit belefolytam ebbe a múlt héten egy workshopon, persze igyekeztem viselkedni, mert azért nem kell senkivel sem összeveszni. mondjuk úgy, elég kontroverzális ügyek vannak az "alkalmazzunk hardcore matematikát nagyon bonyolult hálózatokra" tematikában és hát nem Barabási van az élen a kontroverzalitásban.... nem tudom,
hol végződik az igazi tudomány és hol kezdődik a hype.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 12:50:54

@fortin2: az internet skálafüggetlenségét a három Faloutsos testvér állította egy teljesen fals mérés alapján. ez a szerzők legidézettebb cikke, valamennyivel többen idézték mint a teljes magyar társadalomtudományt az elmúlt öt évben (lehet, hogy ez nem igaz, de nem lehet nagyon távol az igazságtól). egy teljesen fals állításról van szó, és nem a Doyle et. al. vette észre, ők csak írtak erről. a mai napig azzal reklámozzák a skálafüggetlenséget, hogy az Internet meg az Ezmegaz skálafüggetlen. és egyik sem az. az Internet nagyon nem az.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 12:51:10

@jotunder: amennyire én látom a társadalomtudományokban a Barabási féle skálafüggetlenséget jobbára valóban a PA értelmében használják. A citációs hálózatokra például szerintem eléggé jól alkalmazható, legalább 1965 óta minden empirikus kutatás is alátámasztani látszik.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 13:02:54

@harmadikszem: 1. ez nem igaz. már a 2007-es Clauset-Shalizi-Newman cikkben elmondták, hogy nem találtak erre bizonyítékot. 2. olyan nincs, hogy valaki PA-t "alkalmaz" egy valódi hálózatra. nincs is értelme. a citációs hálózat teljesen nyilvánvalóan nem hasonlíthat egy PA gráfra és ezt senki nem is állítja. a PA gráfok egyetlen tulajdonságára hasonlíthatna és az a skála-függetlenség. 3. még csak nem is ez a főirány ma a "hogyan csináljunk citation science-t" projektben.

Bogomil 2018.02.18. 14:01:23

Én csak azt nem értem, hogy mit jelentene, ha legalább egy bizonyos területen egy bizonyos közelítésben megállapítanánk, hogy a "valóságos" hálózatok skálafüggetlenek (azaz hatványeloszlást követnek a fokszámaik - nemcsak jótündér, hanem Barabási is ezt a definíciót használja már). Mi következne ebből? Mi érdekeset tudunk a skálafüggetlen gráfokról matematikailag?
Csak mellékesen: szerintem erre a posztra nem várható olyan sok hozzászólás, még akkor sem, ha kikerül az Index kezdőlapra...:-)

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 14:08:50

@Bogomil: pusztán a power-lawból semmi sem következik a gráfra nézvést. (itt nemcsak a power-lawról van szó, hanem arról is, hogy 2 és 3 közé esik a "power"). egymástól alapvetően különböző gráfoknak lehet hasonló fokszám eloszlása.

Bogomil 2018.02.18. 14:12:19

@jotunder: Akkor viszont azzal kellene foglalkozni, hogy leírják, milyen típusai vannak a power-lawnak eleget tévő gráfoknak, nem azt keresgélni, hogy hol vannak azoknak megfelelő "valós" hálózatok. Pl. ilyesmire számítanék: minden power-law gráf PA-val jön létre néhány kiinduló gráftípusból, stb. (Mintha amikor először olvastam valamit a témáról, Barabásiék kacérkodtak is ilyesmivel.) De nem látok mostanság ilyesféle - érdekes - tételeket.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 14:16:58

@Bogomil: annak nincs értelme. egyszerűen minden lehetséges. bárki kézzel tud mindenféle faramuci power-law gráfokat csinálni. bármilyen önhasonlóság ilyesmihez vezet. éppen az nem triviális (Barabásiék csak beszéltek róla, de nem bizonyították be, Spencer, Tusnady, Bollobás, Riordan bizonyították), hogy a PA valóban power-law eloszlású.

incze 2018.02.18. 14:56:01

érzésem szerint népszerűsíthető tudomány, több területen is a közmunkás kutató fantáziáját is megmozgató absztakció nemigen létezik egy kő egyszerű "minél nagyobb ez, annál nagyobb az" összefüggés nélkül. ezért a "pa" szerintem is a barabási jelenség mozgató rugója, és egy darabig még marad is, mert szerkezetileg alkalmas erre, olyan mint a newton törvény: kurva egyszerű és nagyon univerzális.

és a fizikusok (is) máshol is kitűnően elvannak azzal, hogy az átfogó, univerzális összefüggés absztrakt entitások közt áll fenn, a mérések értékelése ott sem egyszerű (lásd pl. a fénysebességnél gyorsabb neutrinók esetét, ahol évekbe tellett megtalálni a mérőeszköz hibáját, egyetlen mérés előkészítése kurva drága, sok idő, ember, eszköz, az értékelése egy elég nagy teória, és ott egy viszonylag nagy számítógépes programrendszer is - nautil.us/issue/24/error/the-data-that-threatened-to-break-physics ).

balmoral 2018.02.18. 16:26:25

Akkor most bojkott, vagy nem bojkott?

Online Távmunkás · http://onlinetavmunka.blog.hu 2018.02.18. 16:44:32

A tudománynak mindig van néhány olyan határterülete, ahol a hatalmas hype miatt gyenge lábakon álló elméletek terjednek, amiket később cáfolni fognak...

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 16:50:22

@jotunder: a 2007-es cikk moderate supportról beszél a citációs hálózatokra mérve, ami egy egyébként eléggé kritikus cikk esetében nem egyenlő azzal, hogy nem találták bizonyítékát. Az új Barabási könyvben van sok más példa is, ami ennél erősebbet már, egyébként diszciplína függvénye is. A Price féle kutatások azt mutatták a hatvanas évek óta hogy a magas idézettségű szerzők száma sokkal lassabban nő, mint az egyébként közel exponenciálisan növő keveset citált szerzők száma, és ugyanez a különbség van a magas impakt faktoros (mondjuk SCI, SSCI Q1 indexált) illetve az "egyéb" folyóiratok száma között. Ez lefordítva az empíria nyelvére azt jelenti hogy a citációs univerzumba lépők sokkal nagyobb eséllyel fognak eleve sokat citált szerzőket citálni (és a a citációs Network ezen részéhez kapcsolódni), mint más, keveset citált (periferikus) szerzőket. Ugyanígy, a friss belépők (a hálózat igazán gyorsan szaporodó szögpontjai) elsősorban erős lapokra fognak hivatkozni és nem a frissekre. Szerintem ez egy matematikus számára sarlatánságnak tűnő módon, de mégis reálisan írja le azt, amiről egy absztrakt szinten a PA szól, és a saját kutatásaim például kivétel nélkül alátámasztják ezt a jelenséget. Természetesen ennek vajmi kevéssé vannak matematikai okai, sokkal inkább egynéhány tudományszociológiai törvényszerűség irányítja a folyamatokat.

mafi mushkila 2018.02.18. 17:15:17

@balmoral: Ez valami focis téma, nem? Háló meg ilyenek. Akkor bojkott.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 17:30:37

@harmadikszem:

a PA egy random modell. ugyan miert gondoljuk azt, hogy pusztan a korabbi idezettseg vezerli a tovabbi idezettseget egy szuk tudomanyteruleten, es nem egy adott eredmenynek az eddigiektol teljesen fuggetlen RELEVANCIAJA. ha PA jellegu lenne a citacios graf (es nagyon nem az), akkor a minoseg egy random dolog lenne. ugyanis azt gondoljuk, azt kell gondolnunk, hogy a citaciok szama valamilyen kivulrol nehezen megfogalmazhato, de azert koherens minoseg fogalommal korrelal.

de ennel van kellemetlenebb hirem....

mit jelent az, hogy "exponencialisan novo keveset citalt szerzok"? eleve ilyet nem mondhatsz. az elso felteltel ugyanis az, hogyha Q(n,k) jeloli azon szerzok szamat, akiket az n-edik belepo szerzo idejen k-szor ideztek, akkor Q(n,k)/n konvergalni fog egy szamhoz, de legalabbis egy adott L(k) szam tizszerese es tizede kozott fog lebegni. az "exponencialisan novo keveset citalt szerzo " azt jelenti, hogy ez a L(k) hatarertek exponencialisan cseng le. ertsd nincs heavy-tail!!!! a skala-fuggetlenseg eppen annak a FINOMITASA, hogy VAN heavy-tail ( a citacioknal esetleg tenyleg van, de meg azt sem olyan konnyu kis korpuszoknal biztonsaggal kijelenteni, ez a Clauset cikk vegebol is kiderul)

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 17:47:04

azt gondolom, hogy azt gondolod, hogy Barabási azt gondolja, hogy itt a network egy inherens és determinált tulajdonságáról van szó, amely nem is térhet el a PL-tól. Attól tartok ebben lehet valami, de szerintem Barabásinál ez egy tudománypolitikai húzás, sokkal eladhatóbba Network science ha úgy interpretáljuk, hogy ontológiailag van egy ilyen tulajdonsága a valódi Networköknek, és nincs mit tenni.

A tudománymetriában és különösen a tudományszociológiában viszont nem gondoljuk így, inkább arról van szó, hogy mindenféle nem-inherens tulajdonságok teszik a networköt olyanná, hogy többé-kevésbé adekvát rá az a minta amit a PA esetében látunk. Ezért írtam fent, hogy én azt hiszem tudományszociológiai tények teszik ilyenné a sci cit networköket, nem valamiféle meghatározott és módosíthatatlan absztrakt inherens feature.

Ezek közül a tudományszociológiai tények közül _egyik_ a minőség, valóban. De korántsem az egyetlen. Elég erős korrelációk vannak az affiliációval, az editorial board összetételével, a folyóirat citációs univerzumával stb, amire lehet anticipálni, és szoktak is. Ha igazad lenne, és a citációs érték egy az egyben megfelelne a minőségnek, akkor például ennek a posztodnak a tárgya is értelmetlen lenne, hiszen Barabási ma a világ egyik (ha nem A) legtöbbet citált szerzője, ezért a legjobb minőségű szerző is, tehát vele kapcsolatban a szélhámosság gyanúja fel sem merülhet(ne).

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 19:23:54

@harmadikszem: Barabasi relevans es kanonizalt szerzo. Fontosnak tuno, vagy fontosnak hitt dolgokrol beszel. Nem veletlenul lett o a Barabasi, nem egy szerencses ember egy preferential attachmentben.... Nem allitom, hogy kizarolag a minoseggel korrelal a magas idezettseg, de valamifele kanonizacioval egeszen biztosan korrelal, nem arrol van szo, hogy egy random processben o lett a lucky man.

megegyszer. megmertek a citacios networkoket es nem igazan skala-fuggetlenek, akkor ugye a kozeleben nem lehetnek a preferential attachmentnek. arrol van szo, hogy par evtizede, egyszeruen fogtak egy log-log diagramot es ranezesre azt mondtak, hogy ez olyan egyenes fele, tehat powerlaw. es hat amikor komolyabban elkezdtek merni, kiderult, hogy valojaban a log-normal jobban irja le neha, mint a powerlaw.

olyat, hogy a citacios network PA nem lehet mondani, nem is mondanak, es mostmar olyat sem mondanak, hogy scale-free.
az, hogy copy-paste-oljak az idezeteket teljesen megvaltoztat mindent, meg inkabb atalakitja a rendszert, ezt most kezdtek el kutatni, uj indexeket akarnak epiteni, amelyik probalja kizarni a copy-paste-ot. en nem hiszek a citation science-ban, de ha valakinek ez bejon, hat csinalja. csak csinalja jol.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 19:43:39

@jotunder: szerintem nagyon érdekes terület, minél többet foglalkozik vele az ember annál inkább az. És szvsz annál távolabb kerül attól, hogy matematikailag leírható legyen. Nem lehet nem foglalkozni vele, hiszen ez alapján osztják az állásokat meg a granteket (nagy részben) tehát ez kivételesen egy olyan terület aminek hatása van az egész tudományra és ezen keresztül a társadalomra.

A kanonizációval egészen biztosan korrelál ezt senki nem vitatta tudtommal soha; azt azonban igen, hogy a kanonizáció bármiféle mérhető értelemben a minőséggel korrelálna. Ez hit kérdése, én nagyon erősen hiszek benne, hogy korrelál, de ezt nem lehet bizonyítani tekintettel arra hogy a minőséget igen sok helyen kénytelenek a citációs impakt alapján definiálni, és akkor ugye ez esetben ez egy tautológia.

Végül, ez megint csak területfüggő, szerintem a matematikában legalábbis a matematikusok meg tudják ítélni egy-egy cikk jelentőségét (nem a felfedezés hasznosultságát mondom, hanem pusztán matematikai szempontból vett jelentőségét). Ez minél távolabb megyünk az egzakt tudományoktól annál kevésbé megtehető. Szerintem a Derek Price például egy olyan dolgot kezdett el baszogatni aminek van valódi jelentősége. És nem tartom ilyennek például a Niklas Luhmann-t. Na mármost mindkettő erősen kanonizált, a Luhmann talán még jobban, és Európában nem tudsz elvégezni egy társadalomtudományi programot anélkül, hogy ne foglalkoznál vele, akkor pedig bizony a nebulók egy része szükségszerűen rá fog harapni, idézni fogja stb. És ez csak egy dinamika a sok közül.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 19:51:57

@jotunder: + kis kiegészítés, nem igaz, hogy senki nem mondja a citációs networkokre hogy skálafüggetlenek. Barabási például most is azt mondja. A Network Science című 2016-os könyvében az y fokszámkitevőt 2.79-re számolja a CN-re, a skálafüggetlenség esetében ez az érték 2<y<3 tehát skálafüggetlennek mondja. Direkt utánanéztem hogy jól emlékeztem e.

Ha azóta revideálta ezt akkor persze tárgytalan, csak ez azért egy elég friss könyv, ráadásul ebből tanítják a Network science-t az egész világon.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 20:24:20

@harmadikszem: nem, nem a Barabasi konyvebol tanitjak. sot, van olyan network science kurzus, ahol a Barabasi nevet nem is emlitik meg. ami talan nem egeszen helyes, de azert elofordul. Barabasi mindenrol azt mondja, hogy skalafuggetlen, most is kekeckedett Clauzet-val, de lathatoan ezt a partit el fogja vesziteni. errol szol a posztom.

nem arrol van szo, hogy Barabasi egy kokler, csak arrol, hogy szeret eroseket mondani a halozatelmeletrol.

a Barabasi konyvenek 5.4 es 5.5 fejezete mondja el, hogy miert skala-fuggetlen az altala Barabasi-Albert modelnek ( itt az Albert a Reka, de az biztos, hogy ezt joval Barabasi elott mar ismertek) nevezett PA model. egy matematikus szamara ez, mondjuk ugy... nem annyira meggyozo argumentum. vannak, akik ennel valamivel csunyabban fogalmaznak. Az 5.29-es formula log(n)-nel volt eredetileg publikalva, es mondjuk fizikusi-mernoki ertelemben tokmindegy.

barabasi.com/networksciencebook/chapter/5#degree-dynamics

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 20:26:19

@harmadikszem: ha tudnad, hogy egy 2.79-nek mennyire nincs ertelme ezeknel a korpuszoknal. 2.5 es 3 kozott nagyjabol minden ertek kijon, persze osszevissza kell tisztogatni az excel file-okat, es statisztikai modszerekkel sirnak ki egy erteket. errol mondja Clauset (es mar eleg regen), hogy ezt nem kellene eroltetni.

jotunder · http://orulunkvincent.blog.hu 2018.02.18. 20:34:31

@harmadikszem: erdemes megnezni a konyvben a 9.2 reszben azt, amikor elmagyarazza, hogy mi az az NP-complete. amikor megmutattak alig hittem a szememnek. naaaa... ilyet nem irunk le egy tankonyvben.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 20:35:11

@jotunder: nem a kurzusokat mondom hanem a PhD programokat és ott a Northeastern-en és a CEu-n is a Barabási könyvét használják. egyébként 2016-ban feltette a ppt-ket is amiket használ, de aztán levette (kicsit későn mert aki akarta az addigra már letöltötte, hehe).

Megnéztem a cikket amit idéztél meg az erről szóló újságcikket a vitáról és a twitteren is jól szórakoztam. Azt gondolom ez nincs lejátszva, messze még a vége, de jó hype volt a 2018-as netsci konferenciának az biztos. Ahhoz képest olvasni a twitter vitát, hogy mikről szoktak vitatkozni átlag magyar tanszékeken, azért sírhatnékom támad.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 20:41:06

@jotunder: NP-teljesség :D :D :D oké, de szövegdobozban van, remélem ez enyhítő körülmény!

Strawdog 2018.02.18. 20:46:03

Nem tudom, mi az, hogy lejátszva. A matektól távolabb eső területeken úgy tudtam, hogy nem szokás elismerni, hogy valakinek igaza lenne a másikkal szemben egy elméleti állításban, sőt azt sem, hogy egyáltalán lenne olyan, hogy igazság. Mindenki publikál, jó esetben le is idézik egymást, aztán lesz valami uralkodó lokális nézet, valami ködös közvélemény-féleség meg más relatív tekintélyek nyilatkozatai alapján. Vagy nem így van?

Amúgy ismeri itt valaki a Russ Lyons féle történetet pontosan? Én csak sztorikat hallottam róla.

Online Távmunkás · http://onlinetavmunka.blog.hu 2018.02.18. 21:19:43

@harmadikszem: Ahol Barabási tanít, ott Barabási könyvét használják? Mintha szűk lenne a minta...

@jotunder: Sajnos van sok tudományterület, ahol a citációk jelentős része nem az adott cikk érdemeinek szól, hanem a szerző személyének. Sokan így akarnak jóindulatot vásárolni...

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.18. 21:22:12

@Online Távmunkás: nem sok helyen van netsci phd nezz utana. Tudtommal o csinalta az elso kettot. Megkerulhetetlen figura.

szazharminchet 2018.02.18. 21:47:58

@Strawdog: Néha elég lassan ismerik el, hogy kinek van igaza, de azért a "hard" tudományokban a logika/bizonyítás (matek), vagy a mérések (fizika) azért előbb-utóbb helyreteszik a dolgokat.

Hogy néha elég lassan, arra egy sztori:
R. de Boer, The engineer and the scandal: A piece of science history, Springer, 2005.

Még a tudomány haladásáról egy érdekes cikk:
P. Azoulay, C. Fons-Rosen, J.S. Graff Zivin, Does science advance one funeral at a time? NBER Working Paper Series, 2015.

Strawdog 2018.02.19. 08:52:17

@szazharminchet: Egy Sokal nevű pasas (statisztikus fizikus) mesélte nekem, hogy mikor rendes fizikusok közé mennek konferenciára, és hoznak valami új eredményt, mindig az a reakció, hogy igen, persze, ezt már rég tudtuk, azért kösz hogy formalizáltad.

Egy idő után kissé megdühödött és legközelebb, mielőtt kimondta az eredményt, megszavaztatta a közönséget, hogy mit gondolnak, mi lesz a válasz. Vagy 80% rosszra szavazott. Mikor megmondta nekik, iszonyú dühös lett mindenki, hogy ez mennyire tudománytalan, övön aluli húzás volt.

balmoral 2018.02.19. 08:53:33

Egy hortobágyi pásztortól megkérdezte egy botanikus: Ugye ezt a Festucetum vaginatae gyepet nagyon szeretik a birkák? Mire a pásztor bölcsen annyit mondott: Való!

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 09:08:06

@Strawdog: Alan Sokal? ő egyszer az egész bölcsésztársadalmat (in the whole world) magára haragította :))

balmoral 2018.02.19. 10:12:10

@jotunder: Besokaltak tőle. (Bocs!)

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 10:49:14

@balmoral: en.wikipedia.org/wiki/Sokal_affair

meg weboldala is lett, akkora poen volt. hihetetlen, hogy sikerult neki.

közösperonos átszállás 2018.02.19. 11:25:57

@poszt: Amennyire én belelátok (nemigen), nekem úgy tűnik, hogy nem szélhámosság ez, csak pont olyan, mint a gráfos dolgok nagy része: matematika. Ergo van egy ilyen meg ilyen gráfunk, ezt meg ezt tudjuk róla mondani, aztán ha a valóságban is létezik olyan valami, ami kábé hasonlít erre a fajta gráfra, akkor jó, míg ha nem, hát akkor is jó. (És igen, tudom, hogy léteznek gráfalgoritmusok, Dijkstra, folyamproblémák etc., nem ezekről beszélek. A poszt sem ezekről beszél.)

jan 2018.02.19. 12:07:35

Próbálom összerakni, mi van itt, és nagyjából ezt látom:

1) van egy matematikai kérdés, hogy a gráfokat célravezető-e azon keresztül jellemezni, hogy a fokszámuk power-law eloszlást követ vagy sem - úgy látom, egyértelmű, hogy nem célszerű, mert attól még más, fontos szempontból tökre eltérőek lehetnek egymástól

2) van egy tudománykommunikációs kérdés, hogy mennyire helyes a preferential attachment gráfokat összemosni azokkal a gráfokkal, amelyek fokszáma power-law eloszlást követ

3) van egy szociológiai-engineering-fizikai kérdés, hogy vajon a való életbeli hálózatok "többsége" hogyan néz ki - ha jól értem, Barabási azt sugallta, hogy ezek jellemzően preferential attachment gráfok, és ezért a fokszámuk power-law eloszlást követ

A 2) nyilván nem független a 3)-tól, hiszen ha a való életbeli hálózatok nagy része tényleg azért követ power law-t fokszámilag, mert preferential attachmenttel jön létre, akkor belefér az összemosás bizonyos kontextusokban (még akkor is, ha okos matematikusok sok fura gráfot ki bírnak találni, ami nem PA, és mégis power law).

Ha jól értem, most Barabási azért van igaziból bajban, mert kiderült, hogy:

a) a hálózatok többsége nem PA-módon szerveződik (persze hogy mit jelent a "többsége", amikor tök más fajta hálózatokat nézünk, nem triviális)
b) bizonyos klasszikusan PA-módon szerveződőnek mondott hálózatokról (internet, citációk) kiderült, hogy mégse úgy szerveződnek

Őszintén szólva, én ezek közül egyiket se látom bajnak: az empirikus tudományok nagy része így működik, hogy X állít valamit tök újat, aztán több százan elkezdik vizsgálni, és kiderül, hogy amit X mondott, sok szempontból nincs pont úgy. De ettől még X nem követett el rosszat, és ő marad továbbra is ennek a kutatási ágnak az egyik kiindulópontja.

Szóval kicsi morális pánik szagot érzek.

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 12:15:05

@jan: azert egy lenyegeben teljesen elmeleti teruleten a "baj" szonak sincs nagyon ertelme. ugyan mi "baj" lehetne ebbol az egeszbol. mi az, hogy "rossz"? megis mennyire lehet rossz az, hogy valaki allit valamit egy aranylag absztrakt teruleten, amirol kesobb kiderul, hogy nem ugy van. ha ez valami kemenyebb technologiakozeli fizika lenne, vagy orvostudomany, az mas lenne, ez igy leginkabb az "erdekesseg "kategoriaba tartozik.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 12:16:29

@jan: a citacios halozatokrol hol derult ki? A jt altal linkelt cikk moderate supportrol beszel barabasi 2016os konyve ugyancsak.

jan 2018.02.19. 12:22:51

@jotunder: Egyetértek. Viszont szerintem amit Barabási állít, azért annyira nem absztrakt, vagy igen? Legalábbis nekem az jött le, hogy Barabási állításában nem az volt az igazán forradalmi, hogy bemutatta, hogy a PA algoritmussal szerveződő gráfok fokszáma power-law-t követ (ez egy absztrakt állítás), hanem hogy azt állította, hogy a való világbeli, jól ismert hálózatok többsége igen (ez viszont egy empirikus állítás).

Tehát, kicsit talán a saját hozzászólásomat is pontosítva, talán annyi történik, hogy Barabási elméletéről most kiderül, hogy nem "a Mindenség elmélete", hanem csak "a Mindenség 5%-ának az elmélete". Ami persze még mindig nem kevés, pláne, hogy ezt az egész field-et ő indította be, ha jól értem - az meg a dolgok velejárója, hogy a field-ek beindítóinak a nézeteiről kiderül, hogy nem mindenben voltak helytállóak. Chomsky '70-es évekbeli nézeteit úgy ahogy vannak, már maga Chomsky se fogadja el egy az egyben, de ettől még ő alapította a generatív nyelvészetet.

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 12:33:14

@harmadikszem: Clauzet, Shalizi es Newman kimutatta, hogy a citacios halozatok fokszameloszlasa ugyanolyan kozel van a power-lawhoz, mint a lognormalhoz, vagy a Weibullhoz. ennel sokkal durvabb problema is van. Mostmar sokkal tobbet tudnak errol.

A PA-grafok expanderek, a valodi halozatok tipikusan nagyon nem azok. Tudod, hogy ez mit jelent? Hogyan mondhatod azt, hogy egy expandalo modell es egy kurvara nem expandalo modell az "majdnem ugyanaz"? (foleg, hogy meg az asszimptotikus fokszameloszlasuk is mas)

Olyan kicsik ezek a halozatok, hogy hulyere kell tisztogatni ahhoz, hogy az ember valamit is lasson beloluk (a nagyon nagy embereket pl. ki kell venni)

Egy grafnak nem lenyeges tulajdonsaga az asszimptotikus fokszameloszlasa. Semmit nem arul el rola. Semmit.

Annak, hogy 2.79-es faktor a citacios halozatokban annyira nincs ertelme, amennyire lehet. Tenyleg elhiszed, hogy kulonbozo citacios adatfile-okban UGYANAZT a konstanst merik? Ugyanabban a citacios fileben kulonbozo statisztikai modszerekkel (tisztitas nelkul semmi sem merheto) is mas konstanst mernek.

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 12:35:22

@jan: "bemutatta, hogy a PA algoritmussal szerveződő gráfok fokszáma power-law-t követ " bovebben... nem mutatta meg. egy gondolatkiserletet mutatott ra. ez a gondolatkiserlet neha mukodik, neha nem. az atmero asszimptotikara pl. nem mukodott.

a valodi "bemutatas" Bollobas, Riordan, Spencer, Tusnady cikkben van leirva.

Bogomil 2018.02.19. 12:40:37

@jan: Az szerintem nyilvánvaló, hogy amit Barabási csinált, az nem matematikai elmélet; ahogy jótündér korábban írta, még azt sem ő bizonyította be, hogy a PA gráfok fokszámeloszlása a PL-t követi. Azt állította, hogy a PL (és/vagy) PA gráfok jól modelleznek bizonyos való világ beli hálózatokat (ami most részben hamisnak tűnik). Tulajdonképpen milyen nem-triviális állításokat tett a networkscience?

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 12:46:39

@jan: Barabasi "elmeletero"l az derul eppen ki, hogy nincs. Nincs elmelete a halozatoknak. Valoszinuleg sohasem lesz. Nem mindennek van elmelete. Vannak dolgok, amelyek osszeallnak, de nincs mogottuk egy darab egyseges szep elmelet, amit a fizikusok (mint a Barabasi) szeretnek. Az persze egyfajta valos tudas, hogy a halozatoknak nincs elmelete.

Nincs olyan valo vilagbeli halozat, amelyik valoban PA jellegu lenne. Olyanok vannak, nem tul sokan, sot kifejezetten kevesen, amelyek a PA halozatok egyik tulajdonsagara ti. a powerlaw fokszameloszlasra hajaznak.

Mondanal nekem egy olyan allitast, ami a PA-(BA)-tipusu halozatelmelet alkalmazasa a valo vilagra es 1. nem trivialis 2. nem teljesen teves?

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 12:46:47

@jotunder: a citation network nem ilyen bonyi sztem. A wos-bol szimpla java script alapu programozassal ki lehet venni az osszes adatot aztan gephivel vagy mas szoftverrel tobb millio nodeig tisztitas nelkul lehet szamolni. A vizualizacional szoktak tisztitani de ott is inkabb a kicsiket veszik ki mondjuk 5os citation (fokszam) alatt. Ez egy eleg egyszeru halozattipus es jo adatbazosok vannak hozza. Este linkelek mintat.

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 13:04:44

@harmadikszem: ne velem vitatkozz, hanem Clauset-val... a citacios networkokkel komoly problemaik voltak. irt rola. o csinalta a legkomolyabb statisztikai vizsgalatokat.

gondold meg, mekkora adatbazis kellene ahhoz, hogy te egy eloszlasra bekevel azt mondhasd, hogy 2.79.

100 a 2.79-edik hatvanyon az 380189.4
100 a 2.80-adik hatvanyon az 398107.3
100 a 3-adik hatvanyon 1000000

az a bizonyos C k^{-gamma} olyan ezekben a meresekben, hogy a C az egy tized es a tiz kozott lebeg. ergo semmilyen finomsagot nem merhetsz ki ilyen magassagon. ez van Clauset finom ironiaja mogott. ha valami ennyire vilagos, akkor talan nem kellene komoly detektivmunka az eszrevetelehez, plane ahhoz, hogy meg azutan se deruljon ki. Barabasi nem ert a matematikahoz. O egy fizikus.

de megegyszer.... a PA graf es a citacios grafok kozott dobbenetes strukturalis kulonbsegek vannak. ezek a legnagyobb kulonsegek, amelyek grafosztalyok kozott fellephetnek.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 13:14:38

@jotunder: es az nem lehet hogy a barabasi metaforikusan hasznalja a grafok tulajdonsagaira a networkok tulajdonsagait tehat pl a pa alatt az empirikusan is merheto mate effektust erti?

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 13:26:04

@harmadikszem: az ugye vilagos, hogy nekem az lenne az erdekem, hogy minden ugy alakuljon, ahogy azt a barabasi eltervezte.

ezek az ugyek igen erosen az en vilagom fele konvergaltak, es talan egy kicsit konkretan felem is. ezek ugye nagy grafok, amelyek egyre inkabb hasonlitanak egymasra. a kommenteloink nem elhanyagolhato resze foglalkozik egyre nagyobb grafokkal, amelyek egyre jobban hasonlitanak egymasra. es ha tudnad, hogy miket kerdez ezekrol a grafokrol a barabasi. pont azt, amit a mifele nepek tudnak. most erre volt egy tokeletes pelda.

nincs nekem olyan szerencsem....

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 13:32:54

@harmadikszem: metaforikusan nyilvan igaza van. mert a metaforak eleg sok mindent elbirnak. az, hogy valamifele Matthew-effect van ilyen rendszerekben az teljesen nyilvanvalo, es ezer eve beszelnek ilyesmirol. az, hogy o a fokszameloszlassal MERI a Matthew-effectet az egy igen bator allitas.

hol van ebben a vilagraszolas, konyorgom. mond valamit, ami nyilvanvalo. es ezer eve senki sem gondol mast. vannak bizonyos jelek, amelyek azt mutatjak, hogy a hype le fog csengeni.

az AI lenne a kovetkezo hype, de az nem hype, raadasul nincs szep vilagos elmelet mogotte, csak rettenetes mennyisegu tapasztalat es tudas.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 13:52:05

@jotunder: ha igazad van az az en teruletem szempontjabol meg erdekesebb mint ha nincs. Itt a vilag legtobbet idezett hard science szerzojerol van szo tobb nature cikkel. Ez nem egy egyszeri sokalpozitiv cucc.

fortin2 2018.02.19. 14:38:04

@harmadikszem: "a vilag legtobbet idezett hard science szerzojerol van szo" De hát nem arról van éppen szó, hogy valójában nem hard science?
És JT kissé optimista, amikor azt írja, hogy
"ugyan mi "baj" lehetne ebbol az egeszbol. mi az, hogy "rossz"? megis mennyire lehet rossz az, hogy valaki allit valamit egy aranylag absztrakt teruleten, amirol kesobb kiderul, hogy nem ugy van. ha ez valami kemenyebb technologiakozeli fizika lenne, vagy orvostudomany, az mas lenne, ez igy leginkabb az "erdekesseg "kategoriaba tartozik."
Éppen az orvostudomány az egyik terület (a nemzetbiztonság pl. a másik) ahol nagyon is konkrét alkalmazásokat kezdtek el ebből fejleszteni, soksok pénzért. Stb.
Sem ezekhez, sem a matematikai alapkérdésekhez nem mernék hozzácsaholni, de ami a science networköt illeti, az annyi megszorítással, kiiktatással, tudományszociológiai szimplifikálással működik csak valamennyire, hogy eléggé kétséges az egész.
Már várom amúgy egy matematikában és tudományelméletben, társadalomtudományban egyaránt jártas kollégának a "Sokal-akcióját" a témában...

Bogomil 2018.02.19. 15:01:53

Arra azért kíváncsi lennék, kik (mármint melyik diszciplína képviselői) csinálják a peer review-kat a Barabási cikkeiről, és főként kik csinálták az elsőkről, a 90-es évek végén, illetve a 2000-es évek elején. Valószínűnek tartom, hogy nem matematikusok, talán még nem is fizikusok.

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 15:17:00

@Bogomil: ilyesmikre probaltam celozni. Ezek valodi kerdesek. Nagyon eros helyeken megjelent cikkekrol van szo ez nem a sokal sztorija.

Bogomil 2018.02.19. 15:26:51

@harmadikszem: Most már szerintem a networkscience "kitermelődött" saját emberei. Az igazi kérdés a kezdet. De ezt valószínűleg soha nem fogjuk megtudni...

harmadikszem · http://harmadikszempont.blog.hu/ 2018.02.19. 16:08:02

@Bogomil: tobb kezdet van tobb emberrel. Ezek kozul sok klasszis. Albert Reka onmagaban is vilagsztar. Itt ez egy sokkal erdekesebb dolog szerintem annal mint ami most latszik belole.

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 16:23:56

@harmadikszem: Nature, Science. Igen. De ettol azok a cikkek meg nem igazan ertekesek valamifele aranylag objektiv merce szerint. Ezek egy igeretre epulnek. Az igeret pedig az, hogy a valodi halozatok PA-alakuak. Nagyon nem azok. Es ezt egyre hangosabban kezdik kimondani. Vannak, aki nyilvanosan koklernek nevezik Barabasit. Komoly emberek. Siman. Nezd meg, hogy mik is hangzanak el az Alapitoatyak szajabol, ovatosabb dolgok, de azert eleg hatarozottak. Igen, ezek kozott az emberek kozott van rivalizalas, de az, hogy Strogatz, Watts es Newman (o mar eleg regen) elkezd ezekrol a dolgokrol igy beszelni az jelent valamit.

En nem allitom azt, hogy a halozatelmeletben valamifele tisztito vihar fog kitorni, de meg azt sem zarnam ki. A fraktalelmelet (abban a formajaban, ahogy Mandelbrot elkepzelte) csendesen tunt el, a SOC szinten. Lehet, hogy az fog tortenni, hogy elkezdik csokkenteni a scale-free ugyek tamogatasat es lassan el fog halni a network theoryn belul, viszont maga a halozatelmelet megtalalja a helyet. Az nem ketseges, hogy a scale-free hype megalapozatlan es egyes esetekben nyilvanvaloan teves allitasokra epul. Ebben lassan konszenzus alakul ki.

ámbátor 2018.02.19. 16:50:47

@jotunder: Az AI hype-ja megvolt a nyolcvanas, kilencvenes években. Akkor megvolt az alapja mindannak, ami most kezd müködni. Akkor nekifutott a világ aztán vérzö orral pattant le a hardware korlátai miatt. Utána vagy harminc éven át szorgos kezek faragták az elméleteket meg próbálkoztak az egyre erösebb vasakon. Nagyon úgy néz ki, mostanra lett elég erös a hardware, hogy valamit tényleg meg lehessen csinálni azokból, amiket elméletben már harminc éve kidolgoztak.

közösperonos átszállás 2018.02.19. 17:04:33

@ámbátor: "Nagyon úgy néz ki, mostanra lett elég erös a hardware, hogy valamit tényleg meg lehessen csinálni azokból, amiket elméletben már harminc éve kidolgoztak. "

Egyrészt elég erős már a HW.

Másrészt vannak elég nagy adatbázisok.

Harmadrészt vannak új algoritmusok. Egy DNN nem "csak egy nagyobb ANN", nagyon nem.

közösperonos átszállás 2018.02.19. 17:08:02

@jotunder: "Az nem ketseges, hogy a scale-free hype megalapozatlan es egyes esetekben nyilvanvaloan teves allitasokra epul."

Egyébként ez önmagában nem gond, mert mi nem épül téves állításokra, ami aztán mégis működik. Az a kérdés, hogy ha úgy teszünk, mintha igaz lenne, ami nem igaz, és ehhez igazítjuk az eljárásainkat, akkor azok a gyakorlatban vajon működnek-e?

jotunder · http://orulunkvincent.blog.hu 2018.02.19. 17:11:59

@közösperonos átszállás: nincs gyakorlat. a valosagos halozatos problemakra nem lehet raugrani azzal, hogy tudjuk mi tortenik egy olyan halozatban, amelyhez semmi kozuk.

jaegtoer 2018.02.19. 17:30:29

@jotunder:

Nincs ugrálás. Az ember fia egyszer csak észreveszi, hogy be van hálózva, vagy bele van gabalyodva a hálóba. Nincs menekvés.

közösperonos átszállás 2018.02.19. 18:03:59

@jotunder: "nincs gyakorlat."

Ha nincs gyakorlat, akkor nincs semmiféle probléma sem.

"a valosagos halozatos problemakra nem lehet raugrani azzal, hogy tudjuk mi tortenik egy olyan halozatban, amelyhez semmi kozuk. "

Amennyire én értem, annyit tudunk mondani, hogy valamivel kevesebb közük van a modellünkhöz, mint gondoltuk. Mert pont olyan nem volt előtte se (emlékszel, hányszor mondtad, hogy tisztogatni, tisztogatni?), viszont tényleg érdekelne, hogy akkor ez most mindannak a működését a gyakorlatban mennyire befolyásolja, amit erre a kártyavárra építettünk rá gondosan.

Mondok egy példát; csillió olyan eset van, mikor azt mondjuk, hogy két dolog valószínűsége teljesen független egymástól. Miközben _tudjuk_, hogy nem független, józan paraszti ésszel bárki megmondja, hogy függetlenek ám a túrót; de ha azt mondjuk, hogy nem függetlenek, akkor csak a vállunkat vonogathatjuk, hogy hát izé, mittomén, mit lehet ezzel csinálni. Viszont ha feltesszük, hogy függetlenek, akkor az együttes valószínűségüket mindjárt egy egyszerű szorzással megkaphatjuk. Aztán erre építünk valami rendszert, ami működik.

Én valahogy így képzelem a helyzetet most is, illetve (talán ez pontosabb) így látom. És látok pár lehetőséget is, például hogy azt mondtuk egy csomó dologra, hogy PA, de ezt nem használtuk aztán semmire, csak úgy feltettük a szekrény tetejére; na erre mondtam, hogy ez igazából nem egy nagy probléma akkor. Ha viszont ezt használtuk valamire, építettünk rá további feltételezéseket, akkor azok vagy igazolva vannak továbbra is mérésekkel, vagy továbbra sem.

Azt mondjuk elismerem, hogy egy matematikusnak valószínűleg nem áll rá az agya arra, hogy "It may come out all right in practice, but it'll never work in theory!". :-)

Mister Gumpy 2018.02.20. 00:29:48

@jotunder: Az első bekezdésed itt egy hibás érv! Feltételezem, tudod, mi a Pólya urna, hogyan speciális esete a de Finetti tételnek, és mindennek még a PA-hoz is köze van, Berger, Borgs, Chayes, Saberi alapján. Namármost, a Pólya urnában a pusztán véletlen PA típusú folyamat ugyanazt eredményezi, mintha az egyik szín jobb minőségű lenne a másiknál.

persicsbalint 2018.02.20. 00:41:07

@Bogomil: self-organizing criticality, benne van a cikkben

jotunder · http://orulunkvincent.blog.hu 2018.02.20. 00:59:34

@Mister Gumpy: A Pólya urna folyamat azt jelenti, hogy egyenletesen véletlenül kiválasztasz egy végső eloszlást. Igen, mondhatod azt, hogy az ugyanaz (ez a de Finetti, ha jól emlékszem) mintha először választanál véletlenül p-t és lenne egy p valószínűségű színed és egy 1-p valószínűségi színed. Ez a gráfoknál valami olyasminek felel meg, mint ha a PA helyett egy determinisztikus önhasonló konstrukciót csinálnál (Ravasz-Barabási, vagy Ito). Igen ám, de a két gráf minőségileg fog különbözni egymástól, annak ellenére, hogy a fokszámeloszlásuk ugyanaz lesz.

Strawdog 2018.02.20. 11:03:50

@jotunder: De mi lenne egy ilyen aránylag objektív mérce?

Mister Gumpy 2018.02.20. 12:17:56

@jotunder: Te azt látod, hogy melyik kommentedre válaszoltam? Amit @harmadikszem:-nek írtál, hogy azért nem lehetne a citációs gráf PA-szerű, mert van a cikkeknek minősége is. Azt próbálom elmagyarázni, ez miért rossz érv.

Elsőre blikkre a Pólya urna is csak teljesen véletlen, a végére mégis "kiderül", milyen a "minősége" a két színnek. És Berger, Borgs, Chayes, Saberi konkrétan a PA lokális limeszét írja le Pólya urnák segítségével, nem valami másik modellről beszélek, ami nem hasonlít a PA-ra. Nem egészen értem, te mire gondoltál a nekem válaszodban, de egyáltalán nem arról van szó, mint amit írni látszol, hogy választasz véletlenül egy determinisztikus önhasonló struktúrát, aztán gyerünk. A PA-nak a BBChS szerinti reprezentációjában sokkal inkább lokálisan van egy csomó Pólya urnád. És mivel a citációs gráf a valóságban olyasmi, a kommented szerint legalábbis, hogy véletlenül kiosztod, hogy melyik cikk milyen minőségű, aztán ebből fölépítesz egy főleg a minőség által irányított gráfot, és mivel BBChS szerint egy nagy PA gráf is ehhez hasonlóan néz ki, akár lehetne is, hogy a citációs gráf is PA-szerű. Hogy bemérték, és mégse olyan, az lehet, de az nem jó indok, hogy a cikkeknek van relevanciája.

Mister Gumpy 2018.02.20. 12:25:21

Bocs, ha nagyon matek-elitista vagyok, de ez vihar egy pohár vízben. Majdnem semmilyen tudományos relevanciája nincs, hogy power law gráfok-e a való életbeli networkok. Pont az Barabási bűne, hogy elhitette egy csomó, a matekhoz nem értő emberrel, hogy ez egy releváns kérdés. Bűne, nem hibája, mert nem gondolt utána, értelmes-e, amit mond, hanem csak megtetszett neki az "új paradigma", és onnantól ezt nyomta, ahogy a csövön kifér. Ezért lehet kóklernek hívni.

jotunder · http://orulunkvincent.blog.hu 2018.02.20. 13:07:17

@Mister Gumpy: az igazan durva indok az, hogy a PA expander a citacios graf rohadtul nem.

Strawdog 2018.02.20. 19:08:59

Kábé bármire, amit mondtok, simán lehet azt mondani, hogy jó, de ez nem releváns a real life network-ök esetében.

Akkor lehet értelmesen vitatkozni ilyenekről, ha legalább kérdésszinten valamilyen közösség van.

Addig csak intellektuális pöcsverés, ami persze tud szórakoztató lenni, mármint főleg azoknak, akik beszállnak húzogatni. Nagy forgalom, kis haszon.

szazharminchet 2018.02.20. 21:07:25

@ámbátor: Az AI-nek szerintem elég erős "hype"-ja volt már a számítógépek elterejedésének az elejétől (akár az 1950-es évek) az AI winter-ig (1970-es évek eleje, és ismét a 80-as évek végén és a 90-es évek elején).

Szerintem egyáltalán nem arról pattantak le, hogy gyenge volt a hardware, hanem hogy nem a megfelelő alkalmazásokkal próbálkoztak. Az emberi intelligenciát akarták leutánozni (gépi fordítás, "expert systems"), pedig még egy guppiét sem sikerült. Most sem ezek a témák sikeresek, hanem a képfelismerés, adott konkrét feladatok megoldása (pl. deep learninggel), autóvezetés.
Amiben jók voltak az első hype alatt, az a sokat igérés.

ijontichy 2018.02.21. 01:31:50

@szazharminchet: hype-ok mindig voltak, és lesznek. Btw. az autót vezető AI-nek szükséglete az autóvezetés? Milyen szükségletét elégíti ki a fordító a fordítással? ;-)
Szvsz. amiről a hype megy, az nem AI, hanem korlátozott feladatkörre programozott "robotok", melyek kétségtelenül magas szintű matematikai-informatikai eszközök felhasználásával végzik tevékenységüket. A fejlődés óriási és letagadhatatlan.
Ámde (majd 4x 'ámítástechinkai gyakorlattal) én ugyan nem látok AI-t. Nem volt paradigmaváltás. Sejtésem szerint majd a kvantumszámítógépek talán meghozzák, de ez nem bizonyosság, csak érzés.
Hype az volt a Moore-törvénytől, a címtárakon át a bigdata-ig dögivel. Most van (megint) az "AI".

szazharminchet 2018.02.21. 13:04:28

@ijontichy: Szerintem az AI-jal már az is a probléma, hogy nem tudjuk, mi az az I. A kezdeti, szerintem elég naiv, AI azon alapult, hogy intelligens az, ami/aki úgy viselkedik, ahogy én (vö. Turing-teszt, ami szerencsére úgy tűnik, hogy nem igazán Turingtól származik, matematikusként eléggé szégyellnék egy ilyen rosszul definiált cuccot). Az A-ról meg: abstrusegoose.com/215 .
Most meg az tűnik a legjobb definíciónak, hogy az az AI, amit még nem csináltak meg. Szerintem volt paradigmaváltás, mégpedig az, hogy elkezdtek tanuló rendszereket alkotni, és azokat ésszerű feladatokra alkalmazni (nem olyanokra, amihez emberből is okos ember kell, hanem olyanra, amit azért egy jobb macska is tudna).
(Hogy a kvantumszámítógép hoz-e bármit az AI terén, hát... nem bocsátkoznék becslésekbe. Azért a kvantumszámítógép kvantummechanikai leírása (véges szabadsági fokú kvantumrendszer), az kb. linalg, hogy annál sokkal többet fog-e tudni a gép, vagy csak azt, baromi gyorsan, azt majd meglátjuk.)

közösperonos átszállás 2018.02.21. 17:08:55

@szazharminchet: "Szerintem volt paradigmaváltás, mégpedig az, hogy elkezdtek tanuló rendszereket alkotni, és azokat ésszerű feladatokra alkalmazni (nem olyanokra, amihez emberből is okos ember kell, hanem olyanra, amit azért egy jobb macska is tudna)."

Azon speciel túlvagyunk már rég egy csomó területen (egy csomón meg nyilván egy nyolcéves gyerek szintjén sem). Viszont azt is megtapasztaltuk, hogy a "jobban, mint az ember", az egy géptől egy csomó esetben nem elég. :-) Kutya se venne önvezető autót, ha azok (lenormálva) csak fele annyi halálos balesetet okoznának, mint az emberi sofőrök, de ugyanez van orvosi területen is (ott a gép téved = a gép megöl = botrány, az orvos téved meg, hát, emberek vagyunk).

Én azt szoktam mondani, hogy az AI-feladat mostanában, ami nem tisztán algoritmikus feladat, és nem baj, ha nem érjük el az ember szintjét, viszont azért legyen egész jó és be lehessen vetni tömegesen (az embert ugye nem lehet, ill. lehet, csak drága). Persze aki AI-n Skynetet ért, annak: nem, sehol nem tart még a terület. :-)

ijontichy 2018.02.21. 21:35:04

@szazharminchet: "hogy nem tudjuk, mi az az I." Nálad a pont.

ipartelep · http://ipartelep.blog.hu 2018.02.22. 11:53:34

Ahogy látom, több(féle) kérdés is felmerül ezzel a hálózatelmélettel kapcsolatban.
Van-e egyáltalán hálózatelmélet? Mit kell a hálózatokon "elméletezni"? Miről van itt egyáltalán szó, a hálózatelmélet nem egy analitikus matematikai diszciplina? Vagy fizikai diszciplina, a valóságos hálózatok tulajdonságairól akar valamit mondani? Mit mond erről? Mi az, ami abban új, eddig nem tudott, nem triviális, értelmes, hasznos, használható tudás? Nem csak arról, van itt szó, hogy felkaptak, hájpoltak egy új területet, ahol "tudósnak látszó tárgyak" csinálnak valamit? Egyáltalán, mi mondható el Barabási tevékenységéről, milyen az? Olyan, mint a Sokal által gyakorlatilag kigúnyolt posztmodernista filozófusok, nyelvészek, stb. tevékenysége, nevezetesen, hogy értelmetlen halandzsa? Vagy értelmetlennek nem az, csak hamis? Vagy nem is hamis, csak triviálisan igaz (Mari néne is tudná, ha 5 percig elgondolkodna rajta)?

És csak kérdezek. (Eddig kérdeztem.) Én egyáltalán nem értek a hálózatelmélethez, ilyenkor csak szag után tudok menni. Ezek a szagok nekem azt súgják (nem szó szerint súgják, mielőtt...), hogy Barabási ugyan nem az a kategóriájú halandzsaművész, mint a Sokal által bíráltak, és nem is áltudományt művel, mint mondjuk a homeopátiával foglalkozók, de nem is fedezett fel (vagy talált fel) semmit. Jól felkapta egy divathullám, oszt most a figyelem mindenhonnan ráirányuló sugaraiban sütkérezve, kényelmesen utazgat annak hátán. Ez igazából a "király meztelen" szindróma, csak hát... Csak hát ezt nyilván nem nekem laikusnak kell kimondanom (szag után ugye), hanem a terület szaktudósainak. És ha valóban így van (hogy kókler), és valamiért mégsem mondják ki, akkor ott azért van némi probléma.

jotunder · http://orulunkvincent.blog.hu 2018.02.22. 13:08:52

@ipartelep: Ez igy nem igaz. Rengeteg komoly ember foglalkozik halozatok vizsgalataval. Fontos dolgokat lehet megtudni roluk. Nincs nekik olyan ertelemben vett kristalytiszta elmeletuk, mint a kommutativ gyuruknek. Azaz, amikor van, akkor azok a halozatok nem valosagosak, hanem konstrualtak es tulajdonkeppen grafelmeletrol van szo. A grafelmeletnek termeszetesen vannak alkalmazasai, de ezeket nem szoktak halozatelmeleti alkalmazasoknak nevezni. Vannak azert eleg hasznos, de a Barabasi halozatoknal nagysagrendileg komplikaltabb modellek az igazi halozatelmeletben is. Barabasi egy modellnek az apostola. ami nagyon szep modell, izgalmas dolgokat lehet megfigyelni rajta, de nagyon vigyazni kell azzal, ha az ember ezeket a megfigyeleseket alkalmazni akarja valosagos halozatokra (a legjobb az, ha nem tesz ilyet az az ember).

ipartelep · http://ipartelep.blog.hu 2018.02.22. 13:21:58

@jotunder: Jó, de hát azért ezeket, hogy szélhámosság-e ez az egész (nem Barabási elmélete, hanem az egész hálózatelmélet) te pedzegeted, nem én. és már ugye nem is az első blogposztodban pedzegeted. Itt azért zörög valamiért a haraszt.

És hát szép Barabási-modell ide vagy oda, az is óvatosságra inthet itt, hogy ha jól emlékszem Barabási valami olyasmit is mondott, hogy a modelljével (elméletével) előre jelezhetők a jövőbeli társadalmi események. Amire viszont már Besenyő Pista bácsi edzője is felkapná a fejét, hiszen ki akar egy Boborjánt edzeni, amikor ilyen tehetséges tanítványa is lehetne?

De végül is én itt csak azt mondom, hogy azért a szagértőknek már illene eldönteniük, vagy rájönniük arra, hogy Barabási milyen fokú kókler.

ipartelep · http://ipartelep.blog.hu 2018.02.22. 13:23:57

@ipartelep: Helyesen persze: Besenyő Pista bácsi kapná fel a fejét, aki Boborján edzője. (Volt eddig.)

Szindbad 2018.02.22. 13:28:27

@közösperonos átszállás: "Egy DNN nem "csak egy nagyobb ANN"", hát nem, de azért olyan nagyon nem "nagyon nem" :)

Szindbad 2018.02.22. 13:29:31

@közösperonos átszállás: Ja és a kérdés, mi az, ami nem volt meg 20-30 évvel ezelőtt?

ipartelep · http://ipartelep.blog.hu 2018.02.22. 13:40:43

De ha már elméletek... Bocs. ez nem pont hálózatelmélet, de annyira vicces. Nem tudok ellenállni a kísértésnek, hogy be ne linkeljem ide:
24.hu/belfold/2018/01/07/hatalmas-dobasra-keszulnek-a-magyar-laposfoldesek/

közösperonos átszállás 2018.02.22. 13:41:58

@Szindbad: Mint már mondtam,

1) gép,
2) adat,
3) algoritmus.

És kell mindhárom... Amennyiben csak a hármas ponton belülre gondoltál (nem volt egyértelmű nekem, szóval nem kioktatni akarlak, csak gondoltam, egyszerűbb egy körben mindkét lehetőséget megválaszolni), egy szigmoidos háló egyszerűen nem tanul rendesen sok (mittomén, akár már három) rejtett réteggel. Aztán jött Hinton az előtanítással, aztán az ötlet, hogy tanítsuk rétegenként (mindig hozzáteszünk a tetejéhez egyet és úgy), aztán a ReLU és variánsai. Harminc éve 1988 volt, és még húsz éve is csak 1998, ezek meg még a fasorban sem.

(Természetesen minden konferencián találhatsz tetszőleges számú Nagy Öreget, akik előadják, hogy ezt ők már kipróbálták 1983-ban C64-en, csak akkor még a BASIC nem támogatta a lebegőpontos számábrázolást, és hát azért. :-) )

Miki Telepi · http://chienenchaine.wordpress.com 2018.02.22. 16:05:07

@jotunder: "Barabási nem egy kókler", de én azt hiszem hogy most már nincs egy olyan mérföldköves cikke sem, ami ne lett volna megcáfolva: WWW, internet szerverek, áramelosztó hálózatok, metabolikus hálók, email, etc etc.
"Barabási’s “work” is a regular feature in the journals Nature and Science despite the fact that many eminent scientists keep demonstrating that the network emperor has no clothes."
liorpachter.wordpress.com/2014/02/10/the-network-nonsense-of-albert-laszlo-barabasi/

Sapienti sat.

ámbátor 2018.02.22. 16:25:29

@közösperonos átszállás: Józan ember nem mondja, hogy minden kész volt 30 éve, de az alapjai ott voltak, a legfontosabb AI területeket akkor pisálták körbe: képfeldolgozás, beszédfeldolgozás, természetes nyelvek kezelése, szakértö rendszerek, gépi fordítás, szabály alapú rendszerek, neurális hálók. Mindezek elindultak, aztán hardver és adat híján a gyakorlati megvalósulásuk megrekedt, de az algoritmusokon okos fickók papíron ceruzával meg a mindenkori vasakat feszegetve bütyköltek tovább, és mostanság kezd odaérni, hogy összeér a vas, az adat meg az algoritmus, hogy gyakorlatban is fel tudnak mutatni valamit.

Szindbad 2018.02.22. 16:45:47

@közösperonos átszállás: De ha még csak annyit kérdezel is, hogy miért jobb a DNN az ANN-nél, nem elméleti választ kapsz, hanem azt, hogy hát az a _tapasztalat_, hogy jobb, de nem tudja senki, hogy miért.

stats.stackexchange.com/questions/182734/what-is-the-difference-between-a-neural-network-and-a-deep-neural-network

Kísérletezés folyik inkább, mint elméleti alapozás, én pedig az elméleti eredményekre kérdeztem rá.

közösperonos átszállás 2018.02.22. 18:34:06

@Szindbad: "De ha még csak annyit kérdezel is, hogy miért jobb a DNN az ANN-nél, nem elméleti választ kapsz, hanem azt, hogy hát az a _tapasztalat_, hogy jobb, de nem tudja senki, hogy miért. "

Erre egyrészt az a válasz, hogy erről megoszlanak a vélemények, másrészt meg az, hogy ott van mondjuk a vanishing gradient effect.

Szerintem meg a C) válasz ér igazából, tehát hogy bakker, ez alkalmazás (gyakorlati tudomány, ha tetszik), ahol per def elég, ha stabilan jobban működik. Aztán ha van elméleti háttér, az jó, de ha nincs, az se nagy kár, anything goes.

"Kísérletezés folyik inkább, mint elméleti alapozás"

Ezen tényleg meglepődtél? :-)

(De azért itt inkább arra kell gondolni, hogy a kísérleti validálás elengedhetetlen még egy matematikailag jól hangzó elmélet esetén is; ki ne találjuk már, hogy a Hinton-féle előtanítás csak úgy lóg a levegőben mindenféle elméleti-matematikai alap nélkül.)

"én pedig az elméleti eredményekre kérdeztem rá. "

Just for the record, nem. (Miért a hirtelen ellenséges hangnem, egyébként?) Te arra kérdeztél rá, hogy mi nem volt még 20-30 évvel ezelőtt.

Amire a válasz a fönti hármas, és persze, a 3)-as pontot tovább lehet bontani elméleti meg gyakorlati részre, amelyek különböző mértékben nem álltak rendelkezésre 20-30 évvel ezelőtt. Persze, perceptron volt már a 80-as években is, és az is nyilvánvaló, hogy adat meg vas nélkül mindegy is, hogy elméletileg vagy algoritmikailag mennyire álltak volna akkor készen a mai dolgokra, mivel nem volt adat meg vas; de mind elméleti, mind algoritmikai áttörés bizony volt. (Ez leginkább onnan látszik, hogy a DNN-ek megjelenésekor-elterjedésekor volt egy ugrás, az adat/CPU viszont előtte és utána is folyamatosan fejlődött.)

közösperonos átszállás 2018.02.22. 19:00:36

@ámbátor: "Józan ember nem mondja, hogy minden kész volt 30 éve, de az alapjai ott voltak,"

Józan ember nem mondja, hogy a mostani hype alapjai nem voltak ott már 30 éve. :-)

"a legfontosabb AI területeket akkor pisálták körbe: képfeldolgozás, beszédfeldolgozás, természetes nyelvek kezelése, szakértö rendszerek, gépi fordítás, szabály alapú rendszerek, neurális hálók."

A rosseb tudja, ez igazából tényleg attól függ szerintem, hogy hogyan építi fel a mesélő a történetet. A föntiek közül egyes területeket már az 50-es évek óta pisálnak körbe szorgalmasan, egyes területek (pl. autóvezetés-segítők) csak a közelmúltban kezdtek körbepisálni; egy részük feladat, egy részük terület, egy részük meg alkalmazott technika, amiből aztán tényleg esetleges, mit meddig tekintünk ugyanannak (megintcsak: a DNN csak egy sima ANN, vagy minőségileg más? Nem nagyon szeretnék IRL-ezni, ezért nem hoznék pontosabb példákat a saját területemről, de a sima ANN-eket pl. általában szinte a kutya se használta, mert a GMM-eknél nem voltak jobbak, most meg ugye).

Ráadásul írásfelismerésen is érthetünk egyforma négyzetekbe rajzolt amerikai stílusú számjegyeket meg tetszőleges, folyóírással megalkotott ZH-macskakaparás elolvasását; képfeldolgozás a Lennával játszadozás is meg a reptéren mászkáló emberek követése is (az összesé, természetesen), de azért a kettő mégis ég és föld. Nem csak az adatmennyiségben különböznek. Ahogy nő egy rendszer pontossága, úgy kezdik kiterjeszteni a használatát nehezebb területekre is, ahol persze szarul fog teljesíteni és hegesztgetni kell; és harminc év múlva bizony az architektúra is csak madártávlatból fog majd bizonyos fokú hasonlóságot mutatni.

A szabályalapú rendszereken amúgy nem tudom, mit értesz; amit én értek rajta így előszörre, az pont kikopott mostanra, mert a külső/emberi tudás fokozott bevitelére szolgáltak, amit azóta az adat/vas/algoritmus hármas fejlődése miatt a statisztikai alapú tanulás a legtöbb területen alapvetően megvert (részben pontossága miatt, de nyilván az "olcsóság" is játszik).

"aztán hardver és adat híján a gyakorlati megvalósulásuk megrekedt, de az algoritmusokon okos fickók papíron ceruzával meg a mindenkori vasakat feszegetve bütyköltek tovább"

Itt látok egy lényegi elemet. Itt alkalmazott tudományról beszélünk; teljesen mindegy, milyen képzelt fémmel számolja ki valaki, hogy milyen elegáns házat lehetne olyan szerkezettel felhúzni, a statikusok kiröhögik, és alappal. (Ez az én szubjektív véleményem persze.) Ugyanígy, akármilyen frappánsan old meg valaki egy (megengedem: még) nemlétező problémát, azt kísérleti igazolás nélkül (és hát probléma nélkül hogy is lenne igazolható) a szakma joggal tartja egyszerű szellemi maszturbálásnak.

A dolog szemmel láthatóan úgy működik, hogy a most előálló problémát kell megoldani, a most rendelkezésre álló hardverrel, és a túlnyomó többség ezt tudja is. Meg eleve is, nincs értelme azon agyalni, hogy hogyan tudnád hatékonyan tanítani a DNN-edet, ha két nagyságrenddel több adatod lenne, mint bárkinek, akit ismersz, hogyha nem tudod (mert nem is tudhatod), hogy olyan sok adattal egyáltalán mehetsz-e bármivel többre egy DNN-nel, mint most. (Azaz: lehet, hogy a probléma, amivel küzdesz, a jövőben sem merül fel soha még hasonló formában is.) Szűk húsz éve épp az SVM volt nagy szám, aztán meg az AdaBoost.

Pont ezért szerintem amit írtál, az nem áll, mivel ez nem pont egyenrangú kapcsolat; tehát hogy

"és mostanság kezd odaérni, hogy összeér a vas, az adat meg az algoritmus"

...az ugyan szó szerint igaz, de ez úgy működik, hogy ha van vas meg adat, AKKOR kell az algoritmus. Előtte nem nagyon szokott megjelenni, szerintem a fönti okok miatt (tehát hogy a kísérleti validáció elengedhetetlen, és hogy adat híján fogalmad sem lehet, hogy az irány, amerre elindultál, jó lesz-e). És még egyszer: az adat és a vas szép fokozatosan gyűlt előtte is meg utána is; de azt a pontot, amikor bejött a DNN, meg fogod találni a hibagörbéken.

ámbátor 2018.02.22. 22:00:05

@közösperonos átszállás: Mert a DNN mint deus sexmasinája jelent meg ugye pallas athéné fejéből kipattanva. Vagy mi.
en.wikipedia.org/wiki/Deep_learning#History
yann.lecun.com/exdb/lenet/

Amúgy én valamikor a kilencvenes években már élesben használtam NN alapú kézzel írt számjegy felismerőt tömeges űrlap feldolgozásban. 98-99%-os pontosságot tudott és lépést tartott egy ipari szkennerrel. Mondjuk űrlaponként pár tucat számjegy volt fix helyen, szóval nem kellett keresgélni a felismernivalót.

közösperonos átszállás 2018.02.23. 08:12:46

@ámbátor: "Mert a DNN mint deus sexmasinája jelent meg ugye pallas athéné fejéből kipattanva. Vagy mi."

Erre mondhatnám, hogy józan ember nem mondja, hogy a mostani hype alapjai nem voltak ott már 30 éve, de pont az előbb már mondtam is. :-)

Pontosan mit állítasz? Mert én azt, hogy "a DNN nem ``csak egy nagyobb ANN'' " (ez van föntebb is), és látszólag velem szálltál vitába, tehát ezt kellene vitatnod.

"Mondjuk űrlaponként pár tucat számjegy volt fix helyen, szóval nem kellett keresgélni a felismernivalót."

Erre utaltam az előbb, hogy a kézírás-felismerésen most már nem azt értik, mint húsz éve, hanem hogy nesze egy folyóírás. (Természetesen HMM is volt már húsz éve.)

ámbátor 2018.02.23. 11:25:40

@közösperonos átszállás: Nem hiszem, hogy nagy vitánk van.
Csak annyit próbáltam jelezni, hogy nem arról van szó, hogy a HW meg az adat egyre gyült, aztán egy kedd reggel jött a DNN és megoldotta a keleti kérdést. Az algoritmusok ugyanúgy szervesen fejlödtek, a DNN már a nyolcvanas években ott volt mint elmélet, és még gyakorlati alkalmazásai is voltak. Mégis, amikor mindhárom összetevö eljutott a mai szintre, akkor léptünk át egy olyan küszöböt, amitöl hirtelen az AI megint sikkes lett, és már nagyobb arányban tudja teljesíteni az ígéreteit, mint azelött.
A számjegyfelismerés nem lett kevésbbé AI feladat attól, hogy müködik. Nem szeretem azt az AI definiciót, hogy az AI mindig csak az, ami még nem megy. Vannak AI feladatok, amiket már rutinszerüen használunk. Attól, hogy Alexa meg Siri ágyba hozzák a kávét nem lett kevésbbé AI feladat az, hogy már tizenöt éve minden mobiltelefon tud hangvezérléssel tárcsázni.
www.voicebot.ai/2017/07/14/timeline-voice-assistants-short-history-voice-revolution/
Nyilván a megoldott feladatokon már nincs mit rágni, tovább lehet lépni, komplexebb feladatokra. Sakkról a GO-ra, onnan már nem tudom hova. önvezetö metróról az önvezérlö autókra, onnan majd az interaktív közlekedési rendszerekre. De valójában nincs törés, vagyis inkább ugrás a fejlödésben, csak érzésre, publicitásra. Egyik megoldott feladatból szervesen jön a következö.

közösperonos átszállás 2018.02.23. 20:03:25

@ámbátor: "Az algoritmusok ugyanúgy szervesen fejlödtek, a DNN már a nyolcvanas években ott volt mint elmélet, és még gyakorlati alkalmazásai is voltak."

Én ezzel annyiban vitáznék, hogy az anno ANN volt, a DNN pedig valóban hirtelen pattant elő a fiókból, és ugrásszerű változást hozott.

Amihez egyrészt kellett a HW és adat folyamatos fejlődése, másrészt személy szerint azt sem hinném, hogy az ANN-DNN váltás minőségi fejlődés lett volna (te sem állítottad; pont azt mondom, hogy sokan hisznek ebben, de sem te, sem én nem). Mennyiségi fejlődés volt; abból nagyságrendi, de nem valami gyökeresen új dolog, csak sokkal jobb, mint ami előtte volt. (És a sokkal is relatív, 20% már nagyon sokkal jobb.)

"Sakkról a GO-ra, onnan már nem tudom hova."

Atari játékokra? :-)

(De tényleg, nem vagyok biztos benne, hogy gépi tanulási szempontból a GO vagy egynéhány ilyen ősi joystick-gyilkos játék a nehezebb.)