Watson Ameriketako Estatu Batuetako IBM enpresak garatutako adimen artifizialeko sistema informatiko bat da, lengoaia naturalean eginiko galderei erantzuteko gai dena.[1] David Ferrucci ikertzaile nagusiak zuzendutako DeepQA proiektuaren barnean kokatzen da Watson. Izena Thomas J. Watson IBMren sortzaile eta lehen buruaren omenez jarri zitzaion.[2][3]
Watsonek galderei erantzun bat bilatzen die bere datu-base lokal[4] erraldoiari esker, informazioa biltzeko hainbat iturri hartuta: entziklopediak, hiztegiak, berriak, artikuluak, literatura-lanak eta kanpoko datu-baseak. Taxonomia eta ontologiak ere erabiltzen ditu, Dbpedia, WordNet eta Yago hain zuzen.[5]
Watsonen benetako abilezia probatzeko asmoarekin, 2011ko otsailean Estatu Batuetako telebistako Jeopardy! lehiaketan parte hartu zuen , bere aurkariei (Brad Rutter, txapelketaren historian diru gehien irabazi duen parte-hartzailea; eta Ken Jennings, bata bestearen ondoren saio gehien irabazi dituen parte-hartzailea).[6][7] Guztira, Watsonek milioi bat dolar irabazi zuen, eta sari hau World Vision eta World Community Grid karitateen artean banatu zuen IBMk. Rutter eta Jenningsek ere beren sarien (300000 eta 200000 dolar, hurrenez hurren) erdia karitateei eman zieten: lehenak VillageReach-i eta bigarrenak Lancaster County Community Foundation-i.[8]
Nahiz eta Watsonek atal gehienetan gizakiek baino hobeto erantzun, hitz gutxiko pista motzekin arazoak izan zituen. Pista bakoitza jasotakoan, probablitate handiena zuten erantzunak telebista-pantaila batean erakusten zituen Watsonek. Jokoan zehar, 200 milioi eduki-orrialde izan zituen eskuragarri, datu egituratu eta ez-egituratuak, ingelesezko Wikipedia[9] osoa barne, lau terabyte[10] informazio guztira. Watsonek ez zuen Interneterako konexiorik izan lehiaketak iraun zuen bitartean.[11][12]
Watson question answering sistema bat da, hau da, bere funtzioa erantzunak bilatzea da. IBMk Watson “lengoaia naturalen prozesamendua, informazio bilketa, ezagutzaren errepresentazioa, arrazoiketa automatikoa eta ikasketa automatikoa erantzunen bilaketaren eremu irekian aplikatzen dituen teknologia aurreratuen sistema” bezala deskribatzen du. Watson “IBMren DeepQA teknologia erabiliz eraikia da, hipotesiak sortzeko, probak masiboki biltzeko, analisirako eta kalifikaziorako”.[1]
« | Dokumentu bilaketaren eta QA teknologiaren arteko ezberdintasun garrantzitsuena da lehenak hitz-gako bat jasota egokitasunaren arabera sailkatutako dokumentu zerrenda bat itzultzen duela (askotan dokumentu ezagunenak aukeratuz) eta bigarrenak berriz lengoaia naturalean adierazitako galdera bat jasota modu zehatzagoan ulertzen saiatzen dela, erantzun zehatz bat itzuliz.[14] | » |
Craig Rhinehart, IBMko negozio estrategia eta merkatu garapen arduraduna |
IBMren esanetan, Watsonek ondorengo ezaugarriak ditu:
Hardwarearen kostu totala hiru milioi dolar ingurukoa izan zen, Tony Pearson IBMko kontsultore seniorraren esanetan.[18] Informazioa RAM memorian gorde zen txapelketarako, disko gogorren atzipen-abiadura oso motela estimatu zelako.[17] Softwarea Java eta C++ lengoaietan programatu zen, Apache Software Foundation-en Hadoop eta UIMA sistemak erabiliz. Erabilitako sistema eragilea SUSE Linux Enterprise Server 11 izan zen.[10][19][20] Watsonek 100 teknika baino gehiago erabiltzen ditu lengoaia naturala aztertzeko, iturriak identifikatzeko, hipotesiak topatu, sortu, konbinatu eta klasifikatzeko, eta ebidentziak bilatu eta puntuatzeko.[21]
Jeopardy txapelketak ezarritako baldintzak betetzeko, Watson sistemak txapelketako aurkezleak galdera bakoitza irakurri arte itxaron behar zuen, erantzuna erabakitakoan burrunbagailua sakatzeko, sakatzen lehenak erantzuteko aukera lortuz.[12][22] Watsonek testu elektronikoen bidez jasotzen zituen galderak (beste parte-hartzaileek jasotzen zituzten aldi berean)[12] eta, ondoren, lengoaia naturala prozesatzeko hainbat algoritmo martxan jartzen zituen, pistatik ateratako zatiekin bat zetozen esaldiak bere datu-basean estatistikoki bilatuz.[12]Erantzuna eman aurretik, algoritmoetatik jasotako erantzunak datu basearekin konparatzen zituen erantzun horiek baliozkoak ziren ala ez erabakitzeko. Erantzuteko orduan, Watsonek algoritmoetatik jasotako erantzun errepikatuena aukeratzen zuen, aurkezleari ahots elektroniko baten bidez erantzuna emanez. Watsonen indarra ez zen algoritmo berri baten garapena izan, algoritmo asko aldi berean exekutatzeko ahalmena baizik.[12][23]Beste faktore erabakigarri bat erantzute-abiadura azkarra izan zen, gizakiek irabazteko zuten aukera bakarra Watsonek erantzuna entzuten amaitu aurretik erantzutea izan baitzen askotan.[24]
Watsonen garapena ekarri zuten baldintzak Deep Blue konputagailuak Gari Kasparov xakeko Nazioarteko Maisu Handiaren aurka 1997ko maiatzaren 11n lortutako garaipenaren ondorioz sortu ziren. IBM, arrakasta honen ondoren, erronka berrien bila hasi zen, 2004an Charles Lickel ikerkuntza kudeatzaileak lagunekin jatetxe batean afaltzen ari zela telebistan Ken Jenning Jeopardy! lehiaketan parte hartzen ikusi zuen arte. Lehiaketa hau IBMrentzako desafio berria bihurtzeko ideia aurkeztu zuen Lickelek, eta 2005ean Paul Horn IBMko ikerkuntza exekutiboak proiektu honetan parte hartzeko bere saileko kide bat konbentzitzeko bere babesa eman zion. Nahiz eta hasieran itxuraz xake jokoa baino askoz ere konplexuagoa zen problema honi heltzeko prest zegoen inor topatzea zaila izan zen, azkenik David Ferrucik eskaitza onartu zuen.[25] Watsonen aurretik Piquant izeneko sistema garatu zuten, zeinak Estatu Batuetako gobernuak antolatutako hainbat lehiaketatan parte hartu zuen, hori bai, jokoko pisten % 35 bakarrik asmatuta eta erantzuteko hainbat minutu behar izanda.[26][27][28] Benetako Jeopardy! Lehiaketan parte hartzeko, Watson segundo gutxian erantzuteko gai izan behar zen, eta une hartan jokoaren problemak ebatzi ezinak zirela ikusi zen.
2006an David Ferruci Analisi eta Integrazio Semantikorako IBMren kudeatzaileak aurrera eramandako probetan Watsonek iraganeko 500 Jeopardy! jokotako pistak jaso zituen. Giza parte-hartzaile onenak pisten % 95i ondo erantzuteko gai zirelarik, lehen proban Watsonek % 15 besterik e zuen asmatu ahal izan. 2007an, Watsonen garapen taldeak problema ebazteko 3-5 urte eta 15 kide beharko zituztela[12] aurreikusi zuen. 2008 urterako, taldeak aurrerapen handiak egin zituen, Watson Jeopardy!-ko txapeldunen aurka lehiatzeko gai izateraino.[12] 2010eko otsailerako, Watson txapeldunak garaitzeko gai zen.[29]
Nahiz eta nagusiki IBMren proiektua izan, Watsonen garapen taldearen parte dira Carnegie Melloneko, Massachusettseko Amhersteko, Kalifornia Hegoaldeko Informazio Zientzietako Institutuko, Texaseko Austingo, Massachussetseko Institutu Teknologikoko (MIT), Trentoko eta Rensselaer Institutu Politekniko Unibertsitateetako hainbat irakasle eta ikasle.
2008an, IBMko ordezkariak Jeopardy!-ko ekoizle exekutibo Harry Friedmanekin harremanetan jarri ziren, Watson eta lehiaketako bi parte-hartzaile arrakastatsuenak ziren Ken Jennings eta Brad Rutteren artean lehiaketa bat aurrera eramateko ideia eztabaidatzeko. Friedman ados egon zen ideiarekin.[12][30] Watsonen eta giza parte-hartzaileen arteko ezberdintasunek gatazka eragin zuten IBMren eta Jeopardy!-ko arduradunen artean lehiaketaren antolakuntzan zehar. IBMk kezka erakutsi zuen gidoilariek galderak egiterako orduan erabil zezaketen moduaren inguruan[31]: izan ere, Watsonen ezaugarri kognitiboak esplotatu zitzazketela iruditu zitzaien, jokoa Turingen Test bat bihurtuz. Arazo hau ekiditeko, hirugarren batek idatzi baina inoiz eman ez ziren saioetako pistak hautatu zituen ausaz.[31] Halaber, Jeopardy!-ko taldeak burrunbagailuaren erreakzio-denboraren inguruan kezka erakutsi zuen: Watsonek hasieran sistema elektronikoa erabiltzen zuen, baina botoia mekanikoki sakatu behar zela erabaki zuten, giza parte-hartzaileek bezala.[32] Edonola, behatz robotikoa erabiliz, Watsonen erreakzio denbora gizakiena baina azkarragoa izan zen.
Watson prestatzeko helburuarekin, Jeopardy!-ko platoaren simulakro bat eraiki zuten IBMren zentro teknologiko bateko konferentzia gelan. Simulakro hauetan hainbat gizakik, horien artean Jeopardy!-ko txapeldun ohiek, parte hartu zuten[12], eta Watsonek jokoen % 65 irabazi zituen.[33]
2011ko urtarrilean saio ofizialak grabatu ziren, eta otsailean eman ziren.
IBMren arabera, Watsonen helburua konputagailuek gizakiekin elkarrekintza naturala izatea ahalbidetzea da, hau da, gizakien galderak ulertu eta gizakiek ulertu eta justifikatzeko moduko erantzunak ematea, hainbat aplikazio eta prozesu erabiliz.[29]
IBM eta Nuance Communications Inc. ikerkuntza proiektu bateratua aurrera eramaten ari dira, 18 eta 24 hilabete bitartean diagnostikoan eta tratamenduan laguntzeko erabaki klinikoetarako sistema laguntzaile komertzial bat garatzeko. Columbiako Unibertsitateko medikuak medikuntzaen praktikan arazo kritikoak identifikatzen laguntzen ari dira, Watsonek non lagun dezakeen erabakitzeko helburuarekin. Marylandeko Unibertsitatekoak berriz Watson bezalako sistema teknologiko batek medikuekin ahalik eta elkarrekintza emankorrena izateko modua zein izan daitekeen aztertzen ari dira.[34] IBMko kontseilari nagusi Robert C. Weberrek Watson lege-ikerketetan erabil litekeela ere proposatu du.[35]
Watsonek 2010eko otsailetik eskuragarri dauden IBM Power 750 zerbitzariak erabiltzen ditu. IBMk hainbat milioi dolarreko prezioa duen DeepQA softwarea korporazio handiei saltzeko asmoa ere badu. Izan ere, Watson exekutatzeko baldintza minimoak dituen zerbitzari baten prezioa milioi bat dolarrekoa da, nahiz eta IBMk hamarkada batean, teknologia garatu ahala, prezioak asko jaitsiko direla aurreikusten duen.[12]