Biografia | |
---|---|
Naixement | 26 agost 1935 Huddersfield (Anglaterra) |
Mort | 4 abril 2007 (71 anys) Willingham (Anglaterra) |
Causa de mort | càncer |
Nacionalitat | Britànica |
Formació | Girton College, Cambridge Universitat de Cambridge |
Director de tesi | DC Comics i R. B. Braithwaite |
Es coneix per | treballar en recuperació d'informació i processament de llenguatge natural, en particular el seu model probabilístic de documents i recuperació de dades |
Activitat | |
Camp de treball | Ciències de la computació |
Ocupació | informàtica, professora d'universitat, investigadora d'intel·ligència artificial |
Ocupador | Newnham College Wolfson College |
Membre de | |
Família | |
Cònjuge | Roger Needham |
Premis | |
ACL Lifetime Achievement Award, medalla BCS Lovelace, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit | |
Lloc web | cl.cam.ac.uk… |
Karen Spärck Jones (26 d'agost de 1935 – 4 d'abril de 2007) va ser una científica britànica especialitzada en lingüística computacional. Investigadora pionera en recuperació d'informació.
Karen Spärck va néixer en Huddersfield (Yorkshire). Filla d'Owen Jones, professor en química, i Anada Spärck, que va escapar de Noruega al Regne Unit durant la Segona Guerra Mundial. Spärck Jones fou educada en una escola primària de Huddersfield i posteriorment en el Girton College (Cambridge) des de 1953 fins a 1956, va estudiar Història i un any addicional sobre Ciències Morales (filosofia). Llavors va començar a treballar com a mestra a l'escola, però poc després va començar a treballar en informàtica. Durant tot el temps que va estar dedicant-se a la informàtica va impulsar notablement que més dones entressin en aquesta disciplina.
Va començar la seva carrera investigadora el 1950 desenvolupant un tesaurus per a la Unitat de Recerca en Llenguatge de la Universitat de Cambridge. El 1964 es va doctorar amb una tesi titulada Sinonímia i classificació semàntica utilitzant tècniques estadístiques i probabilístiques combinades amb tècniques lingüístiques.[1] El seu enfocament va ser pioner en la matèria.
Va poder seguir investigant en recuperació d'informació gràcies a les diferents beques que li van ser concedides per institucions com la Royal Society o la Biblioteca Britànica, fins que va fitxar pel Laboratori d'Informàtica de la Universitat de Cambridge on va treballar des de 1974 fins a la seva jubilació en 2002, encara que va seguir treballant allí fins a poc abans de morir per càncer en 2007, en Willianghan (Cambridge).
Va estar casada amb Roger Needham des de 1958 fins a la defunció d'aquest en 2003.[2]
Karen Spärck Jones va liderar la indexació automatitzada creant un indicador capaç de trobar la importància informativa d'una paraula per a un document; el que es cridaria a partir de llavors com indización ponderada o per pesos. Aquest algorisme anomenat ITF (inverse term frecuency o freqüència inversa del terme) obté la importància d'un terme depenent del nombre de vegades que aparegui en el document en relació amb la resta de termes que aquest tingui. Aquest algorisme rebutja les paraules que apareguin tant a l'excés (paraules funcionals de la llengua com a preposicions o conjuncions) com per defecte (paraules amb unes poques aparicions), en considerar que no aporten valor informatiu suficient com per descriure el contingut del document.[3]
Aquest indicador donaria pas a un altre més important encara: el IDF (inverse document frecuency o freqüència inversa del document) el procediment del qual és similar a l'anterior però que s'empra en tots els documents d'una base de dades documental. Amb aquest algorisme obtindríem ordenats de major a menor rellevància els documents oposats en respondre a una consulta. Aquest disseny va ser el principi del model probabilístic de recuperació d'informació, desenvolupat per Spärck Jones i Stephen Robertson, i continuat per altres investigadors com Keith van Rijsbergen, Peter Ingwersen o Ricardo Baeza-Yates.[4]
Algunes de les seves obres són:
Va publicar nombrosos articles en prestigioses revistes de recerca científica, entre altres:
Va ser guardonada amb nombrosos premis, entre ells: