Karen Spärck Jones para niños
Datos para niños Karen Spärck Jones |
||
---|---|---|
![]() Karen Spärck Jones en 2002
|
||
Información personal | ||
Nacimiento | 26 de agosto de 1935 Huddersfield, Yorkshire |
|
Fallecimiento | 4 de abril de 2007 Cambridgeshire |
|
Causa de muerte | Cáncer | |
Residencia | Reino Unido | |
Nacionalidad | británica | |
Familia | ||
Padres |
Owen Jones Ida Spärck |
|
Cónyuge | Roger Needham (desde 1958) | |
Educación | ||
Educada en | Universidad de Cambridge | |
Supervisor doctoral | R. B. Braithwaite | |
Información profesional | ||
Ocupación | Informática teórica, profesora de universidad e investigadora de la inteligencia artificial | |
Área | Ciencias de la computación | |
Conocida por | trabajar en recuperación de datos y procesador de lenguajes naturales, en perticular su modelo probabilístico de documentos y recuperación de textos | |
Empleador | Laboratorio de Computación (en la Universidad de Cambridge) | |
Miembro de |
|
|
Sitio web | www.cl.cam.ac.uk/archive/ksj21 | |
Distinciones | ACL Lifetime Achievement Award, medalla BCS Lovelace, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit | |
Karen Spärck Jones (26 de agosto de 1935 – 4 de abril de 2007) fue una destacada científica británica. Se especializó en lingüística computacional y fue una pionera en el campo de la recuperación de información.
Contenido
¿Quién fue Karen Spärck Jones?
Karen Spärck Jones nació en Huddersfield, una ciudad en Yorkshire, Reino Unido. Su padre, Owen Jones, era profesor de química. Su madre, Ida Spärck, tuvo que dejar Noruega y mudarse al Reino Unido durante la Segunda Guerra Mundial.
Sus primeros años y educación
Karen asistió a la escuela primaria en Huddersfield. Después, estudió en el Girton College de la Universidad de Cambridge desde 1953 hasta 1956. Allí estudió Historia y luego un año más de Ciencias Morales, que es como se conoce a la filosofía.
Al principio, Karen trabajó como maestra de escuela. Sin embargo, poco después, comenzó a interesarse por la informática. A lo largo de su carrera, siempre animó a más mujeres a estudiar y trabajar en esta área.
Su carrera en la informática
Karen Spärck Jones inició su carrera de investigación en la década de 1950. Su primer trabajo importante fue desarrollar un tesauro para la Unidad de Investigación en Lenguaje de la Universidad de Cambridge. Un tesauro es como un diccionario de sinónimos y palabras relacionadas.
En 1964, obtuvo su doctorado con una tesis llamada Sinonimia y clasificación semántica. En este trabajo, combinó técnicas de estadística y probabilidad con el estudio del lenguaje. Su forma de abordar el tema fue muy innovadora para su época.
Gracias a varias becas de instituciones como la Royal Society y la Biblioteca Británica, pudo seguir investigando. En 1974, se unió al Laboratorio de Informática de la Universidad de Cambridge. Trabajó allí hasta su jubilación en 2002, y continuó colaborando hasta poco antes de su fallecimiento en 2007 en Willingham, Cambridge.
¿Qué aportó Karen Spärck Jones a la ciencia?
Karen Spärck Jones hizo contribuciones muy importantes al campo de la recuperación de información. Esto es clave para entender cómo funcionan los buscadores de internet hoy en día.
La importancia de las palabras: ITF e IDF
Ella fue pionera en la indización automatizada. Esto significa que creó una forma para que las computadoras entendieran la importancia de cada palabra en un documento. A esto se le llamó indización ponderada o por pesos.
Uno de sus inventos fue el algoritmo ITF (inverse term frequency). Este algoritmo calcula la importancia de una palabra en un documento. Lo hace viendo cuántas veces aparece esa palabra en comparación con el resto de las palabras del texto. Las palabras que aparecen demasiado (como "y", "o", "el") o muy poco no se consideran importantes para describir el contenido.
Este trabajo llevó a un algoritmo aún más importante: el IDF (inverse document frequency). Este funciona de manera similar, pero se aplica a todos los documentos de una base de datos documental. Con el IDF, los sistemas pueden ordenar los documentos por su relevancia cuando alguien hace una búsqueda.
El modelo probabilístico de búsqueda
El diseño de Karen Spärck Jones fue el inicio del modelo probabilístico de recuperación de información. Ella lo desarrolló junto a Stephen Robertson. Este modelo ha sido fundamental y ha sido continuado por otros investigadores como Keith van Rijsbergen, Peter Ingwersen y Ricardo Baeza-Yates.
Publicaciones destacadas
Karen Spärck Jones escribió varios libros y muchos artículos científicos. Algunas de sus obras más conocidas incluyen:
- Automatic keywords classification for information retrieval. Londres: Butterworths, 1972.
- Information retrieval experiment. Londres: Butterworths, 1981.
- Readings in information retrieval (escrito con Willett). San Francisco: Morgan Kaufmann.
También publicó artículos importantes en revistas científicas, como:
- A statistical interpretation of term specificity and its application in retrieval (1972) en Journal of Documentation, nº 28.
- Index term weighting (1973) en Information Storage and Retrieval, nº 9.
Reconocimientos y premios
Karen Spärck Jones recibió muchos premios por su trabajo, entre ellos:
- El Premio Gerard Salton en 1988.
- El Premio ASIST al Mérito Académico en 2002.
- El Premio a la trayectoria de una vida investigadora de la ACL, que es la asociación internacional más importante en Lingüística computacional.
- El Premio Allen Newell de la ACM-AAAI en 2007.
- La Medalla Lovelace en 2007, que recibió poco antes de fallecer.
Véase también
En inglés: Karen Spärck Jones Facts for Kids