-->
Una biblioteca es memoria, diálogo y luz, un estímulo constante para ejercer la pura alegría de leer. Emilio Lledó.

domingo, 25 de mayo de 2014

Prueba de vocabulario

¿Cuantas palabras del español conoces? Al realizar esta prueba, en 4 minutos tendrás una estimación válida de tu vocabulario y ayudarás a la investigación científica.

En esta prueba se te presentarán 100 cadenas de letras, algunas de las cuales son palabras reales del español, y otras son palabras inventadas (no palabras). Tu tarea consiste en indicar si cada cadena de letras es, o no, una palabra del español. Si conoces la palabra presiona la tecla J y si no la conoces la tecla F.

  • J: Conozco esta palabra           F: No conozco esta palabra
La prueba durará unos 4 minutos. Puedes repetirla tantas veces como quieras (Se te presentarán nuevas cadenas de letras cada vez que repitas la prueba).

¡Recomendación!: No presiones la tecla J (respuesta SI) a las palabras que no conoces, porque las respuestas SI a palabras que no existen en español penalizarán mucho tu puntuación.

Podrás completar una serie de preguntas (*) sobre tu perfil antes de comenzar la prueba para ayudar en la investigación del conocimiento del vocabulario del español en el mundo. No obstante, puedes realizar la prueba sin responder a las preguntas, pero si no las contestas no podrán incluir tus datos en los estudios científicos que publicarán.

Cuando realices la prueba obtendrás una puntuación corregida: porcentaje de sí (aciertos) en las palabras correctas menos porcentaje ponderado de sí (errores) en las palabras inventadas. Y tendrás listados con tiempo de respuesta de: Palabras que no conocías, Palabras inventadas a las que respondiste SI, Palabras que conocías y Palabras inventadas a las que respondiste NO.

También podrás colaborar en un estudio sobre asociación de palabras.

FAQs de la prueba:

¿Cuántas palabras reales e inventadas se incluyen en la prueba?

El conjunto inicial incluye 57.275 palabras reales y 57.275 palabras inventadas. A partir de ese conjunto inicial obtienes una muestra aleatoria de 70 palabras reales y 30 inventadas. La lista de palabras reales debería contener así todas las palabras del español (formas no flexionadas). No contiene nombres o expresiones hechas. Si piensas que hay alguna palabra rara que deberíamos incluir en la prueba, por favor escríbela aquí.

¿Puedo realizar la prueba más de una vez?

Sí, puedes realizar la prueba tantas veces como quieras. Cada vez que realices la prueba se te presentará una nueva lista de palabras reales e inventadas (no palabras).

¿Cuántas palabras conoce la gente?

Esta es una de las preguntas que nos gustaría responder con esta prueba. No obstante, teniendo en cuenta estudios similares en inglés y en holandés, estimamos que un hablante nativo con buen dominio de la lengua conoce en torno a 40.000 palabras, un 67%. La gente mayor conoce más palabras que los jóvenes. La situación es diferente con los hablantes no nativos. En lo que respecta a hablantes de español como segunda lengua, nuestras estimaciones varían entre 6.000 palabras (10%) para hablantes con un dominio medio y 20.000 (33%) para hablantes con un dominio alto del idioma.

La prueba contiene una palabra que no existe.

La lista de palabras se confeccionó a partir de un análisis de corpus muy voluminoso que construimos. Es posible que se haya escapado a nuestro filtrado alguna palabra que no existe en español (aunque la probabilidad es baja). Si tienes dudas consulta el diccionario de la Real Academia Española. Si no la encuentras, háznoslo saber para poder corregir el error enviando feedback.

La prueba contiene una palabra inventada que es una palabra real del español.

Aunque hemos intentado cuidadosamente no incluir palabras reales en la lista de palabras inventadas (no palabras), la experiencia nos dice que esta es la parte más débil de la prueba. Es posible que alguna de las 57.275 palabras inventadas (no palabras) se utilice como palabra en alguna parte del mundo. Por favor, ayúdanos enviando feedback sobre las no-palabras problemáticas, de forma que podamos descartarlas de la prueba. Naturalmente, puedes corregir tu puntuación si se ha utilizado una no-palabra erróneamente en tu lista. Simplemente añade 3.3% a tu puntuación.

He presionado otra tecla ¿Puedo corregir el error?

Desafortunadamente no. Lo mejor que puedes hacer es repetir la prueba y ser más cuidadoso esta vez.

He realizado la prueba dos veces y he obtenido resultados diferentes.

Hay un cierto grado de ruido en la estimación que obtienes después de la prueba, debido a la muestra particular de palabras y no palabras que se te ha presentado. Por eso, es normal que las puntuaciones en dos pruebas sean ligeramente diferentes. El error se reduce si realizas la prueba varias veces y calculas el valor promedio de ejecución en las diferentes ocasiones. Estamos seguros que tu puntuación promedio después de 10 sesiones será muy similar a la puntuación promedio obtenida a partir de otras 10 nuevas sesiones.

¿Quién ha organizado la prueba y qué ocurrirá con mis resultados?

Esta prueba está organizada por el BCBL (Basque Center on Cognition, Brain and Language), ubicado en Donostia-San Sebastián (España), www.bcbl.eu, en colaboración con el Center of Reading Research de la Universidad de Gante (Bélgica). El objetivo es investigar qué palabras se conocen, cuánto se tarda en reconocer palabras, y qué características de las mismas predicen sus tiempos de procesamiento. Tus resultados se utilizarán para lograr dichos objetivos. Publicaremos los resultados en revistas científicas. Puedes encontrar las publicaciones de ambos grupos en nuestras páginas webs (http://www.bcbl.eu y http://crr.ugent.be).

(*) Las preguntas son: Edad, Sexo, ¿En qué lugar has pasado los primeros años de tu vida?, ¿Cuál es tu nivel de estudios?, ¿Cual es tu conocimiento del español?, ¿Cuál es tu lengua materna?, ¿Cuantas lenguas hablas además del español y de tu lengua materna si ésta no es el español?, ¿Cuál de estas lenguas hablas mejor?, ¿Eres zurdo o diestro?, Estoy de acuerdo en compartir mi geo-localización.

martes, 20 de mayo de 2014

Un problema grave de anumerismo en los sorteos públicos aleatorios

En los concursos públicos suele haber una serie de criterios de selección que permiten ordenar a los candidatos. Sin embargo, a veces estos criterios no son suficientes y surgen candidatos con puntuaciones equivalentes. Ante tal situación se hace necesario escoger a los ganadores mediante sorteo.

Desgraciadamente, los sorteos no son todo lo justos que podrían ser, y además, lo son por causas totalmente injustificadas. Uno de los casos más frecuentes se da cuando el criterio de selección está ligado al orden lexicográfico de nombres y/o apellidos de los candidatos.

Clara Grima nos explica de forma detallada y amena en uno de sus artículos por qué los sorteos basados en las letras del apellido son absolutamente injustos: http://www.jotdown.es/2013/05/la-importancia-de-llamarse-grima/

Vamos a explicar con el mismo ejemplo del anterior artículo, pero con datos de nuestro centro, por qué estos sorteos en los que se saca una bola con una letra y a partir de ahí, en el orden convenido, se elige a los aspirantes según su apellido o apellidos son del todo injustos.

Usemos la lista pública de alumnos de 4º ESO de nuestro centro con algún "añadido".


Imaginemos que, por sorteo, vamos a elegir a uno de los alumnos para concederle un viaje cultural. Sacamos una letra y elegimos al primero, por orden descendente, por el primer apellido.

Pues bien, Roldán Galisteo no tiene papeletas en ese sorteo. ¿Por qué? Pues porque si en el mejor de los casos sale la R, se lo llevaría Ramírez Parejo que es el primer apellido en orden descendente.

Solo juegan aquellos cuyo primer apellido es el primero, alfabéticamente, entre los que empiezan con esa misma letra. Pero no todos tienen la misma probabilidad. Porque Quintana solo gana en el caso de que salga la Q en la bolita, pero vamos a pararnos un poquito y veamos qué pasa en otros casos.

Por ejemplo, Fernández Lozano, ganaría con la bola de la E (ningún apellido de esta lista comienza con E) y con la bola de la F. Es decir, tiene, por ejemplo, el doble de probabilidad de salir que Quintana e infinita más que Roldán Galisteo. Luján saldría con las bolas de la I, J, K (ningún apellido de esta lista comienza con I o J o K) y con la bola de la L. Ojeda juega con 3 bolas: la de la N, la de la Ñ y la de la O. Valverde juega con 3 bolas: T, U y V, y Aguilera con 5 bolas: W, X, Y, Z y A. Toma ya.

Aquí tenemos la tabla con las probabilidades de cada alumno en el caso de un sorteo de estos de las letritas:


Para calcular la probabilidad de cada alumno, basta con dividir el número de bolas que le dan el premio, 5 en el caso de Aguilera, entre el número total de bolas, 27. Luego multiplicamos por 100 para escribirlo con porcentajes que gusta más.

Así que parece claro que este tipo de sorteos es absolutamente injusto y se han usado, y se siguen usando, para adjudicaciones que pueden ser fundamentales en la vida de una persona, no es un viaje, es un colegio, un trabajo, una casa…

Aquí tenéis un caso concreto en el que un profesor de instituto dirije una queja a la Subdirección General de Atención al Ciudadano de la Comunidad de Madrid, y la increíble respuesta de la ilustrísima Directora General Mercedes Ruiz Paz.

Queja:


Respuesta: