01-18-2010, 08:58 PM
Cita:Podrías explicar mejor tu comentario de por que es "inaplicable"?
Dentro de la ecuación que usa IMDb, el promedio (Rating) de una película también es incluído, por lo que se quiera o no, el sesgo no se elimina completamente, solo se disminuye.
Hola Alengendro.
Efectivamente, al ser un estadístico bayesiano es necesario hacer una inferencia a priori mediante un estimador. Por eso se utiliza el rating, que por cierto para un caso como este es un valor inmejorable porque representa exactamente el valor medio alrededor del cual se mueven los distintos valores muestrales; es decir, no hay que suponer el estimador de inferencia.
Pero tienes razón. El sesgo no se elimina totalmente; pero si se atenúa considerablemente. El valor del método consiste precisamente en que permite "blindar" el resultado contra eventos puntuales no necesariamente azarosos. Me explico:
a) Para que una cinta aparezca en la medición necesita ser mínimamente representativa del gusto de la gente. En este momento son 3000 votos.
b) Al crecer la muestra, el sesgo se disminuye en la misma razón, precisamente porque la calificación que el usuario otorga a una cinta se refiere necesariamente al promedio del universo muestral (ver la ecuación).
Así, puede haber casos en que ciertamente haya una modificación intencionalmente sesgada cuando se vota por consigna. Pero el efecto, conforme la muestra se hace más grande, tiende a ser despreciable. Esa es la razón por la cual tiene rato que muchas cintas tienen un movimiento relativamente pequeño hacia arriba o hacia abajo en la lista. Es decir, la "elasticidad" de la calificación disminuye.
Veamos un ejemplo: hasta donde pude ver, a la semana de su lanzamiento AVATAR se encontraba en el lugar 22. Hoy aparece en el lugar 37. ¿Qué quiere decir esto? Que cuando la muestra es pequeña, el impacto de una calificación desaforadamente sesgada, digamos puros dieces o puros unos, es muy marcada. Los usuarios iniciales, digamos fans de la cinta, se arrojaron a votar hacia el 10. Pero conforme pasa el tiempo, usuarios menos "interesados" o más "objetivos" van matizando poco a poco la calificación de la cinta, haciendo que vaya adquiriendo un valor más acorde a la real preferencia del universo muestral.
En fin. Hay quien señala que esta lista de los 250 es una lista de popularidad... Y en cierto sentido es así; pero es una popularidad ponderada que refleja un mínimo conocimiento del séptimo arte y el gusto que genera una película en el usuario promedio.