Index du forum

Lost Forum

Premier forum francophone, depuis 2004 • Le forum du site Lost Island : http://lostisland.net.free.fr
Nous sommes le Ven 29 Mar 2024 - 00:02

Heures au format UTC + 1 heure




Poster un nouveau sujet Répondre au sujet  [ 21 messages ]  Aller à la page 1, 2  Suivante
Auteur Message
 Sujet du message: Besoin d'aide... en maths
MessagePosté: Mar 30 Déc 2008 - 17:44 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
Salut à tous,

Depuis quelques mois, j'ai instauré un système de notation sur le site, permettant aux visiteurs de noter ce que je vais appeler des items : news/spoilers/interviews/images etc...

Je travaille en ce moment sur une méthode de classement de ces items pour pouvoir les faire apparaître sur le site. Seulement voilà, ça n'est pas aussi simple que cela ^^

Je pourrais établir deux classements : Un par rapport aux notes et l'autre par rapport au nombre de votes. Mais je préfèrerait un seul classement tenant compte de ces deux paramètres.

J'ai parcouru différents forums sur le net débattant de ce sujet, chacun y va de sa formule, mais rien n'est vraiment établi. On y parle aussi beaucoup de moyenne pondérée, et c'est peut être la solution, mais là on entre dans des maths/statistiques un peu compliquées, et c'est un sujet que je ne maîtrise pas vraiment ^^

J'ai aussi la possibilité d'inclure une troisième variable qui est le nombre de consultations des items, si ça peut aider...

Bref, je fais appel aux pros des maths du forum qui sauront peut être me donner une méthode simple (en fait, qui soit surtout compréhensible :mrgreen:) pour réaliser ce classement. Merci ^^

[P.S. Je serait absent pour une semaine à partir du 1er janvier :)]

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Jeu 08 Jan 2009 - 11:39 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
Hummm.... Apparemment, personne ne semble inspiré par ce problème de maths en ce début d'année ^^

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Jeu 08 Jan 2009 - 12:09 
Hors ligne
Badge de Marshall
Avatar de l’utilisateur

Inscription: Mer 05 Sep 2007 - 21:55
Messages: 1503
Localisation: A bord d'un Antérak
Cyb: J'aurais vraiment aimé t'aider mais : Vraiment nul je suis nul en math, tellement....

_________________
I looked into the eye of this Island and what i saw was beautiful.


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Ven 09 Jan 2009 - 22:15 
Hors ligne
Mangeur d'oursins
Avatar de l’utilisateur

Inscription: Dim 07 Déc 2008 - 21:04
Messages: 704
En fait (si je ne me trompe pas), il me semble que la moyenne pondérée est la moyenne d'un certain nombre de valeurs (comme une moyenne normale), si ce n'est que ces valeurs sont affectés d'un coefficients

Il te faudrait plutot une moyenne dépendant de deux paramètres (comme tu l'as dit dans ton post)

Je recherches (en fait je suis sûr d'avoir déja vu ca ^^)

_________________
"My take on Robert Johnson so far is that it needs two people to play what he plays, and sing in the same time." Eric Clapton.


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Sam 10 Jan 2009 - 11:49 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
Peut être que le coefficient de cette moyenne pondérée pourrait être lié au nombre de visiteurs de l'item. En fait j'ai trois paramètres dont deux essentiels :

1/ Note
2/ Nombre de votants
3/ Nombre de visiteurs

Avec tout ça, on doit pouvoir trouver un classement reflétant une préférence réelle de la part des visiteurs. Merci pour tes recherches k4mek ^^

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mar 13 Jan 2009 - 18:55 
Hors ligne
Vieux fauteuil roulant rouillé

Inscription: Jeu 21 Fév 2008 - 20:34
Messages: 30
Localisation: Epernay, New York, ailleurs
Bonjour Cyb. La moyenne pondérée n'est rien d'autre qu'une moyenne. Elle permet simplement de ganer du temps dans les calculs. Elle introduit la multiplication qui est plus rapide qu'une longue série d'additions. Pour te donner un exemple simple, tu as sûrement eu des notes coefficientées à l'école, c'est le même principe: concrètement un élève reçoit trois notes à différents coef., un 8 sur 20 coef. 1; un 15/20 coef. 3 et un 10/20 coef. 2. La moyenne calculée simplement serait (8+15+15+15+10+10)/1+3+2.

Ceci est déjà une moyenne pondérée. En essayant d'être simple c'est une petite règle qui te dit de regrouper les même valeurs en cas de longue série pour obtenir des multiplications au lieu d'une éventuelle très longue addition. Dans ton cas, par exemple tu pourrais avoir comme notes : 4, 2, 5, 5, 1, 3, 2, 4 et 5. La moyenne pondérée est (somme des notes)/ nombre de votants total. Donc 2 cas pour la somme des notes: soit tu additiones tout, soit tu passes par un tableau et tu obtiens (1x1+2x2+3x1+4x2+5x3)/9. Cette série est petite mais en cas inverse cela est un gain de temps évident.

Pour en revenir à ton problème, ces deux variables sont donc compatibles et reviennent à une simple moyenne. En ce qui concerne la troisième variable, le problème est qu'elle est dépedante de la seconde, ou vice-versa plus exactement. D'un point de vue statistique et après m'être retourné le cerveau pour me rappeler mes cours de Sup de Co, Elles ne peuvent pas ou en tout cas devraient pas être interprétées l'une par rapport à l'autre. Je sais cela devient plus compliqué mais je vais essayer d'être clair. Un "visiteur" n'a déjà que deux choix: il vote OU il ne vote pas. Ce qui, d'après mes souvenirs, correspond à un schéma de Bernoulli, intro aux probas. Toujours est-il qu'un votant sera obligatoirement un visiteur de ton "item". C'est alors qu'il faut être prudent car les stat, passées deux variables on peut leur faire dire ce qu'on veut.

Arrivent donc plusieurs choix pour te permettre de faire entrer en considération cette variable. J'ai déjà ma petite idée mais je pense que j'ai besoin de quelques préçisions de ta part. Veux-tu que le nombre de visiteurs sur un item influence positivement la moyenne de ce dernier? Veux tu considérer la proportion de votants par rapport aux visiteurs pour influencer ta note finale? Si un visiteur ne vote pas, considère-t-on une forme d'abstention qui permettrait un gage de crédibilité sur le vote?

J'espère avoir été clair même si je pense que tu me reliras plusieurs fois pour tout bien assimiler. En tout cas j'attends ta réponse ou tes questions pour pouvoir t'éclairer plus amplement.


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mar 13 Jan 2009 - 19:48 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
Bonjour Bouyou, et tout d'abord, merci d'avoir pris le temps de répondre à mon appel au secours ;)

Je crois avoir saisis le fonctionnement de la moyenne pondérée. Seulement je n'ai pas de coefficient qui permettrait d'avoir un classement "représentatif". Sans coefficient, si j'applique bêtement le principe d'une moyenne (même en simplifiant selon ta méthode en regroupant les notes identiques, donc en incluant des multiplications), on n'a finalement qu'une moyenne "classique" et ça ne représente pas la "réalité".

En effet, si un item X a 1 seul votant avec une note de 10 et un deuxième item Y a 3 votants avec les notes 7, 8, 8, on a donc :

Moyenne item X : (10x1)/1=10
Moyenne item Y : (7x1+8x2)/3=7,6

Dans mon classement final, l'item X arrivera donc devant l'item Y, or le Y semble avoir suscité plus d'intérêt que le X. Comme il y a plus de votants, la note est plus "précise".

C'est pourquoi j'ai suggéré l'utilisation d'une troisième variable, le nombre de visiteurs, qui permettrait éventuellement de définir un coefficient, et influencer ainsi la moyenne afin d'obtenir un classement plus "réaliste". Je perçoit le nombre de visiteurs comme un gage d'intérêt donc j'ai pensé qu'il serait intéressant d'utiliser ce paramètre pour calculer un coefficient.

Boyou a écrit:
Veux-tu que le nombre de visiteurs sur un item influence positivement la moyenne de ce dernier?

Effectivement c'était l'idée :)

Boyou a écrit:
Si un visiteur ne vote pas, considère-t-on une forme d'abstention qui permettrait un gage de crédibilité sur le vote?

Oui, on se retrouve dans le cas inverse par rapport à la question ci-dessus. J'ai donc pensé qu'il serait bien de dévaluer la moyenne par rapport à l'abstention.

Boyou a écrit:
Veux tu considérer la proportion de votants par rapport aux visiteurs pour influencer ta note finale?

Je crois que cette question reprend les points ci-dessus et ça résume assez bien le problème, sachant que la "note" finale serait dévaluée s'il y a beaucoup d'abstention, et surévaluée s'il y a peu d'abstention.

Mais voilà, après t'avoir lu, et m'être relu, je viens de me rendre compte que le coefficient pourrait tout aussi bien être calculé par rapport au nombre de votants (car le nombre de votants et finalement lié au nombre de visiteurs - de manière générale : beaucoup de votants = beaucoup de visiteurs & peu de votants = peu de visiteurs).

Reste à savoir comment tirer un coefficient à partir du nombre de votants ? Car un item plus récent aura moins de votants, donc il faudra dans ce cas que la "note" finale soit sévèrement dévaluée, et inversement lorsque l'on a beaucoup de votants pour un item. Comment définir ce paramètre ? C'est quand même bien compliqué :)

Merci Bouyou pour ton aide, j'espère que tu sauras m'éclairer un peu plus sur ce problème.

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mar 13 Jan 2009 - 22:36 
Hors ligne
Vieux fauteuil roulant rouillé

Inscription: Jeu 21 Fév 2008 - 20:34
Messages: 30
Localisation: Epernay, New York, ailleurs
J'ai des idées pour cela. j'y travaille et essaie de mettre au point un cas pratique pour établir un schéma répondant à tes attentes.

Citation:
En effet, si un item X a 1 seul votant avec une note de 10 et un deuxième item Y a 3 votants avec les notes 7, 8, 8, on a donc :

Moyenne item X : (10x1)/1=10
Moyenne item Y : (7x1+8x2)/3=7,6

Dans mon classement final, l'item X arrivera donc devant l'item Y, or le Y semble avoir suscité plus d'intérêt que le X. Comme il y a plus de votants, la note est plus "précise".


Là tu fais une erreur qui arrive souvent: tu te trompes "d'univers" en langage math. Dans ton exemple le nombre de votants est 4 pour les deux items et non 1 dans un cas et 3 dans l'autre. Autrement cela les rend totalement incomparables comme tu as pu t'en rendre compte. Pour avoir la moyenne de X et celle de Y il faut diviser par 4. Donc MoyX=2.5 et MoyY=5.75 dans mon sens. Cela a plus de valeur arithmétique.

J'essaie d'introduire l'autre variable pour se défaire des aleéas d'items introduits récemment ou d'abstention ce qui risque de m'occuper quelque temps et te soumettrais une formule le plus rapidement possible si je trouve quelque chose de concluant.


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mar 13 Jan 2009 - 22:52 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
C'est avec des problèmes comme ça qu'on se dit que finalement, les maths ça servait peut être à quelque chose et qu'on aurait mieux fait d'écouter en classe :mrgreen:

Merci Bouyou, j'espère que tu pourras tirer quelque chose de tout ça ;)

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 18:08 
Hors ligne
Vieux fauteuil roulant rouillé

Inscription: Jeu 21 Fév 2008 - 20:34
Messages: 30
Localisation: Epernay, New York, ailleurs
Bonjour Cyb. C'est exactement ce que je pensais hier en retournant ce problème dans tous les sens. :D . Bon, j'ai déjà une bonne voire une très bonne esquisse mais je vais aller à la station Dharma la plus proche pour vérifier qu'il n'y ait pas de "side effects".


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 18:17 
Hors ligne
Détenteur du secret de l'île
Avatar de l’utilisateur

Inscription: Mer 30 Jan 2008 - 10:32
Messages: 1002
Localisation: En train de regarder la culotte d' un ou deux PC.
Ce qui suit n'apporte rien au problème mais je voulais le dire quand même.

Ahah ! C'est pour la dernière phrase de Bouyou qui m'a bien fait sourire au boulot.
Merci, comme quoi même en faisant des maths on peut se marrer.

_________________
Image
You knew this was gonna happen and you sent me here anyway...


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 18:34 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
Je crois que c'est nécessaire de se marrer si on ne veut voir son cerveau imploser :mrgreen: Ceci dit, je ne suis pas sur que se rendre dans une station Dharma puisse empêcher cette implosion, gare au surplus magnétique :sac:

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 20:25 
Hors ligne
Vieux fauteuil roulant rouillé

Inscription: Jeu 21 Fév 2008 - 20:34
Messages: 30
Localisation: Epernay, New York, ailleurs
Donc, pour faire simple et voir si on est toujours en phase, j'ai un modèle à te fournir Cyb. Point par point et sans rentrer dans les calculs pour l'instant, voici la méthode qui me parait correcte et qui a du sens mais qui, en toute hônneteté, n'est peut être qu'une hérésie mathématique. J'esaie de faire simple et détaillé pour la compréhension.
NB: l'utilisation successive des chiffres 4 8 15 16 23 42 ne dérégle en rien le schéma.

Dans un premier temps j'ai simplement considéré la moyenne pondérée arithmétique. Celle qui est la plus pertinente. Elle occultait la troisième variable que Cyb voulait à très juste titre, le nombre de visiteurs. De plus, il fallait rajouter une notion "ordinale" (donner un ordre, un rang aux items pour les comparer les uns aux autres). Et là gros problème puisqu'on mélange des choses incompatibles et trop fortement dépendantes les unes par rapport aux autres. L'idée de coefficienter était donc tentante mais peut être pas crédible et surtout donnait quelque fois des écarts énormes. Donc j'ai laissé tomber cette histoire de coeff, du moins dans le sens où on l'entendait dans les précédants posts.

Pour "corriger" la première moyenne (qui donne des moyennes allant de 0 à difficilement 5 pour des notes de 1 à 10) j'ai donc instauré un système de bonus. Il n'y pas de malus car en aucun cas il n'y aura de notes négatives ni -25 votants ou -1 visiteur. Il y a trois bonus dans mon esprit qui sont pertinents.

Le premier est la moyenne "pure", celle que Cyb avait pris Dans son exemple X et Y. Ajouté, ce coeff par items corrige les effets négatifs des posts récents et donc peu vus mais beaucoup votés et très bien votés, sisi croyez moi. Ce bonus va de 0 à 10 points.

Le second bonus corrige les effets de l'abstention. On ajoute donc la proportion des votés/visiteurs. Bonus de 0 à +1.

Le troisième bonus est plus compliqué à expliqué déjà à l'oral, alors à l'ecrit... Il bonifie les items très visités mais qui n'ont intéressés que peu de votants. Je vous passe le calcul pour l'instant mais les bonus vont de 0 à 3 sachant que cela peut evoluer dans des faibles proportions dans certains cas extrêmes.

Cela pour nous donner des notes entre environ 0,00000 et des brouettes jusqu'à 17.
L'ordre par "catégories" d'items:
- Les "peu visités, peu votés et avec des notes faibles" en dernier
- Les "très visités mais faiblement votés et notés" ensuite.
- Les "moyennement visités moyennement votés et faiblement notés" ensuite
- Les "peu visités peu votés mais bien notés"
- les "très visités peu votés mais bien notés"
- les "très visités moyennement voté et notés"
Et le Note Awrd va aux "très visités, votés et bien notés".

J'en oublie sûrement mais ma tête explose pour l'instant. :shock:


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 21:14 
Hors ligne
  
  
Avatar de l’utilisateur

Inscription: Ven 09 Juil 2004 - 11:41
Messages: 5644
Localisation: Dans la jungle, terrible jungle...
J'aime assez le principe de bonus ^^ (et puis c'est là mode en ce moment ;)) Je crois qu'un classement de ce type serait effectivement assez représentatif de l'intérêt suscité par les items. Reste à trouver une formule pour appliquer ce principe, et des seuils pour ces "catégories"...

_________________
:: Lost Island :: Lost Forum ::


Haut
 Profil  
 
 Sujet du message:
MessagePosté: Mer 14 Jan 2009 - 22:19 
Hors ligne
Vieux fauteuil roulant rouillé

Inscription: Jeu 21 Fév 2008 - 20:34
Messages: 30
Localisation: Epernay, New York, ailleurs
La formule je l'ai, particulièrement indigeste au premier abord:

Note corrigée itemX= (Somme des notes item X/nombre total de votants)+
(Somme des notes item X/nb de votants item X)+
(nb de votants item X/nb de visiteurs item X)+
[nb de visiteurs item X/(nb total de visiteurs/nb items)].

La voilà donc. Si tu as des questions... Par contre je ne vois pas ce que tu veux dire par seuils et catégories. Je ne dois plus avoir assez de recul :?


Haut
 Profil  
 
Afficher les messages postés depuis:  Trier par  
Poster un nouveau sujet Répondre au sujet  [ 21 messages ]  Aller à la page 1, 2  Suivante

Heures au format UTC + 1 heure


Qui est en ligne

Utilisateurs parcourant ce forum: Aucun utilisateur enregistré et 4 invités


Vous ne pouvez pas poster de nouveaux sujets
Vous ne pouvez pas répondre aux sujets
Vous ne pouvez pas éditer vos messages
Vous ne pouvez pas supprimer vos messages

Aller à:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Traduction par: phpBB-fr.com