Yupp: une nouvelle plateforme émergente pour la réévaluation des modèles d'IA
Avec l'application de l'IA dans divers secteurs, comment évaluer avec précision la performance des modèles et renforcer la confiance des utilisateurs est devenu un problème urgent à résoudre. Les évaluations traditionnelles reposent souvent sur des mécanismes centralisés, ce qui rend difficile la couverture de scénarios diversifiés et ne peut pas refléter les préférences réelles des utilisateurs. Parallèlement, le problème des "illusions" des modèles se manifeste fréquemment, et les utilisateurs se retrouvent souvent piégés dans des chambres d'écho d'information lors de leurs choix.
Dans ce contexte, Yupp, en tant que nouvelle plateforme, tente de redéfinir la découverte, la comparaison et l'utilisation des modèles d'IA grâce à son modèle de crowdsourcing unique et à son mécanisme d'incitation, apportant une véritable révolution paradigmatique dans le domaine de l'évaluation de l'IA.
Contexte de l'équipe et financement
Yupp s'engage à construire un marché de feedback AI "dématérialisé", permettant à des retours d'utilisateurs diversifiés de circuler librement sous la garantie de la blockchain et des incitations économiques en cryptomonnaie, formant une couche d'évaluation de modèle évolutive, équitable et transparente. Grâce à la distribution incitative de données annotées manuellement de haute qualité, Yupp peut capturer en temps réel les besoins et préférences des véritables utilisateurs dans différents scénarios, aidant ainsi les développeurs d'IA à optimiser les performances des modèles de manière itérative.
Le projet a été fondé en juin 2024 par Pankaj Gupta (co-fondateur et PDG) et Gilad Mishne (co-fondateur et responsable de l'IA), avec la participation du chef scientifique Jimmy Lin (professeur à l'Université de Waterloo) au sein de l'équipe dirigeante. Les trois hommes ont travaillé ensemble chez Twitter dès 2010, où ils ont créé et optimisé des systèmes de recommandation et de recherche à grande échelle, avant d'accumuler une riche expérience chez Google et Coinbase.
Récemment, Yupp a annoncé avoir levé 33 millions de dollars lors d'un tour de financement de semences, dirigé par un partenaire de capital-risque connu, avec d'autres investisseurs comprenant plusieurs personnalités de l'industrie technologique et des capital-risqueurs de premier plan.
Fonctionnalités clés et expérience utilisateur
En tant que plateforme d'évaluation AI, Yupp adhère au concept de "AI partagé par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement aux réponses uniques traditionnelles, Yupp renvoie simultanément les réponses de deux (voire plus) modèles pour chaque requête, formant ainsi un "conseil AI". Ce design répond non seulement aux besoins des utilisateurs en matière de choix diversifiés, mais permet également d'identifier efficacement les "hallucinations" possibles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison.
La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs modèles connus et de nombreux nouveaux modèles. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité "QuickTake", qui permet de résumer des réponses longues en un tweet concis.
De plus, Yupp accorde une grande importance à la confidentialité des utilisateurs : tous les historiques de chat sont par défaut privés, à moins que l'utilisateur ne choisisse de les rendre publics ; même en partageant publiquement, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et la portée du partage.
Modèle économique et mécanismes d'incitation
Yupp utilisera gratuitement les retours des utilisateurs, mesurant l'utilisation du modèle via le système de "points Yupp". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, et peuvent gagner plus de points en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont importantes, garantissant que les utilisateurs peuvent utiliser gratuitement et de manière durable divers services d'IA, y compris des modèles haut de gamme.
Après chaque question, les utilisateurs reçoivent deux réponses du modèle et peuvent gagner une "carte à gratter numérique" grâce à leurs retours, récompensant entre 0 et 250 points Yupp. Chaque 1000 points peuvent être échangés contre 1 dollar, et les utilisateurs peuvent retirer jusqu'à 10 dollars par jour, avec un maximum de 50 dollars par mois. Les points peuvent être échangés contre plusieurs devises, avec des partenariats incluant plusieurs plateformes de paiement renommées. De plus, la plateforme intègre des stablecoins de certains réseaux blockchain, offrant aux utilisateurs du monde entier des récompenses instantanées et sans frais.
Pour inciter davantage de personnes à participer, Yupp a également mis en place des récompenses de parrainage : le parrain reçoit 5000 points, le filleul reçoit 1000 points ; actuellement, les nouveaux utilisateurs inscrits peuvent recevoir 5000 points, et le filleul reçoit en plus 2500 points.
Yupp VIBE Score : Un nouveau paradigme d'évaluation par l'IA
Pour résoudre les problèmes de transparence insuffisante des classements existants, d'équité manquante et d'accès inégal aux données d'évaluation, Yupp a lancé la version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système regroupe les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, afin de fournir des résultats d'évaluation solides et fiables.
Les principes d'évaluation de Yupp comprennent :
Robustesse : garantir la représentativité, l'authenticité, la résistance à la fraude
Fiabilité : équitable, neutre, transparent, rigoureux et scientifique
La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de regroupement en fonction des informations contextuelles des utilisateurs, montrant les différences de préférences entre les différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. En même temps, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs par la vérification de dossiers et un contrôle de qualité en plusieurs étapes, éliminant ainsi les données malveillantes.
 et Gilad Mishne (co-fondateur et responsable de l'IA), avec la participation du chef scientifique Jimmy Lin (professeur à l'Université de Waterloo) au sein de l'équipe dirigeante. Les trois hommes ont travaillé ensemble chez Twitter dès 2010, où ils ont créé et optimisé des systèmes de recommandation et de recherche à grande échelle, avant d'accumuler une riche expérience chez Google et Coinbase.
Récemment, Yupp a annoncé avoir levé 33 millions de dollars lors d'un tour de financement de semences, dirigé par un partenaire de capital-risque connu, avec d'autres investisseurs comprenant plusieurs personnalités de l'industrie technologique et des capital-risqueurs de premier plan.
Fonctionnalités clés et expérience utilisateur
En tant que plateforme d'évaluation AI, Yupp adhère au concept de "AI partagé par tous", permettant aux utilisateurs de découvrir, comparer et utiliser facilement les derniers modèles d'IA. Contrairement aux réponses uniques traditionnelles, Yupp renvoie simultanément les réponses de deux (voire plus) modèles pour chaque requête, formant ainsi un "conseil AI". Ce design répond non seulement aux besoins des utilisateurs en matière de choix diversifiés, mais permet également d'identifier efficacement les "hallucinations" possibles des modèles, aidant les utilisateurs à prendre des décisions plus éclairées grâce à la comparaison.
La plateforme prend désormais en charge plus de 500 modèles d'IA, couvrant les domaines de la génération de texte et d'images, y compris plusieurs modèles connus et de nombreux nouveaux modèles. Pour optimiser davantage l'expérience, Yupp a également lancé la fonctionnalité "QuickTake", qui permet de résumer des réponses longues en un tweet concis.
De plus, Yupp accorde une grande importance à la confidentialité des utilisateurs : tous les historiques de chat sont par défaut privés, à moins que l'utilisateur ne choisisse de les rendre publics ; même en partageant publiquement, aucune information personnelle n'est divulguée. Les utilisateurs peuvent contrôler à tout moment le contenu et la portée du partage.
Modèle économique et mécanismes d'incitation
Yupp utilisera gratuitement les retours des utilisateurs, mesurant l'utilisation du modèle via le système de "points Yupp". Les nouveaux utilisateurs reçoivent 5000 points lors de leur inscription, et peuvent gagner plus de points en notant les réponses du modèle, en choisissant des préférences et en expliquant leurs raisons. Plus la qualité des retours est élevée, plus les récompenses sont importantes, garantissant que les utilisateurs peuvent utiliser gratuitement et de manière durable divers services d'IA, y compris des modèles haut de gamme.
Après chaque question, les utilisateurs reçoivent deux réponses du modèle et peuvent gagner une "carte à gratter numérique" grâce à leurs retours, récompensant entre 0 et 250 points Yupp. Chaque 1000 points peuvent être échangés contre 1 dollar, et les utilisateurs peuvent retirer jusqu'à 10 dollars par jour, avec un maximum de 50 dollars par mois. Les points peuvent être échangés contre plusieurs devises, avec des partenariats incluant plusieurs plateformes de paiement renommées. De plus, la plateforme intègre des stablecoins de certains réseaux blockchain, offrant aux utilisateurs du monde entier des récompenses instantanées et sans frais.
Pour inciter davantage de personnes à participer, Yupp a également mis en place des récompenses de parrainage : le parrain reçoit 5000 points, le filleul reçoit 1000 points ; actuellement, les nouveaux utilisateurs inscrits peuvent recevoir 5000 points, et le filleul reçoit en plus 2500 points.
Yupp VIBE Score : Un nouveau paradigme d'évaluation par l'IA
Pour résoudre les problèmes de transparence insuffisante des classements existants, d'équité manquante et d'accès inégal aux données d'évaluation, Yupp a lancé la version bêta du classement AI et du système de notation "Yupp VIBE (Vibe Intelligence Benchmark) Score". Ce système regroupe les données de préférence générées par les utilisateurs du monde entier lors d'interactions naturelles, afin de fournir des résultats d'évaluation solides et fiables.
Les principes d'évaluation de Yupp comprennent :
La plateforme ne se contente pas de recueillir des préférences binaires, mais encourage également les utilisateurs à indiquer les avantages et les inconvénients des réponses, et effectue une analyse de regroupement en fonction des informations contextuelles des utilisateurs, montrant les différences de préférences entre les différents groupes.
Sur le plan technique, Yupp explore l'utilisation de la blockchain, des primitives cryptographiques et des preuves à divulgation nulle de connaissance pour garantir l'équité, la transparence et la vérifiabilité du processus d'évaluation. En même temps, la plateforme a collaboré avec des fournisseurs de données AI professionnels pour calibrer les évaluateurs par la vérification de dossiers et un contrôle de qualité en plusieurs étapes, éliminant ainsi les données malveillantes.
![a16z a investi 33 millions de dollars dans un tour de table, comment Yupp redéfinit-il le modèle d'évaluation de l'IA basé sur la blockchain et les incitations ?](https://img-cdn.gateio.im/webp-social/moments-72ec1eb4ea4b0853690939a455fd9194.webp01
Histoire et perspectives d'avenir
Yupp sera officiellement lancé le 13 juin 2025, après six mois de tests internes. Depuis son lancement, le produit a été continuellement itéré, avec des mises à jour principales comprenant :
L'utilisation de Yupp aide non seulement les utilisateurs à prendre de meilleures décisions, mais fournit également une source continue de motivation pour l'évolution de l'IA. Cependant, pour Yupp qui vient d'être lancé, comment assurer en continu la qualité des données, résister aux comportements frauduleux potentiels, et trouver un équilibre entre la commercialisation et l'incitation des utilisateurs avec une large participation des utilisateurs, restera une direction à explorer et à optimiser dans son développement futur.