-
Crédits
Titre original : SCP-3334 - Literally a Billion Memes
Auteur : PandoraNuker
Traducteur : Dr Carfeng does not match any existing user name
Date de publication originale : 30 mai 2017
Images : Image 1 : Contenu original / Pièces Jointes : Cornell University
Objet no : SCP-3334
Classe : Thaumiel
Procédures de Confinement Spéciales : L’instance primaire de SCP-3334-1 doit être stockée dans plusieurs centaines de disques durs dans le centre de données du Site-15, avec des répliques secondaires aux Site-19 et au Site-64.
Les seules utilisations approuvées de SCP-3334-1 sous forme encryptée sont l'entraînement et la validation des modèles de machine learning par le Projet MEDUSA. Tout autre demande d’accès concernant SCP-3334-1 requiert l’approbation du Superviseur LGED de SCP-3334 ou, en cas de brèche de confinement et d’une défaillance de MEDUSA, du chef d’équipe de la FIM Mu-4 (“Debuggers”). Un accès direct à SCP-3334 sous forme non-encrypté par le personnel est prohibé.
Les serveurs contenant SCP-3334-1 sont isolés, et uniquement connectés au réseau du centre de données du Site local. Toutes les deux semaines, la copie primaire au Site 15 doit être synchronisée avec ses répliques secondaires au Site-19 et au Site-64 par un système de transmission physique de stockage de médias.
Les copies de SCP-3334-2 doivent être stockées dans des disques durs aux Sites 15, 19, 49, 64, 77, 81. Ils doivent être synchronisés physiquement chaque semaine de façon similaire. Bien que le Projet MEDUSA est utilisé par la Fondation via plusieurs de ses outils, routines et opérations, SCP-3334-2 lui-même est uniquement accessible de manière locale, en raison du modèle de distribution centralisé type Logiciel en tant que Service (SaaS) du projet MEDUSA. Cela signifie que les clients internes de la Fondation envoient des requêtes au Projet MEDUSA, qui procède alors à une utilisation locale de SCP-3334-2 sur l’un des centre de donnés des Sites les plus importants, préservant ainsi le confinement.
L'accès direct à SCP-3334-2 est prohibé, excepté pour les membres du personnel autorisés dans l’équipe de confinement de SCP-3334, pour le personnel du Projet MEDUSA, pour les collaborateurs du projet à la discrétion du Superviseur LGED de SCP-3334. Les copies temporaires de SCP-3334-2 sont autorisées sur les bureaux d’ordinateurs pour le développement du Projet MEDUSA aussi longtemps que les protocoles standard de travail avec des agents visuels, mémétiques et des danger-sensitif (risques VMD) sont observés. La visualisation de n’importe quel élément de SCP-3334-2 est prohibée.
Système de Fichiers Évolutifs de la Fondation (SFEF) et scipDB :
Les instances de SCP-3334-1 et SCP-3334-2 sont sauvegardées sur des tables de logiciels dans le système scipDB, afin de garantir la sécurité, l’intégrité et l’accessibilité de SCP-3334-1. Le système scipDB est un logiciel multidimensionnel de cartographie de données distribué par noSQL ayant pour but de passer par des milliers de serveurs, développé en interne afin de stocker de grandes quantités de données sensitives ou à risque de la Fondation. C’est un système de stockage de données hautement accessible, tolérant aux échecs avec une structure évolutive, réalisé avec une duplication des données à travers de multiples serveurs afin de prévenir la perte de données et en augmenter le débit, avec des protocoles gossip pour détecter les échecs, et avec des arbres Merkel d’anti-entropie pour récupérer après un échec. Les procédures de confinement spéciales de SCP-3334-1 priorisent la sécurité plus que l'intégrité et l'accessibilité, avec quelques tolérances sur les pertes de données ou les corruptions de SCP-3334-1 pour réduire la possibilité d’un accès non-autorisé – ainsi ces tables de scipDB contenant SCP-3334-1 sont configurées avec un facteur de réplication de 2 inférieur à la valeur par défaut ainsi que quelques fonctionnalités de cohérence du scipDB désactivées. SCP-3334-2, dont la précision et l'accessibilité sont critiques pour la Fondation, est stocké avec un facteur de réplication standard ainsi qu’avec toutes les fonctionnalités cohérentes fonctionnelles.
Les tables scipDB sont construites sur les fichiers du Système de Fichiers Évolutifs de la Fondation (SFEF), un système de fichiers distribué et décentralisé optimisé pour la lecture de données et l’ajout d’écritures qui convient à la charge de travail typique du Projet MEDUSA. La dernière permet un niveau de chiffrement AES de fichier de 256-bit, une option activée pour toutes les instances de SCP-3334 stockées en prévention d’un accès non autorisé.
Protocole 3334-10-Kempelen :
Cinquante membres du personnel de Classe-D sont assignés à SCP-3334, avec des remplacements réguliers si besoin, pour diriger le Protocole 3334-10-Kempelen. Une vue fonctionnelle, une conscience, une exposition raisonnable à la culture humaine et à la société et une connaissance de ces dernières sont les seuls critères requis pour le personnel. L'équipe de confinement de SCP-3334 nécessite des membres du personnel qui remplit un minimum ces critères, qui peuvent toutefois ne pas être utiles dans les autres projets de la Fondation, particulièrement des sujets d'accidents et de tests précédents, dans un but d'efficacité.
Le Protocole 10-Kempelen expose des sujets humain lors de scanners IRMf à des agents mémétiques visuels et dangers-sensitifs prospectifs pour vérifier définitivement leurs propriétés anormales. Des risques VMD potentiels peuvent être marqués par le Projet MEDUSA ou soumis par les équipes de terrains de la Fondation. Les risques VMD vérifiés sont désignés comme SCP-3334-1 et utilisés par le Projet MEDUSA. Les membres du personnel de Classe-D doivent se voir administrer des amnésiques après chaque session de 10-Kempelen.
Les tentatives visant à dissoudre le Protocole 10-Kempelen et limiter l'utilisation des Classe-D pour ces objectifs par l'automatisation de l'ajout des données d'entraînement et de validation à SCP-3334-1 a conduit à des défaillances de MEDUSA, notamment l'Incident 3334-1. Néanmoins, l'envergure des opérations de la Fondation rend irréaliste l'utilisation des Classe-D en tant que moyen principal de détection des risques VMD. Ainsi, le protocole a été préservé dans le but auxiliaire actuel de vérification manuelle des données d'entrainement et de validation potentielles pour leur utilisation dans le Projet MEDUSA.
Projet MEDUSA :
Le Projet MEDUSA est une initiative interne à la Fondation par le Département des Analyses visant à construire un système automatique de détection des agents visuels, mémétiques et des danger-sensitif (risques VMD) en utilisant des techniques de machine learning éprouvées, non-anormales.
Le Projet MEDUSA est actuellement utilisé par plusieurs outils, routines et opérations qui requièrent la détection de risques VMD. Cela inclut les lignes de commande utilitaires memescan, ainsi que les robots d'indexation de la Fondation comme Anansi, Shelob et Aragog de la Fondation, le logiciel d'analyse d'images Giulianna, les visières SCRAMBLE, [CENSURÉ], et dans le confinement de plusieurs anomalies SCP.
Le Projet MEDUSA utilise des algorithmes de machine learning avancés (actuellement, un ensemble de réseaux neuronaux deep-Q récurrents). À un haut niveau, l'algorithme apprend en prenant des exemples d'entraînement labellisés, dans ce cas, sur les risques VMD depuis SCP-3334-1 et sur les images normales, et se modifie lui-même afin d'être capable de pouvoir les distinguer l'une de l'autre. Après entraînement, il peut prendre de nouveaux exemples et ainsi prédire s'il s'agit de risques VMD ou non. Dans ce sens, c'est une “IA faible”, capable de s'améliorer elle-même sur une tâche spécifique sans aucune notion de conscience. Le Projet MEDUSA n'emploie ou ne développe pas d'IA intelligentes, connues comme “IA fortes” - de telles recherches seraient hors du périmètre du projet.
Diagramme généré d'un réseau neuronal sur l'ensemble MEDUSA.
Légende : Rouge (Convolution), Orange (Mise en Commun), Bleu (ReLu/Softmax), Violet (Totalement connecté), Vert (MCLT)
Les efforts initiaux pour identifier les danger-sensitifs avec des intelligences artificielles se sont concentrés largement sur des machines vectorielles de soutien, jusqu'aux réseaux neuronaux convolutionnels grandement améliorés pour une classification précise. L'ajout de couches de mémoires à court et long terme (MCLT) pour rendre les réseaux récurrents permit l'analyse de vidéos et de risques-sensitifs non statiques.
La détection de dangers mémétiques est plus difficile, puisqu'elle requiert non seulement l'identification, mais aussi la compréhension du contenu des images par les algorithmes et leurs relations conceptuelles. Combiné avec les recherches antérieures, toutefois, un apprentissage par renforcement en profondeur permit finalement d'atteindre cet objectif. La flexibilité théorique d'un apprentissage par renforcement en profondeur permit la détection combinée d'agents mémétiques visuels ainsi que de dangers-sensitifs sous un seul réseau neuronal approfondi, plutôt qu’avec deux programmes séparés – ce développement a conduit à la formation du Projet CASSANDRA, qui est finalement devenu le projet MEDUSA (voir l’Addendum 3334-1).
MEDUSA utilise actuellement un ensemble de réseaux neuronaux deep-Q récurrent, car les ensembles diminuent la variance et l'erreur de généralisation attendue, et augmentent les performances dans le monde réel. Chaque réseau de l'ensemble est embranché avec deux sous-réseaux comme indiqué dans le diagramme : un réseau d'objectifs et un réseau de valeur. Le réseau d'objectifs possède 40 couches tandis que le réseau de valeur en a 30, avec une régulation par dropout. Les réseaux sont entraînés par l’utilisation d'une stratégie d'entraînement $\epsilon$-glouton avec avec des phases d'exploration et d'exploitation suivant la variation de $\epsilon$, tandis que les plus importants sont mis à jour par l’utilisation d’une descente stochastique graduelle et une rétropropagation. D’autres spécifications d’hyper-paramètres sont accessibles en cas de nécessité.
À la suite de l'Incident 3334-1, les images d'entrée sont pré-traitées par l’utilisation de l’analyseur de composants principal et un classificateur en cascade pour détecter et retirer les exemples contradictoires en cas de manipulation malveillante ou de la détérioration du modèle MEDUSA.
Toute proposition de modifications mineures aux hyper-paramètres arbitraires du modèle MEDUSA (liste non exhaustive) : le taux d'apprentissage, la fonction de perte, la fonction d'activation, le paramètre decay/momentum du taux d'apprentissage, l’initialisation du poids, la régularisation par dropout, ou la structure neuronale du réseau, doivent être proposés à l’Équipe de Réglages du Projet MEDUSA pour un examen et une approbation. L’Équipe de Réglages utilise actuellement des algorithmes d’auto-réglages pour définir la plupart de ces hyper-paramètres.
Toute proposition de modifications majeures au modèle algorithmique sous-jacent de MEDUSA doit être soumis par une proposition écrite formelle au directeur du Projet MEDUSA. De telles demandes seront examinées par tous les leaders d'équipe principaux du Projet MEDUSA et des vérifications mathématiques formelles avec la preuve des bornes sur les erreurs de généralisation, un test de régression totale, et un test de précision par validation croisée à 10 plis par l'utilisation de données de SCP-3334-1 seront requis avant d’entrer dans l’implémentation officielle.
Toutes les deux semaines, le modèle de machine learning actuel de MEDUSA est ré-entraînée avec un nouvel entraînement de données de SCP-3334-1 afin de rester à jour avec les derniers risques VMD. Plus tard, l'équipe du Projet MEDUSA pourra procéder à un un test de régression complet sur le modèle, incluant un lancement sur un jeu de données extrait de SCP-3334-1 nécessitant une classification correcte à 99,9 % pour passer. Si le nouveau modèle passe le test, alors SCP-3334-2 sera mis à jour et ses redondances aussi, tandis que le dernier archivage fonctionnel sera étiqueté dans la base des codes internes de la Fondation sous une version de système de contrôle. Toute validation additionnelle du modèle en dehors de ces bases bihebdomadaires est sujette à l'approbation du directeur du Projet MEDUSA en prévention d'un sur-ajustement du modèle et d'une détérioration des performances dans le monde réel.
Les performances du modèle actif de MEDUSA sont surveillées pour sa précision dans le monde réel. Les opérations préférables de précisions seront maintenues à 99,9 %. Si la précision tombe sous les 90 %, la défaillance de MEDUSA est déclarée. Dans ce cas, les paramètres du modèle doivent être retournés à la dernière version fonctionnelle connue de SCP-3334-2 et la base des codes doit être retournée jusqu’au dernier étiquetage archivé. Si les problèmes ne sont pas immédiatement résolus, l’équipe du Projet MEDUSA devra envoyer une requête à la FIM Mu-4 (“Debuggers”). En cas de panne prolongée, l’équipe de confinement de SCP-3334 peut envoyer une requête d’augmentation de Protocole 10-Kempelen de plus de 1 000 membres du personnel de Classe-D comme remplacement temporaire du Projet MEDUSA. Toutefois, compte tenu des besoins en volume et en sensibilité au temps de la détection de risques VMD par les opérations de la Fondation, ainsi que la quasi-ubiquité et la vitesse d'Internet dans la vie publique, le Projet MEDUSA est une infrastructure critique et les potentielles conséquences d’une interruption indéfinie sont inconnues. La perte ou l'insuffisance des capacités de détection automatique de risques VMD de la Fondation peut potentiellement conduire à un Scénario VL-0 Levée du Voile, ou même à l'un des différents scénario de classe K fin-du-monde en cas d'une brèche majeure ou du déclenchement des risques VMD anormaux.
Description : SCP-3334 est la désignation de diverses données nécessaires pour l'implémentation du Projet MEDUSA.
SCP-3334-1 est une collection de 1564287471 agents visuels, mémétiques et des danger-sensitif (risques VMD) recueillis par le Protocole 10-Kempelen. Ce jeu de données est également élargi artificiellement par l’utilisation de techniques d’augmentation de données, incluant des transformation et des traductions des risques VMD originaux. Approximativement 90% de SCP-3334-1 est désigné comme des données d’entraînement, utilisées par exemple pour entraîner les modèles de machine learning du Projet MEDUSA. Les 10% restants sont réservés à la validation de données, utilisées pour anticiper la précision à l’échelle du monde réel durant les tests. Les images individuelles sont identifiées comme SCP-3334-1-# selon le numéro approprié.
SCP-3334-2 est la masse interne numérique utilisé par les modèles de réseaux neuronaux du Projet MEDUSA. Ces masses déterminent comment le réseau neuronal classifie les images d’entrées fournies comme dangereuses ou non, et sont modifiées par le réseau neuronal durant l’entraînement et l’apprentissage. Les résultats récents des recherches dans le domaine du machine learning démontrent l'apprentissage des représentations hiérarchiques entre des couches intermédiaires de réseaux neuronaux convolutionnels, justifiant la désignation et le confinement de SCP-3334-2 comme potentiel agent visuel mémétique/danger-sensitif.
Addendum 3334-1 : Dès le ██/██/20██, à la lumière de la récente littérature concernant les nouvelles techniques de renforcement d’apprentissage en profondeur et de leurs capacités à unifier de multiples types de classification de dangers visuels, le Directeur du Département des Analyses a ordonné l'unification des Projets CIRCE et ODIN en un seul Projet, le Projet CASSANDRA qui développera une détection automatique pour les agents visuels mémétiques et les dangers-sensitifs. Leurs considérables collections de risques VMD, anciennement dispersés à travers la base de données principale SCP ou dans la liste des objets anormaux, ont été combinés en un seul jeu et une désignation partagée de SCP-3334 leur a été accordée.
Addendum 3334-2 : Le ██/██/20██, une brèche de confinement majeure concernant SCP-████ au Site 15 a conduit à la mort ou à l’incapacité de ██ chercheurs ; parmi eux ██ étaient assignés ou au moins rattachés au Projet CASSANDRA ou au confinement de SCP-3334. Le chef de l’Équipe de Tests du Projet CASSANDRA, le Dr Tourres, a disparu. La perte drastique de personnel qualifié a conduit à un recrutement sans précédent par la Fondation, effectué dans des compagnies externes et des universités pour compenser les pertes humaines et les talents techniques.
Le directeur du Projet CASSANDRA a rejeté la proposition initiale de faire migrer la totalité de la base de codes vers la plateforme de machine learning open-source Theano pour faciliter l’arrivée du grand nombre d'embauchés. Toutefois, après une discussion avec le RH de la Fondation, un compromis a été trouvé grâce auquel une nouvelle bibliothèque de machines de la Fondation, similaires a une plate-forme d’open-source existante, a été créée pour le projet. D’autres projets de la Fondation sans rapport procédèrent à une approche différente, et pour éviter toute confusion avec la base de données Apache Cassandra noSQL qui était intégrée à certains d'entre eux au même moment, le Projet CASSANDRA a été renommé Projet MEDUSA.
Addendum 3334-3 : Avec la précision de 99,99 % atteinte régulièrement par le Projet MEDUSA, et avec la recommandation des chefs d’équipes, le Dr Vuković, directeur du projet, a décidé de retirer le Protocole 10-Kempelen. À sa place, le réseau MEDUSA ajoutera les dangers VMD qu'il relève directement dans sa banque de données, SCP-3334-1 – les parties prenantes du projet ont montré que le réseau était suffisamment précis et robuste pour tolérer la petite quantité de bruit qui serait introduit par la suite.
Incident 3334-1 : Durant la semaine du ██/██/20██, la précision surveillée à l'échelle du monde réel du modèle MEDUSA a diminué à un rythme alarmant pendant plusieurs jours, présentant une forte corrélation avec la hausse du nombre de brèches de confinement et le déclenchement de nouveaux risques VMD. Le ██/██/20██, la précision à l’échelle du monde réel est tombée à 87 %, et la défaillance de MEDUSA a été déclarée. SCP-3334-2 et la base de codes ont tout deux été retournés jusqu'à la dernière version enregistrée. Toutefois, même après cette réversion, les performances dans le monde réel étaient toujours diminuées.
L’Équipe de Tests du Projet MEDUSA, suspectant initialement l’automation d’éléments de la collection de SCP-3334-1, a réinstauré le Protocole 10-Kempelen pour revoir manuellement chaque nouveau risque VMD ajouté à SCP-3334-1 depuis la mise en place de la charte d'automation. La révision fit découvrir approximativement 15000 images de Yuno Gasai, le personnage principal de la série d'animation japonaise Mirai Nikki, sous formes variées incorporées dans SCP-3334-1. Presque tous possédaient des effets mémétiques, bien qu'extrêmement mineurs pour la plupart. L’Équipe d’Implantation a tenté de modifier le réseau neuronal pour reconnaître ce facteur commun afin de faire des recherches spécifiques, mais ils ont découvert que le réseau était incapable d’identifier les instances. Deux jours d’événement d’échec MEDUSA se sont succédés, et face à la quantité et au nombre non trivial de brèches de confinement et de déclenchement de risques VMD, le Directeur du Département des Analyses a demandé un rapport sur la situation. À ce stade, la Force d’Intervention Mobile Mu-4 (“Debuggers”) a été appelée.
Le rassemblement des systèmes neuronaux a amélioré la précision de classification à 88 % en tant que mesure temporaire. En définitive, la FIM Mu-4 proposa d’utiliser une analyse des composants principaux et une classification préalable en cascade placés avant le classificateur principal de MEDUSA pour détecter en retirer les exemples contradictoires malveillants. Ce développement retira les exemples contradictoires qui empoisonnaient le réseau MEDUSA, et restaura les fonctions normales. Le Protocole 10-Kempelen permettant le contrôle des exemples de risques VMD potentiels d'entraînement et de validation a été réinstauré.
La défaillance de MEDUSA a entraîné ██ brèches de confinement et le déclenchement de ████ nouveaux risques VMD de tailles variées. L’incident a requis approximativement ██ mille amnesthésies et a causé ████ victimes, incluant ███ membres du personnel de la Fondation. Au total, la défaillance a coûté à la Fondation ███ millions de dollars pour les dégâts, les coûts du confinement et pour la perte de productivité. Dans sa réunion annuelle, le Conseil O5 a demandé au Département des Analyses de soumettre un plan détaillé des étapes prises par le Projet MEDUSA pour éviter une perturbation similaire.
En dépit de sérieuses suspicions, la Fondation n’a, à ce jour, pas été capable de définitivement assigner la faute à un GdI en particulier concernant l’Incident 3334-1.
De : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Pour : Dean Ackermann [pcs.4um.mif|nnamrekcad#pcs.4um.mif|nnamrekcad]
Sujet : Réparer MEDUSA
Dr Ackermann,
Pourriez-vous demander à Mu-4 de jeter un coup d'œil à MEDUSA ? C’est assez urgent. Les résultats actuels n'ont ni queue ni tête - on est fait pour travailler avec des anomalies, bien sûr, mais les 15 000 récentes instances de SCP-3334-1 de la fille de l'animé ont rendu perplexe l’Équipe d’Implémentation - le réseau les identifiera correctement comme des anomalies visuelles mémétiques, mais il ne peut pas trouver trouver leur point commun évident. C’est un effet mémétique vraiment mineur, c’est sûr, mais je suis sûr qu’il s’agit d’un symptôme d’un problème plus grand.
Quelqu’un de l’Équipe Théorique a dit que vous travailliez sur le confinement d’une anomalie similaire dans le passé, donc peut-être aurons-nous de la chance, encore une fois.
Cordialement,
Dr Vuković
Directeur du Projet MEDUSA
De : Dean Ackermann [pcs.4um.mif|nnamrekcad#pcs.4um.mif|nnamrekcad]
Pour : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Cc : Mary Wang [pcs.4um.mif|gnawm#pcs.4um.mif|gnawm]
Sujet : re : Réparer MEDUSA
Hey, Dr Vuković,
Pas de problèmes de priorités, tous les autres projets et toutes les équipes de confinement ont soumis des tickets au sujet de la panne de MEDUSA de toute façon.
Vraiment intéressant. Je pense que votre Théoricien parlait probablement de SCP-2223. Je peut voir les similitudes entre ces deux problèmes. En fait, je pense qu’ils ont tout deux été le travail de Celeramis (en réalité, nous avons épinglé le malware Mirai IoT l'année dernière, il semblerait qu’ils ont un truc avec les animés). Toutefois, je continue principalement à faire des algorithmes traditionnels, et pas de ces trucs de deep learning. J'ai mis Mary en cc pour qu’elle y jette un œil, elle a travaillé à Google DeepMind, donc elle devrait connaître une chose ou deux. Elle a aussi travaillé sur 2223 avec moi, si c'est pertinent.
Salutations,
Dean
Débogueur de la FIM Mu-4
De : Mary Wang [pcs.4um.mif|gnawm#pcs.4um.mif|gnawm]
Pour : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Cc : Dean Ackermann [pcs.4um.mif|nnamrekcad#pcs.4um.mif|nnamrekcad], Samhita Reddy [pcs.4um.mif|ydderhs#pcs.4um.mif|ydderhs], Achmed Hafizyar [pcs.4um.mif|zifah#pcs.4um.mif|zifah], Kelly Fitzgerald [pcs.sesylana|ztif#pcs.sesylana|ztif]
Sujet : re : Réparer MEDUSA
À tous,
Wow, quel désordre. Étant moi-même une chercheuse en deep learning, je n’aurai jamais imaginé que la Fondation intégrerait tellement d’opérations critiques pour un algorithme de machine learning aussi instable que MEDUSA.
Je suis partiellement en désaccord avec Dean, au-delà des similarités superficielles, il y a deux problèmes techniques totalement différents. 2223 était totalement anormal, de long en large, même pixel par pixel et les équipements normaux comme SIFT n'ont pas marché dessus. D'un autre côté, l'IA d'apprentissage approfondi "l'état de l'art" est stupide et facilement dupée. Peut-être que vos 15k images sont comme 2223, jsp, mais j'en doute, les ingénieries anormales comme celles-ci demandent-elles autant de travail à travers autant d'images ?
Il y a réellement une explication scientifique, et non-anormale pour votre problème, ça s'appelle des images contradictoires (juste pour être claire, les images dont vous parlez ont simplement l'air d'être des memes anormaux). Vous trouverez en pièce-jointe une image du papier de Szegedy. Vous et un réseau neuronal convolutionnel typique vont approuver le fait que l'image de gauche est un bus. Mais ajoutez certains parasites stratégiques, comme indiqué au centre, en haut, et vous obtiendrez l'image de droite. C'est resté un bus scolaire, mais la plupart des réseaux neuronaux vont maintenant penser qu'il s'agit d'une autruche. Des tours pas chers et non-anormaux pour bousiller des réseaux neuronaux approfondis aussi cons que des pierres.
Pour faire court, quelqu’un (en accord avec Dean ici, c’est probablement Celeramis) les remplit d’ordures délibérément pour rejeter les prédictions de MEDUSA. Vous remarquerez que les effets anormaux des 15k images bizarres sont extrêmement faibles. Ces choses sont simplement des "quasi-memes" désignés pour déformer les frontières de nos décisions et qui rendent le réseau qui essaie de différencier les risques VMD des images normales confus. En utilisant pour vous des termes moins techniques, imaginez peindre un tas de pommes en orange, et ensuite faire apprendre à un enfant qu’il s’agit d'oranges.
Laissez-moi réfléchir un moment à une solution plus permanente. J’ai cc Ached et Samhita pour cela. En attendant, faites juste un copié/collé du réseau plusieurs fois et faites un ensemble, ça semble trop beau pour être vrai, mais ça réduira la variance et aidera un peu avec les erreurs. Nous sommes à quoi, 85 % actuellement ? Ça devrait être assez pour nous en sortir ou nous rapprocher de la fin de cette défaillance. J’ai cc le Dr Fitzgerald de votre Équipe d’Implémentation pour ça.
Dr Wang
Opérateur de la FIM Mu-4 "Debuggers", Division IA
Pièce Jointe :
De : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Pour : Mary Wang [pcs.4um.mif|gnawm#pcs.4um.mif|gnawm]
Cc : Dean Ackermann [pcs.4um.mif|nnamrekcad#pcs.4um.mif|nnamrekcad], Samhita Reddy [pcs.4um.mif|ydderhs#pcs.4um.mif|ydderhs], Achmed Hafizyar [pcs.4um.mif|zifah#pcs.4um.mif|zifah], Kelly Fitzgerald [pcs.sesylana|ztif#pcs.sesylana|ztif]
Sujet : Re: Réparer MEDUSA
Dr Wang,
Merci beaucoup, Dr Wang. Je pense que l’Équipe d’Implémentation a trouvé l’explication vraiment utile. Je demanderai au Dr Fitzgerald de continuer ses recherches sur ce que vous suggérez.
Je suis d’accord quand au fait que la stabilité de MEDUSA laisse beaucoup à désirer, mais je crains que nous n’ayons pas vraiment d’options alternatives pour le moment. Il y a juste tellement à examiner sur internet et tellement de requêtes venant de la Fondation que nous ne pouvons vraiment pas retourner aux vieux jours, quand on envoyait juste des classe-D sur ces VMD.
Cordialement,
Dr Vuković
Directeur du Projet MEDUSA
Incident 3334-2 (en cours) : Depuis le ██/██/20██, la précision à l’échelle du monde réel du Projet MEDUSA s’est comporté de manière erratique, plongeant souvent sous l’optimal de 99,9 %, avec une moyenne à 95 %. Le 04/██/20██ en particulier, la capacité a chuté en-dessous du seuil de 90 % jusqu’à stagner à 71%, déclenchant une défaillance de MEDUSA ainsi que ██ brèches de confinements et le déclenchement de ███ risques VMD, bien qu'il ait récupéré le lendemain et soit resté au-dessus de 90 % depuis. Les standards de SCP-3334-2 et les réversions de la base de codes n’ont eu aucun effet, ou l'ont parfois empiré. Une fréquence de brèches de confinement et de déclenchement de dangers VMD légèrement plus élevée ont été associées avec cette performance détériorée. Les causes de cette chute de performance sont encore inconnues, malgré les recherches actives par l’Équipe de Test et la FIM Mu-4.
De : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Pour : Mary Wang [pcs.4um.mif|gnawm#pcs.4um.mif|gnawm]
Sujet : Re : Encore MEDUSA
Dr Wang,
Désolé de vous déranger à ce propos une nouvelle fois, mais votre équipe a-t-elle fait des progrès ? les membres hauts placés du Département des Analyses veulent en savoir plus.
Cordialement,
Dr Vuković
Directeur du Projet MEDUSA
De : Mary Wang [pcs.4um.mif|gnawm#pcs.4um.mif|gnawm]
Pour : Vladimir Vuković [pcs.sesylana|kuvv#pcs.sesylana|kuvv]
Sujet : re : Encore MEDUSA
Au Dr Vuković,
Désolé pour les délais, c’est juste que Mu-4 est affilié à beaucoup de SCP différents, mais nous avons toujours au moins une personne qui garde un œil sur cette partie du forum. On ne parvient vraiment pas à expliquer ce qui se passe. Ça peut être ces VMD en liberté qui ont drastiquement changés, ou tout simplement quelque chose qui est à peine décalé dans quelques uns des millions de poids de MEDUSA, ou il y a un hyper-paramètre parmi des dizaines qui pourrait être un peu mieux ajusté. Vous utilisez de l’auto-réglage pour ces hyper-paramètres, c’est exact ? Je crois que quelqu'un aux Analyses développe quelque chose y ressemblant, mais pour un réseau neuronal entier ; quand ce sera prêt, vous pourrez recommencer et essayer cela pour voir s'il parvient à se débarrasser du petit problème. Je vous ferai savoir si nous faisons des progrès de notre côté.
La seule chose qui m’inquiète est l’une des premières choses que l'on apprend en machine learning, qui est le compromis de biais-variance. En bref, vous pouvez soit faire une IA qui marche vraiment bien en labo, soit une qui marche pas trop mal dans le monde réel, mais pas les deux. Généralement, plus le modèle créé est compliqué, plus vous réduisez le biais au détriment de la variance – au plus le modèle est détaillé, au plus il perdra de vue la situation générale.
Chaque fois que nous avons une solution ou que nous essayons d’en improviser une, notre réaction a toujours été de faire plus de maths par-dessus tout ce que nous avions déjà pour le réparer. Alors cela va continuer à marcher tant bien que mal jusqu’à ce que ça commence à faillir aléatoirement et imprévisiblement dans le monde réel avec tous ces skips réels et ces personnes réelles qui s'appuieront dessus comme le 04/██/20██. Et cela le fera plus souvent, à chaque fois que nous y foutrons des algorithmes "état de l'art".
Dr Wang
Opérateur de la FIM Mu-4 "Debuggers", Division IA