Comment déterminer que le texte a été écrit par un réseau de neurones
Miscellanea / / August 21, 2023
L'intelligence artificielle est un bon assistant dans de nombreux domaines. Mais vous ne devriez pas lui faire confiance inconditionnellement.
Par données Bloomberg, environ 30% des spécialistes utilisent des réseaux de neurones pour générer du texte. En Russie, 67% des répondants voulez postuler dans le travail de l'intelligence artificielle pour travailler moins et ne pas perdre de revenus. C'est juste que de telles statistiques ne plaisent pas à tous les clients. Certains ne font pas confiance aux réseaux de neurones, ils préfèrent donc que les textes ne soient pas écrits par des robots, mais par des personnes.
Nous comprenons pourquoi les clients se méfient des technologies et quels moyens d'exposer les neurotextes existent aujourd'hui.
Pourquoi les textes des réseaux de neurones doivent être traités avec prudence
Voici les principales raisons pour lesquelles les clients se méfient de ces articles.
Risque de violation du droit d'auteur
Aujourd'hui, il n'y a pas de position officielle sur la question de savoir qui
appartenir droit d'auteur pour les textes créés avec l'aide de l'IA. Selon la loi, un auteur est une personne qui crée une œuvre par un travail créatif ou intellectuel. Cependant, dans le cas de réseau neuronal les gens ne font que donner des instructions, mais n'écrivent pas eux-mêmes.Étant donné que la loi ne reconnaît plus les neurotextes comme objets de droit d'auteur, les règles d'utilisation du contenu généré par les technologies sont déterminées dans l'accord d'utilisation du réseau de neurones.
Et si OpenAI transmet droits sur le texte même dans la version gratuite, alors Gerwin limites son utilisation à des fins politiques, discriminatoires ou dans une publicité défavorable. Et en à mi-parcours utiliser le contenu à des fins commerciales Peut uniquement si le produit est généré à un tarif payant.
Risque d'obtenir des informations non uniques ou inexactes
Le réseau de neurones reçoit une requête, la transmet à des algorithmes, analyse les informations disponibles sur le sujet et émet une réponse. Sans nier que la même demande d'un autre utilisateur peut produire un texte similaire ou similaire.
Et voici un nouveau danger. Des chercheurs de l'Université Cornell ont proposé conclusion: si les réponses du réseau de neurones à la même question varient considérablement, alors avec une forte probabilité, il propose des faits.
Le risque que les neurotextes réduisent les ressources de l'entreprise dans les résultats de recherche
À la fin de l'année dernière, le spécialiste de la qualité Google Duy Nguyen déclaréque l'entreprise a mis en place des algorithmes pour détecter et rétrograder le contenu créé intelligence artificielle. Par conséquent, beaucoup craignent que les moteurs de recherche recherchent un tel contenu et le pessimisent. Autrement dit, pour abaisser la position dans les résultats de la recherche.
Les précédents existent déjà. Par exemple, le spécialiste du marketing Neil Patel a dépensé expérienceen créant 50 sites Web de test, qu'il a divisés en deux groupes. L'expert a rempli les sites de la première partie d'articles créés exclusivement par l'intelligence artificielle. Les sites du second hébergeaient des articles d'IA modifiés par des personnes, ainsi que des documents écrits par des rédacteurs sans l'utilisation de réseaux de neurones.
Les résultats de l'expérience ont montré que les ressources du premier groupe ont perdu plusieurs positions dans les résultats de recherche. Et cela a conduit à diminuer trafic jusqu'à 70%.
Dans le même temps, les représentants de Google ont ajouté qu'ils avaient une attitude positive envers le développement des réseaux de neurones et qu'ils avaient déjà créé leur propre Chatbot Barde. Mais pour l'entreprise, des textes de qualité sont une priorité. Le système, qui hiérarchise les résultats, propose tout d'abord aux utilisateurs des matériaux qui répondent normes E‑E‑A‑T (expérience, compétence, crédibilité, crédibilité).
Les textes qui leur correspondent inspirent confiance et sont jugés utiles car ils contiennent des exemples, des expériences, une partie analytique et des recherches. Et le contenu créé par les réseaux de neurones, sans raffinement approfondi supplémentaire par une personne, n'est souvent pas tel.
Pendant ce temps, à la Douma d'État suggéré introduire un étiquetage pour les matériaux créés avec l'aide de l'IA. En attendant, déterminez que le texte généré par un réseau de neurones, devra le faire vous-même. Ou avec l'aide de services spéciaux.
Comment déterminer indépendamment que le texte a été écrit par un réseau de neurones
L'Université Technologique MIREA s'est récemment tenue expérience, auquel ont participé 20 enseignants et plus de 200 élèves. La moitié d'entre eux rédigent eux-mêmes des articles scientifiques. Et les 50% restants ont utilisé l'aide de réseaux de neurones. Les enseignants, quant à eux, devaient calculer ces matériaux d'IA.
Pour ce faire, les enseignants ont prêté attention aux caractéristiques stylistiques et orthographiques du texte. Par exemple, pour un grand nombre de mots et de sens répétitifs, réels et logiques erreurs, manque de jugements originaux. De cette manière, les enseignants ont pu identifier 96% des travaux écrits à l'aide du réseau de neurones. 4% des étudiants qui n'ont pas été exposés ont admis avoir passé de nombreuses heures à éditer des textes d'IA.
Il n'y a pas d'instruction universelle qui aidera à calculer le texte généré par le réseau de neurones. Cependant, l'expérience montre que des motifs similaires sont inhérents à ces matériaux. Considérons-les plus en détail.
Répétitions de sens et de mots
L'une des raisons pour lesquelles un site est abaissé dans les résultats de recherche est la réoptimisation des mots clés. Le réseau de neurones en réponse à une requête « répond souvent en cercle ». Parfois, elle utilise différentes occurrences, mais le sens est toujours répété.
Ainsi, dans la capture d'écran ci-dessous, l'intelligence artificielle a été chargée de rédiger un article de vente sur une nouvelle façon douce de teindre les cheveux. Et dans un petit texte, le réseau de neurones a répété à plusieurs reprises les mêmes thèses.
Presque chaque phrase texte généré l'expression "une nouvelle façon de colorer" est répétée. Et aussi il y a une duplication répétée des significations sur la sécurité de la méthode et une approche individuelle, qui mettra l'accent sur le caractère unique de chaque client.
Voici quelques citations du texte illustrant cela: « transformer votre image et exprimer votre individualité », « tenir compte de votre individualité », « vous convenir », « créer pour vous look unique et élégant", "rendez votre coiffure unique", "préservez la santé et la brillance de vos cheveux", "sans danger pour vos cheveux", "prenez soin de vos cheveux, préservez-les santé".
En attendant, il suffisait de mentionner une fois qu'une nouvelle procédure avait été présentée dans le salon - épargnant méthode de colorationqui gardera les cheveux vivants. Et expliquez également comment fonctionne la méthode, quelle est sa nouveauté et pourquoi elle est sûre. Et ajoutez que la palette de couleurs est variée et que les maîtres formés effectueront non seulement une coloration de haute qualité, mais aideront également au choix de la couleur.
La présence dans le texte d'un grand nombre de timbres et de clichés, le manque d'expérience sensorielle
L'exemple de coloration montre également qu'un réseau de neurones ne peut pas imiter la façon dont une personne parle dans la vie réelle. Les gens scellent, utilisent argot et les abréviations, déforment intentionnellement les mots. Une telle présentation permet d'attirer l'attention, d'évoquer des émotions, de transmettre la position de l'auteur, son expérience sensorielle.
Recherche montrer: le réseau de neurones ne partage pas les sentiments, n'accepte la position de personne. Dès lors, il préfère la neutralité, les clichés et les clichés. Dans l'exemple ci-dessus, il s'agit de "compétences professionnelles", "matériaux de haute qualité", "opportunité unique".
Dans le même temps, le réseau de neurones génère des textes dans différents styles. Par exemple, vous pouvez lui confier la tâche de préparer un matériel sur le thème "Qu'est-ce qui affecte le coût de huile». Mais pour préciser que le texte ne doit pas être écrit dans un langage sec, mais avec l'ajout de métaphores et de comparaisons. Cependant, le résultat est encore artificiel. Après tout, l'IA n'a pas de mesure, elle ne "sent" pas le texte comme une personne le fait.
1 / 0
2 / 0
L'un des paragraphes aidera à voir que le résultat obtenu ne peut être comparé à l'intonation inhérente à une personne: « La demande et l'offre sont comme une danse de deux amants sur le marché du pétrole. Si demande de pétrole monte comme un océan déchaîné, et si l'offre ne parvient pas à suivre, les prix montent comme le champagne lors d'une fête du Nouvel An. Mais si la demande baisse et que l'offre augmente, les prix peuvent chuter comme un ballon lors d'une fête d'enfants."
Le texte semble artificiel et la plupart des virages sont déplacés. Et même si le post s'est vraiment avéré "pas sec", il est difficile d'imaginer qu'un expert aurait écrit de cette façon. De plus, chaque phrase est littéralement une métaphore et une comparaison. Cependant, ces techniques doivent être précises et soigneusement intégrées dans le texte. Sinon, le sens sera perdu derrière un excès d'images.
Présence de phrases dénuées de sens et manque de logique
Le linguiste Noam Chomsky dans son livre Syntactic Structures note que la construction grammaticalement correcte des phrases dans une phrase ne garantit pas la présence de logique et sens. À titre d'exemple, l'expert a cité l'expression "les idées vertes incolores dorment furieusement" - "les idées vertes incolores dorment furieusement".
Les algorithmes aident le réseau de neurones à construire des phrases correctes en termes de grammaire. Cependant, pour l'IA, il n'y a pas de concept de "sens". Et il peut avoir sa propre logique pour chaque paragraphe, puisque le matériel est obtenu à partir de différentes sources.
Par exemple, un réseau de neurones a été sollicité pour générer des avis sur un gel douche et un survêtement. Le texte sur les vêtements s'est avéré comme ceci: «Avec l'aide d'un costume, vous pouvez vous détendre, vous immerger dans le monde du sport et aussi vous promener. Il a un contrôle de la température, grâce auquel vous vous sentez à l'aise dans n'importe quelle situation.
Et voici un avis sur le gel douche: « Merveilleux gel, ne coule pas, n'alourdit pas la peau. Emballé dans un sac, dans une boîte, avec un couvercle. Pas besoin d'attendre quoi que ce soit en plus pour qu'il s'effrite un peu. Peut être utilisé comme gel douche de nuit.
Quelques phrases en eux bien construit, mais semblent en même temps absurdes et ressemblent à l'illustration de Chomsky.
Manque de texture et exemples superficiels
L'intelligence artificielle donne des informations évidentes dans les textes, des faits généraux, utilise des phrases simplifiées et des exemples qui ne révèlent pas beaucoup la question. Dans ce cas, la complexité du sujet n'a pas d'importance. La question peut être profonde, comme les perspectives de développement inclusions en Russie. Ou plus simple et individuel, concernant le choix de la technique.
Dans le texte sur l'inclusion, le réseau de neurones a expliqué à quel point ce sujet est important et pertinent. Elle a également ajouté que l'inclusion est un long processus, accompagné de difficultés, mais que des travaux sont en cours pour créer des conditions pour les personnes ayant des besoins spéciaux. Et en résumé: si vous ne vous arrêtez pas, le développement le sera certainement.
Cependant, ce qui est écrit ne répond pas à la question. Il est important que le texte soit précis. Par exemple, vous pouvez analyser lesquelles des lois adoptées fonctionnent et lesquelles ne fonctionnent pas, et pourquoi. Révéler l'expérience étrangère. Et expliquez quelles mesures concrètes l'État, les entreprises et chaque personne peuvent encore prendre pour développer l'inclusion.
Dans le texte sur achat d'un smartphonegénérés par le réseau de neurones, les facteurs de sélection évidents sont également indiqués. Par exemple: vous devez décider du système d'exploitation (iOS ou Android), de la marque, lire les critiques et les spécifications techniques, et également prendre en compte vos propres capacités.
1 / 0
2 / 0
Cependant, les gens comprennent cela. Une autre chose est de parler des puces des systèmes d'exploitation, d'indiquer les limitations qui existent pour le moment. Ou mentionnez des solutions innovantes - par exemple, la technologie eSIM, qui vous permet d'avoir jusqu'à cinq numéros dans un seul smartphone. Ou partagez des modèles d'appareils hors de prix et leurs homologues au meilleur prix.
Déformation des faits, ajout d'informations inventées
Le réseau de neurones répond de manière plausible à presque toutes les questions, fournissant une chronique, des dates, des noms de famille, une histoire d'origine. Dans ce cas, l'information est déformée ou complètement inventée. Un tel bogue dans le travail de l'IA s'appelle une hallucination.
Ainsi, le réseau de neurones s'est vu confier la tâche de raconter le fameux les sourdsqui ont grandement contribué au développement de la société. En conséquence, l'IA en a inventé la plupart.
1 / 0
2 / 0
Par exemple, l'astronaute Raymond Lou ou le boxeur Mario Gallegos. Et le 42e président des États-Unis n'était toujours pas Matthew Clinton, mais Bill Clinton. Et il n'a pas perdu l'ouïe.
De plus, AI a répondu avec confiance à la demande "écrire un article sur la création amnésie». Même si ce terme n'existe pas.
Lorsqu'on lui demande pourquoi le bot invente des gens et parle de termes inexistants, il ne fait que s'excuser pour une éventuelle confusion.
1 / 0
2 / 0
Lorsque de faux faits sont entrelacés avec de vraies données, il est plus difficile de détecter les hallucinations du réseau neuronal. En particulier lorsque lecture fluide. Mais si vous vous concentrez sur les exemples donnés dans le texte, vous pouvez remarquer ceux qui semblent suspects et les vérifier en les tapant dans la barre de recherche.
Manque d'informations à jour sur les changements actuels, les événements
Les réseaux de neurones s'auto-apprennent lors de la communication avec les utilisateurs, se souvenant des clarifications d'une personne, de sa réaction au contenu généré, des exemples qu'une personne partage avec un bot. Experts notéque la capacité d'auto-apprentissage de l'IA les a surpris. Et que cette compétence aide les réseaux de neurones à s'améliorer.
Où apprentissage automatique, menée par des développeurs sur des gigaoctets de données - articles, livres, textes du Web - a un début et une fin clairs. Et fondamentalement, les réseaux de neurones n'ont pas accès aux moteurs de recherche. Par conséquent, les informations apparues après la formation dispensée par les développeurs ne sont pas disponibles pour l'IA jusqu'à l'étape suivante.
Dans le même temps, l'intervalle entre l'apprentissage automatique est de plusieurs mois, voire d'années. Bien sûr, les progrès ne s'arrêtent pas: par exemple, en mai de cette année, GPT Plus est devenu disponible pour les utilisateurs avec un abonnement payant. ChatGPT avec accès Internet. Cependant, la plupart des réseaux de neurones, en particulier leurs versions gratuites, n'ont pas encore une telle opportunité.
Ainsi, la base de la version gratuite de ChatGPT4 est limitée à 2021, donc le bot ne sait pas qui a remporté la dernière Coupe du monde en 2022. Et le réseau neuronal de Google - Bard AI - a admis qu'il ne pouvait pas composer un texte sur les événements importants qui se sont déroulés dans le monde cet été.
1 / 0
2 / 0
Depuis sa dernière formation dispensée par les développeurs en mai 2023, l'été n'est pas encore arrivé pour Bard AI.
Dans de tels cas, les réseaux de neurones ne fournissent généralement pas de faits, mais admettent qu'ils ne peuvent pas "prédire l'avenir».
Si le texte ne contient pas d'informations à jour sur le sujet ou s'il semble séparé de la réalité, car beaucoup de choses ont changé récemment, il est alors possible que le matériel ait été écrit par un réseau de neurones.
Quels services peuvent aider
Le texte généré par l'intelligence artificielle peut également être reconnu à l'aide du réseau de neurones lui-même. Par exemple, il peut robot GPT-4. Des services spéciaux capables de détecter les algorithmes d'IA peuvent également aider. Regardons certains d'entre eux ci-dessous.
- Text.ru. Le site se positionne comme une bourse de rédaction et anti-plagiat. Mais récemment, un neuro-assistant rémunéré est apparu sur le portail. L'une de ses fonctions est un détecteur d'IA. Le texte à vérifier doit être chargé dans la fenêtre. Après quelques secondes, le système donnera le résultat.
- PR CY. Vous pouvez télécharger des textes de 1 000 caractères vers le service. Dans le même temps, il y a des clarifications sur le portail: des options spammées de mauvaise qualité qu'une personne a écrites, le système considérera comme le résultat du travail de l'IA. Ainsi que des textes aux couleurs stylistiques vives - par exemple, similaires à des œuvres Maïakovski.
- GPTZéro. L'outil lit la complexité, la combinaison de mots, la structure et la longueur des phrases. Cependant, si le service gère bien les textes en anglais, il génère souvent une erreur lors du chargement de documents en russe. Parmi les avantages - la présence d'une version gratuite.
Un réseau de neurones peut être une aide précieuse. Par exemple, lors de la recherche d'idées. Cependant, faire entièrement confiance à son contenu est dangereux. Vous devez traiter les documents d'IA de manière responsable: modifiez les spams, vérifiez l'exactitude, la logique et la pertinence des faits. Et ajustez le style au langage "humain", afin de ne pas effrayer le public, de sauvegarder la réputation et la position de l'entreprise dans les résultats de recherche.
Lire aussi🤖
- 6 raisons pour lesquelles il ne faut pas faire aveuglément confiance à l'intelligence artificielle
- Comment ajouter un bot à Discord
- 6 réseaux de neurones pour créer des logos