« Yandex » a appris à répondre plus précisément aux requêtes complexes
Nouvelles Services Web / / December 19, 2019
Le nouvel algorithme « Yandex » convertit la requête de recherche, et plusieurs sites sur les unités sémantiques ou soi-disant vecteurs sémantiques. Une fois qu'un utilisateur saisit une requête, le moteur de recherche compare les vecteurs avec le titre et le contenu de sites potentiellement appropriés. algorithme précédent « Palekh » ne pouvait comparer les vecteurs sémantiques de la requête et les en-têtes, et « Korolev » scanne les pages web entièrement.
« Yandex », explique l'algorithme « Korolev » comme un exemple de « Guerre et Paix ». version précédente peut rechercher uniquement pour trouver un livre par titre ou mot-clé associé au contenu: les noms des personnages, des titres de chapitre, et ainsi de suite. Un nouvel algorithme se lit comme un roman et comprend parfaitement le sens du récit.
Selon les développeurs, le principal avantage de comprendre la signification des requêtes que la langue de recherche devient plus humain. L'utilisateur ne peut pas rechercher un film par son nom, mais simplement décrire brièvement l'intrigue. Par exemple: « un film sur l'espace dans lequel le héros parlait à sa fille par l'horloge. » Les algorithme qui réalise un il y a un film « Interstellar », où le héros est Matthew McConaughey a été dans l'espace et utiliser l'horloge pour communiquer avec sa fille. Et ce film sera montré dans les résultats de recherche.
Pour chercher à comprendre que la signification de la requête porte sur le contenu d'une page Web, vous devez utiliser une grande échelle réseau de neurones. Pour sa formation aura besoin des milliards d'exemples, de sorte que les utilisations « Yandex » de ses utilisateurs pour les algorithmes de formation.
Si une personne est déplacée à partir des résultats de recherche sur le site et est resté sur elle, le plus probable, l'algorithme a fonctionné correctement. Le réseau de neurones est formé sur un mauvais exemple: si le lieu est immédiatement arrêté ou tout simplement raté, le système se souviendra. Alors que, dans l'avenir, la recherche devrait mieux fonctionner et mieux.