767 Shares 8431 views

Co to jest trafność

Po wpisaniu zapytania na stronę wyszukiwarki lub w polu wyszukiwania (u góry ekranu) przeglądarka zaczyna otrzymywać zdarzenia, które są ukrywane przed zwykłymi użytkownikami. Jak więc są informacje w szerokiej sieci WWW, a co to jest trafność wyszukiwania? To samo słowo pochodzi od łacińskiego "relevo" i jest tłumaczone na język rosyjski jako "podbić" lub "ułatwiać". Angielskim odpowiednikiem tego terminu jest "relewancja". W punkcie 3.5.1 GOST 7.73-96 ten pojęcie jest rozszyfrowany, a "trafność" i "istotny" mają taką samą definicję, która jest zgodna z informacjami otrzymanymi przez żądanie informacyjne użytkownika.


Niniejsza norma państwowa zawiera również inne przydatne ujednolicone terminy i definicje odnoszące się do obszaru wyszukiwania informacji i jego rozpowszechniania za pomocą systemów informacyjnych zautomatyzowanych. Dokument pomaga zrozumieć znaczenie wielu słów w działalności informacyjnej, wydawniczej lub bibliotecznej, a nie tylko takiej jednostce językowej jako "trafności". Definicja terminów "niepewność" i "kontynentalny" jest również interpretowana w punkcie 3.5.2 w GOST 7.73-96. Powinny być interpretowane jako spójność otrzymanych informacji o informacji. Często ta koncepcja jest mylona z trafnością, co jest fundamentalnie nieprawdziwe, ponieważ w jednym przypadku chodzi o dopasowanie zapytania, aw drugim przypadku chodzi o korespondencję potrzeb. Niepoprawne jest też udzielenie odpowiedzi na pytanie: "co to jest trafność?" Aby odpowiedzieć, że termin ten jest zbliżony do pojęcia "adekwatności", to znaczy praktycznej przydatności wyniku.

Ale jak to jest informacja? Wyszukiwarka korzysta z armii botów – autonomicznych programów, które odwiedzają strony internetowe i przechowują informacje o nich. Nazwa pochodzi od angielskiego słowa "bot", czyli skrótu z "robota". Programy te znajdują nowe witryny, a następnie przejdź na stronę główną i przeglądaj jej zawartość. Boty uczą się stron związanych z domem (w przeglądarce jest ładowana najpierw) wewnętrzne linki. Również boty przeglądają linki wskazujące na inne witryny, czyli zewnętrzne linki. Przechowywując te informacje, przechodzą przez nie, odkrywają wszystkie nowe witryny i dowiadują się, jak powiązane są zasoby internetowe. W ten sposób niestrudzenie studiują "mapę" World Wide Web. Ale co ma znaczenie? Co to ma wspólnego z botami?

Na konkretnym przykładzie przyjrzyjmy się wyszukiwarkom Yandex i Google. Na pytanie "co ma znaczenie?" W wydaniu Yandex było 28 milionów odpowiedzi, a Google – 155 000. Tutaj możesz powiedzieć, że wszyscy spełniają prośbę, a potrzeby nie zawsze są, tzn. Nie wszystkie będą trwałe. Na przykład strony, w których prezes zarządu Wikipedii zostanie wyjaśniony pojęcie to będzie niewątpliwie użyteczny, a strona dotycząca znaczących i nieistotnych kosztów w podejmowaniu decyzji nie ma znaczenia dla tego tematu. Wyraźniejszym przykładem jest to, że gdy Yandex wydało 31 milionów odpowiedzi na prośbę "hands up", co implikuje informacje o grupie muzycznej, a wśród nich jest artykuł, wzywający do podniesienia rąk, ponieważ to według fizjoterapeutów jest bardzo przydatne. Ta odpowiedź nie może być uznana za wieczystą, chociaż z 31 milionów odpowiedzi, zajmuje 586. pozycję w ekstradycji.

Im wię kszy trafność tekstu, tym bardziej prawdopodobne jest, że bę dzie on wchodzić do pierwszych pozycji odpowiedzi wyszukiwania. Ten wskaźnik ma ocenę ilościową, ale algorytmy jej implementacji w różnych wyszukiwarkach różnią się i są nieznane dla użytkowników i zmieniają się wraz z upływem czasu, ponieważ wyszukiwarki próbują zwiększyć liczbę ocen, starają się dostarczyć trafnych informacji, skracając czas wyszukiwania. Bardzo istotne są strony, w których wystąpienie słowa kluczowego zbiegającego się z zapytaniem może wynosić od 3 do 7%. Ale nie jest to jedyne kryterium ważności dokumentu. Obejmują one szereg wewnętrznych i zewnętrznych wskaźników. Wskaźniki wewnętrzne (z wyjątkiem gęstości słów kluczowych) to ich pozycja w tekście (wprowadzanie tytułu, zbliżenie do tytułu i siebie, tworzenie się prawdopodobnych zwrotów wyszukiwania), a także obecność synonimów, potwierdzających zgodność treści tekstu z zapytaniem. Główny wskaźnik zewnętrzny jest uważany za popularność w sieci globalnej, wskazany przez PageRank z Google, TIC z Yandex i Tor100 z systemu Rambler. Oznacza to, jak często strona jest przenoszona z innych witryn, lepiej jest, jeśli są one z wysoką oceną. To jest znaczenie.