Un mesaj pe tema modalităților de căutare pe Internet. Trei modalități principale de a căuta informații pe Internet. Găsirea informațiilor singulare

22.12.2020 Programe

Se pot distinge următoarele metode principale de căutare a informațiilor pe Internet, care, în funcție de scopurile și obiectivele celui care caută, sunt utilizate individual sau în combinație între ele:

1. Căutare directă folosind link-uri hipertext

Deoarece toate site-urile din spațiul WWW sunt de fapt conectate între ele, căutarea informațiilor se poate face prin vizualizarea secvențială a paginilor conexe folosind un browser.
Deși această metodă de căutare complet manuală pare complet anacronică pe un Web care conține peste 60 de milioane de noduri, navigarea „manuală” a paginilor Web este adesea singura opțiune în etapele finale ale căutării informațiilor, când „săpătura” mecanică face loc unei analize mai profunde.
Utilizarea cataloagelor, a listelor clasificate și tematice și a tot felul de directoare mici se aplică și acestui tip de căutare.

2. Utilizarea motoarelor de căutare

Astăzi, această metodă este una dintre principalele și, de fapt, singura metodă atunci când se efectuează o căutare preliminară. Rezultatul acestuia din urmă poate fi o listă de resurse de rețea care fac obiectul unei analize detaliate.
De obicei, utilizarea motoarelor de căutare se bazează pe utilizarea cuvintelor cheie care sunt transmise serverelor de căutare ca argumente de căutare: ce să căutați.
Dacă este făcută corect, generarea unei liste de cuvinte cheie necesită o muncă preliminară privind compilarea unui tezaur.

3. Căutați folosind instrumente speciale

Acesta este complet metoda automatizata poate fi foarte eficient pentru efectuarea unei căutări inițiale.
Una dintre tehnologiile acestei metode se bazează pe utilizarea unor programe specializate - păianjeni, care scanează automat paginile Web, căutând informațiile necesare despre acestea.
De fapt, aceasta este o versiune automată a navigării folosind link-uri hipertext, descrisă mai sus (motoarele de căutare folosesc metode similare pentru a-și construi tabelele de index).
Inutil să spun, rezultatele căutare automată necesită în mod necesar o prelucrare ulterioară.
Aplicație aceasta metoda Este recomandabil dacă utilizarea motoarelor de căutare nu poate oferi rezultatele necesare (de exemplu, din cauza naturii nestandardizate a interogării, care nu poate fi specificată în mod adecvat de instrumentele existente ale motoarelor de căutare).
În unele cazuri, această metodă poate fi foarte eficientă.
Alegerea între utilizarea unui păianjen sau a motoarelor de căutare este o variantă a alegerii clasice între utilizarea instrumentelor universale sau specializate.

1.4 Analiza resurselor noi

Căutarea prin resurse nou create poate fi necesară atunci când se efectuează cicluri repetate de căutare, se caută cele mai recente informații sau se analizează tendințele de dezvoltare a obiectului de studiu în timp.
O alta motiv posibil Este posibil ca majoritatea motoarelor de căutare să își actualizeze indexurile cu o întârziere semnificativă cauzată de volumele enorme de date procesate, iar această întârziere este de obicei mai mare cu cât subiectul de interes este mai puțin popular.
Această considerație poate fi foarte semnificativă atunci când se efectuează o căutare într-un domeniu foarte specializat.

ÎN retea globala Puteți găsi informații despre orice subiect de interes pe Internet. Dar cel mai dificil lucru în lucrul pe Internet este să găsești informațiile de care ai nevoie. Întrucât Internetul nu are o structură centralizată clară, se dezvoltă haotic, iar în lume apar tot mai multe servere noi, problemele căutării de informații devin foarte relevante.

Motoarele de căutare facilitează mult lucrul pe Internet și ne ajută să găsim rapid informațiile de care avem nevoie pe o gamă largă de servere de Internet. Există câteva mii de motoare de căutare pe World Wide Web, inclusiv cele bine stabilite și altele mai puțin cunoscute.

Cele mai populare motoare de căutare

  • Yandex— un mijloc de regăsire a informațiilor în text integral, ținând cont de morfologia limbii ruse; căutați pe site-uri, catalogul dvs., știri, produse, hărți geografice, dicționare, bloguri, imagini, documente Microsoft Birou și Adobe Acrobat PDF
    • Yandex
  • Hoinar(OJSC Rambler Internet Holding) - caută pe site-uri ținând cont de morfologia limbii ruse și limbi engleze; De asemenea, are un sistem de căutare în catalog.
    • Rambler Lite: motor de căutare— o versiune scurtă a paginii de căutare
  • Serviciu de căutare Sputnik(OJSC Rostelecom) - căutare pe site-uri, servicii guvernamentale etc.; Căutare în condiții de siguranță
  • NIGMa - motor de căutare inteligent(M.V. Lomonosov Moscow State University și Stanford University) - căutați documente, imagini, cărți, știri prin Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; sistemul oferă, de asemenea, o căutare unică a formulelor și reacțiilor chimice
  • Google — căutați pe site-uri (este posibil să căutați pe site-uri în limba rusă); caută documente în formate Adobe acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 etc.; cauta poze, videoclipuri, stiri, cauta pe harti; capacitatea de a căuta pe site-uri în limba rusă și rusă; există un sistem de traducere a textului în alte limbi (49 de limbi)
  • Bing(Microsoft Corp.) - site-uri de căutare, imagini și videoclipuri; capacitatea de a căuta pe site-uri în limba rusă și rusă; există un sistem de traducere a textului în alte limbi (22 de limbi)
  • Yahoo!(Yahoo) - căutare după site-uri, adrese de e-mail etc.

Fiecare dintre motoarele de căutare are propriile avantaje și dezavantaje, care sunt determinate de principiul funcționării motorului de căutare, ușurința în utilizare, designul acestuia, complexitatea limbajului de interogare, prezența diferitelor funcții avansate (gestionarea formatului și clasarea informațiilor de ieșire, corectarea erorilor de ortografie și a aspectului eronat al tastaturii la introducerea cuvintelor cheie, traducerea paginii în alte limbi etc.), viteza de lucru și alți parametri. Alegerea unui motor de căutare pentru o anumită aplicație este determinată de scopul căutării, natura informațiilor căutate, formatul dorit al datelor de ieșire și lărgimea de acoperire a adreselor de server monitorizate în lumea Internetului.

Căutare după cuvinte cheie. Limbajul de interogare a motorului de căutare

Un motor de căutare are de obicei un câmp pentru introducerea cuvintelor cheie, pe care îl folosește pentru a găsi documente care conțin acele cuvinte cheie. Cu cât interogarea este mai bună (de calitate mai înaltă) către motorul de căutare, cu atât numărul total de documente găsite este mai mic, iar ele sunt mai multe documente care corespund cu ceea ce aveți nevoie. Dacă cererea este foarte simplă sau prost compusă, atunci motorul de căutare vă poate oferi câteva milioane de documente pe care nu le veți putea vizualiza în toată viața.

Utilizarea unui limbaj de interogare care conține operații logice (operatori booleeni ȘI, SAU, NU, paranteze etc.), prefixe care necesită prezența cuvintelor cheie în document «+» Și «-» (la căutarea unor termeni foarte specializați, este de preferat să se utilizeze), localizarea cuvintelor cheie în document în apropiere sau la o anumită distanță etc.) și alte elemente, și cantitate mare cuvinte cheie asociate acestora, puteți restrânge semnificativ zona de căutare și puteți face o cerere mai bună către serverul de căutare. Trebuie luat în considerare faptul că diferitele motoare de căutare pot avea limbaje de interogare diferite sau foarte asemănătoare.

Unele motoare de căutare au în plus o funcție Cautare Avansata, permițând utilizatorului să descrie mai precis ceea ce are nevoie în mod specific fără a cunoaște limbajul de interogare. Funcția de căutare avansată este disponibilă, de exemplu, în motoarele de căutare Yandex și Google.

Principalele tipuri de motoare de căutare. Ce motor de căutare să folosești

Există 2 tipuri principale de motoare de căutare pe Internet: index și clasificare (catalog). Motoarele de căutare indexate (de exemplu, Yandex, Rambler, Sputnik, Google, Bing etc.), lucrând în modul automat de actualizare a informațiilor lor, răsfoiește conținutul serverelor de pe Internet, indexează informațiile conținute în acestea și introduc informații despre locația cuvintelor pe paginile site-ului în bazele lor de date. Motoarele de căutare de catalog (de exemplu, Rambler, Yahoo! etc.) conțin un catalog structurat tematic de servere și sunt actualizate cel mai adesea manual. De obicei, pagina WWW a unui motor de căutare de clasificare conține și un câmp pentru introducerea cuvintelor cheie pentru căutare în propria bază de date. În sistemul de căutare în catalog, puteți începe cu un titlu tematic mai mare și coborând treptat mai departe prin rubrici, pentru a ajunge la un link către site-ul de care aveți nevoie. În unele cazuri este mai convenabil să folosiți primul tip de motoare de căutare, în altele - al doilea. Există motoare de căutare care combină ambele principii de funcționare. În special, multe motoare de căutare indexate au și un sistem de căutare în catalog. De asemenea, motoarele de căutare pot folosi alte principii ale metodelor de căutare.

Multe motoare de căutare s-au transformat în portaluri de internet care combină un număr mare de resurse și servicii. Pe paginile unor astfel de portaluri puteți citi știrile, consultați programul TV, aflați despre vreme, cursurile de schimb, folosiți un serviciu de hărți și multe altele. etc.

Cele mai populare motoare de căutare rusești au capacități de căutare ținând cont de particularitățile limbii ruse.

Pentru a căuta simultan în mai multe motoare de căutare, puteți folosi așa-numitele metamașini de căutare, care accesează simultan mai multe instrumente de căutare, de exemplu, NIGMa.

Există, de asemenea, motoare de căutare specializate în căutarea unui subiect (de exemplu, tehnologia de informație, muzică, resurse dedicate naturii etc.)

Problema căutării pe World Wide Web nu este că există puține informații, ci că există multe. Căutarea de informații pe internet este piatra de temelie munca eficienta pe net. Posesia abilităților de căutare face ca Internetul să fie util pentru utilizator atât în ​​timpul serviciului, cât și în timpul liber.
Pentru organizarea căutărilor pe Internet există servicii specializate numite motoare de căutare.

Motoare de căutare.

Motoarele de căutare sunt sisteme software și hardware cu o interfață web care oferă posibilitatea de a căuta informații pe Internet.
Majoritatea motoarelor de căutare caută informații pe site-urile World Wide Web, dar există și sisteme care pot căuta fișiere pe serverele FTP, produse din magazinele online și informații în grupurile de știri Usenet. Pentru a căuta informații folosind un motor de căutare, utilizatorul formulează o interogare de căutare. La cererea utilizatorului, motorul de căutare generează o pagină cu rezultatele căutării. Astfel de rezultatele cautarii se poate combina Tipuri variate fișiere, de exemplu: pagini web, imagini, fișiere audio. Unele motoare de căutare preiau și date din baze de date și directoare de resurse de pe Internet.
Scopul unui motor de căutare este de a găsi documente care conțin fie cuvinte cheie, fie cuvinte legate într-un fel de cuvintele cheie. Motorul de căutare este mai bun cu cât returnează mai multe documente care sunt relevante pentru interogarea utilizatorului. Rezultatele căutării pot deveni mai proaste din cauza naturii algoritmilor. De exemplu, atunci când i se solicită animale de companie, serverul de căutare Yandex (vedeți mai multe despre el mai jos) oferă peste 14.000.000 de link-uri către pagini care conțin informațiile de care crede că are nevoie. Totuși, nu totul este atât de lin: atunci când vizitezi unele dintre paginile găsite, se dovedește că informațiile pe care le cauți nu sunt suficiente, sau chiar inexistente.
Pentru a căuta cu eficiență maximă, trebuie să știți cum funcționează serverele de căutare și să formulați corect o solicitare de căutare a informațiilor.

Cum funcționează motoarele de căutare

Motoarele de căutare funcționează prin stocarea informațiilor despre multe pagini web de pe care le preiau Pagini HTML. Principalele componente ale unui sistem de căutare: robot de căutare, indexator, motor de căutare. De obicei, sistemele funcționează în etape. În primul rând, robotul de căutare primește conținutul, apoi vizualizează conținutul site-urilor web. Abia atunci indexatorul generează un index care poate fi căutat. Un indexator este un modul care analizează o pagină, împărțind-o anterior în părți, folosind proprii algoritmi lexicali și morfologici.
Activitatea majorității motoarelor de căutare moderne se bazează pe indexul de citare, care este calculat de către indexator ca urmare a analizării legăturilor către pagina curentă din alte pagini de Internet. Cu cât sunt mai multe, cu atât este mai mare indicele de citare al paginii analizate, cu atât această pagină va fi afișată mai sus în rezultatele căutării și cu atât pagina va fi prezentată mai sus în lista resurselor găsite.

Reguli pentru construirea interogărilor de căutare

După cum sa menționat deja, există multe servere de căutare pe Internet, interne și străine.
Servere de căutare rusești: Yandex (www.yandex.ru); Rambler (www.rambler.ru); Aport (www.aport.ru) și Gogo (www.gogo.ru).

Servere de căutare străine: Google ( www.google.com); Altavista (www.altavista.com) și Yahoo! (www.yahoo.com).
Serverele rusești sunt mai potrivite pentru căutarea în limba rusă, serverele străine sunt mai potrivite pentru căutarea într-o limbă străină, deși Google face o treabă bună în căutarea în multe limbi. În ciuda pretențiilor multor proprietari de motoare de căutare că interogările pot fi scrise practic în limba pe care oamenii o folosesc pentru a comunica între ei, acest lucru este departe de a fi cazul. Datorită introducerii noilor tehnologii lingvistice, motoarele de căutare au devenit mult mai capabile să înțeleagă utilizatorul. Motoarele de căutare caută acum nu numai cuvântul solicitat, ci și formele acestuia, ceea ce face ca rezultatele căutării să fie mai precise. De exemplu, dacă interogarea de căutare conține cuvântul inteligent, atunci rezultatele sale vor conține nu numai acest cuvânt, ci și derivatele sale: inteligent, inteligent, precum și inteligență și chiar inteligență. Desigur, paginile cu forme de cuvinte nu vor fi printre primele rezultate de căutare, dar elementele de inteligență artificială sunt evidente. Este util să luați în considerare acest fapt atunci când construiți interogări de căutare.
Trebuie reținut că motoarele de căutare nu țin cont de cazul caracterelor atunci când procesează o solicitare și nu este deloc necesar să se folosească semne de punctuație în interogările de căutare, deoarece acestea sunt, de asemenea, ignorate de serverele de căutare. Cu toate acestea, atunci când se construiesc interogări complexe complexe, pentru care rezultatele căutării sunt de obicei mult mai apropiate de așteptat, se folosește punctuația tradițională. Majoritatea motoarelor de căutare pot gestiona greșelile de scriere. Dacă serverul de căutare consideră că există o greșeală sau o greșeală de tipar într-un cuvânt, vă va avertiza cu aceeași expresie: Poate că ați căutat....

Cuvinte pentru a interoga serverul de căutare

Există o expresie „O mașină trebuie să funcționeze, o persoană trebuie să gândească” și se spune despre o astfel de situație. Sarcina utilizatorului atunci când compune o interogare de căutare este să evidențieze cuvintele cheie, sarcina serverului de căutare este să proceseze interogarea introdusă în cel mai bun mod posibil. Să ne uităm la un exemplu care ilustrează greșeli tipice utilizatorii începători când caută pe internet. Motorul de căutare nu a returnat niciun rezultat util pentru interogarea „Enigme despre instrumente muzicale”. Apoi, utilizatorul decide să corecteze interogarea adăugând la ea și scriind: „ Ghicitori pentru copii despre instrumente muzicale” - rezultatele căutării s-au dovedit a fi chiar mai proaste decât cele precedente. Pentru acest exemplu O soluție bună a fost să căutați cuvântul cheie „ghicitori”. Există multe astfel de site-uri pe Internet, iar accesând site-ul propriu-zis și căutând puțin prin secțiunile acestuia, puteți găsi cu ușurință informațiile care vă interesează. Să formulăm câteva reguli pentru alcătuirea interogărilor:

  • alegeți doar cele mai importante cuvinte cheie legate de subiectul luat în considerare;
  • nu ar trebui să fie prea multe cuvinte, dar nici prea puține;
  • dacă rezultatele căutării sunt nesatisfăcătoare, utilizați termeni mai blânzi pentru cerere sau încercați să căutați în altul motor de căutare, deoarece Mecanismele motoarelor de căutare nu sunt aceleași, prin urmare, rezultatele pot varia și ele.

Cautare Avansata

Pentru a permite căutări mai eficiente pe Internet, motoarele de căutare oferă capabilități avansate de căutare, precum și căutări folosind limbajul de interogare. Căutare avansată - capacitatea de a căuta folosind mulți parametri diferiți. În acest scop, motoarele de căutare oferă pagini individuale, pe care puteți seta astfel de parametri. Principiile căutării avansate sunt similare pentru majoritatea motoarelor de căutare.
Sa luam in considerare caracteristici suplimentare căutați folosind exemplele motoarelor de căutare Yandex și Google, deoarece Yandex este cel mai popular server de căutare de pe internetul în limba rusă, iar Google este cel mai popular motor de căutare din lume. Când a căutat pe internet, Yandex a fost unul dintre primii care a luat în considerare morfologia limbii ruse, adică a folosit diferite forme ale cuvântului, așa cum am discutat mai sus. Accesând site-ul web www.yandex.ru, utilizatorul poate introduce o interogare și poate primi imediat rezultatele căutării sau puteți utiliza linkul Căutare avansată folosind pictograma și accesați pagina corespunzătoare (vezi figura de mai jos), unde puteți reglați fin parametrii de căutare.

Pagina de căutare avansată Yandex

Să luăm în considerare funcțiile suplimentare care pot fi utilizate pe pagina de căutare avansată: indicați propria locație (Moscova), indicați sub ce formă ar trebui să fie prezentate informațiile (Tipul fișierului), perioada de timp în care căutăm informații (pe zi, pe 2 săptămâni, pe lună, De la ..Înainte), în ce limbă ar trebui să fie prezentate informațiile (rusă, engleză Mai mult), și puteți specifica și adresa URL a site-ului etc.
Alegerea (Exact ca în interogare) este indicată motorului de căutare astfel încât morfologia cuvintelor de interogare să nu se modifice, ci să caute doar forma cuvântului care este specificat.

Limbajul de interogare

Limbajul de interogare este un sistem de comandă care vă permite să modificați parametrii de interogare din șirul principal de căutare folosind comenzi speciale. Axat pe utilizatori experimentați.
Deoarece limbajul de interogare este destul de complex și voluminos, vom prezenta doar principalele sale structuri care pot fi cele mai solicitate de utilizatori. Unele comenzi ale limbajului de interogare Yandex sunt prezentate în tabel.

Operator

Descriere

Sintaxă

Exemplu de cerere

Căutați documente care conțin în mod necesar un cuvânt evidențiat.

Este acceptabil să folosiți mai mulți operatori + într-o singură interogare.

„cuvântul 1 + cuvântul 2”

Se vor găsi documente care conțin în mod necesar cuvintele „bulevard” și „Moscova” și pot conține cuvântul „Șolokhov”.

Căutați după citare.

Căutați documente care conțin cuvinte de interogare într-o anumită secvență și formă.

"cuvântul 1 cuvântul 2... cuvântul N"

Se vor găsi documente care conțin acest citat.

Căutați după citat cu cuvinte lipsă.

Un operator * se potrivește cu un cuvânt lipsă.

Atenţie! Poate fi folosit doar ca parte a operatorului.

"cuvântul 1 * cuvântul 2 ... cuvântul N "

Operatorul este separat prin spații.

Se vor găsi documente care conțin citatul dat, inclusiv cuvântul lipsă.

Se vor găsi documente care conțin citatul dat, inclusiv cuvintele lipsă.

Structura completă a limbajului de interogare Yandex poate fi găsită pe pagina de ajutor (http://help.yandex.ru/search/?id=481939). Limba interogărilor de căutare în Google diferă de Yandex, deși există câteva puncte comune. Luați în considerare câteva dintre comenzile de bază ale acestui limbaj studiind tabelul (vezi mai jos)

Structura completă a limbajului de interogare Google poate fi găsită pe pagina de ajutor:

Informații generale.

În prezent, Internetul reunește sute de milioane de servere care găzduiesc miliarde de site-uri diferite și fișiere individuale care conțin diferite tipuri de informații. Acesta este un depozit uriaș de informații. Există diferite metode de căutare a informațiilor pe Internet.

Căutați după adresa cunoscută. Adresele necesare sunt preluate din directoare. Cunoscând adresa, trebuie doar să o introduceți în bara de adrese a browserului.

www.gov.ru - serverul autorităților guvernamentale ruse.

Construirea unei adrese de către utilizator. Cunoscând sistemul de formare a adreselor de Internet, puteți construi adrese atunci când căutați site-uri Web.

La cuvântul cheie (numele unei companii, întreprinderi, organizații sau un simplu substantiv englezesc), trebuie să adăugați un domeniu tematic sau geografic și trebuie să vă conectați intuiția.

Adresele paginilor web comerciale:

www.cnn.com (CNN World News),

www.sony.com (compania SONY),

www.mtv.com (știri muzicale MTV).

Adrese institutii de invatamant:

www.ntu.edu (Universitatea Națională din SUA).

Adrese regionale ale serverelor:

www.poland.net (Polonia),

www.israil.net (Israel).

Motoarele de căutare pe internet

Au fost dezvoltate sisteme speciale de regăsire a informațiilor pentru a căuta informații pe Internet. Motoarele de căutare au o adresă obișnuită și sunt afișate ca o pagină Web care conține instrumente speciale pentru organizarea căutărilor (șir de căutare, director de subiecte, link-uri). Pentru a apela un motor de căutare, introduceți pur și simplu adresa acestuia în bara de adrese a browserului.

După metoda de organizare a informațiilor, sistemele de regăsire a informațiilor se împart în două tipuri: clasificare (rubricatoare) și dicționar.

Categoriile (clasificatorii) sunt motoare de căutare care utilizează o organizare ierarhică (arboresc) a informațiilor. Când caută informații, utilizatorul caută prin titluri tematice, restrângând treptat câmpul de căutare (de exemplu, dacă trebuie să găsiți sensul unui cuvânt, mai întâi trebuie să găsiți un dicționar în clasificator, apoi să găsiți cuvântul dorit în aceasta).

Sistemele de căutare în dicționar sunt sisteme software și hardware automate puternice. Cu ajutorul lor, informațiile sunt vizualizate (scanate) pe Internet. Datele despre locația acestei sau acelea informații sunt introduse în directoare speciale de index. Ca răspuns la o solicitare, se efectuează o căutare în funcție de șirul de interogare. Drept urmare, utilizatorului i se oferă acele adrese (URL-uri) la care a fost găsit cuvântul sau grupul de cuvinte căutat în momentul scanării. Selectând oricare dintre adresele de linkuri propuse, puteți merge la documentul găsit. Majoritatea motoarelor de căutare moderne sunt mixte.

Cele mai cunoscute și populare motoare de căutare:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Există sisteme specializate în căutare resurse informaționale in diverse directii.

Căutarea de persoane pe internet:

www.whowhere.ru www. bigfoot.com

Căutați grupuri de știri (Usenet):

www.dejanews.com

Motoare de căutare subiecte:

Căutare software:

Căutați prin arhivele de fișiere:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Cataloage (colecții tematice de link-uri cu adnotări):

http://www.atrus.ru

Adesea, o căutare eficientă a informațiilor poate fi efectuată folosind directoare regionale - servere specializate care conțin date despre întreprinderi sau resurse Web ale unui oraș sau regiune. De exemplu, pentru Sankt Petersburg un astfel de director se află la http://www.spb.ru.

O listă a IPS poate fi găsită pe site-ul www.monk. newmail.ru

O listă mai detaliată a motoarelor de căutare și a directoarelor este prezentată în Tabel. 3.2.

Reguli de executare a cererilor

Secțiunea de ajutor a fiecărui motor de căutare oferă informații despre cum să căutați și cum să construiți un șir de interogare. Mai jos sunt informații despre un limbaj de interogare tipic, „mediu”.

Cerere simplă.

Introduceți un cuvânt care definește subiectul de căutare. De exemplu, în motorul de căutare Rambler.ru este suficient să introduceți: automatizare.

Se gasesc documente care contin cuvintele specificate in cerere. Toate formele de cuvinte rusești sunt recunoscute; de ​​regulă, majusculele sunt ignorate.

Puteți utiliza caracterul „*” sau „?” în interogare. Semn "?" într-un cuvânt cheie, un caracter este înlocuit, în locul căruia poate fi înlocuită orice literă, iar semnul „*” este o secvență de caractere.

De exemplu, interogarea automat* vă va permite să găsiți documente care includ cuvintele automat, automatizare etc.

Cerere complexă.

Adesea este nevoie de combinarea cuvintelor cheie pentru a obține informații mai specifice. În acest caz, sunt utilizate cuvinte de legătură suplimentare, funcții, operatori, simboluri, combinații de operatori, separați prin paranteze.

De exemplu, interogarea muzică & (beatles | beatles) înseamnă că utilizatorul caută documente care conțin cuvintele muzică și beatles sau muzică și beatles.

Tabelul 3.1 prezintă regulile de generare a cererilor adoptate în sistemul Aport (http://www.aport.ru).

Tabelul 3.1

Operatori pentru formarea de interogări

Operator Sinonime Un comentariu
ȘI ȘI& Interogarea va găsi documente care le conțin pe ambele Cuvinte cheie. Nu trebuie să-l scrii. De exemplu, interogarea: informatică și manual este echivalentă cu manualul de informatică
SAU SAU | Se face o căutare pentru acele documente care folosesc unul dintre cuvintele specificate sau ambele cuvinte în același timp.
NU NU - ~ Căutarea se limitează la documentele care nu conțin cuvântul specificat după operator
" " " " Ghilimele duble sau simple vă permit să găsiți o frază
Data= data:data= Căutarea este limitată la documentele care se încadrează în intervalul de date specificat.Exemplu 1. currency date=01/02/2002-01/03/2002. Această solicitare va produce documente care conțin cuvântul „monedă” și având o dată de la 1 februarie 2002 până la 1 martie 2002. Exemplul 2. data = 01/03/2002 moneda Exemplul 3. data:<02/03/2002 валюта

Tabelul 3.2

Lista motoarelor de căutare și directoarelor

Abordare Descriere
www.excite.com Motor de căutare cu recenzii și ghiduri de site
www.alta-vista.com Server de căutare, capabilități avansate de căutare disponibile
www.hotbot.com Server de căutare
www.poland.net www.israil.net Servere de căutare regionale din Polonia, Israel
www.ifoseek.com Server de căutare (ușor de utilizat)
www.ipl.org Internet Publik library, o bibliotecă publică care funcționează în cadrul proiectului World Village
www.wisewire.com WiseWire - organizație de căutare folosind inteligența artificială
www.webcrawler.com WebCrawler - server de căutare, ușor de utilizat
www.yahoo.com CatalogWeb și interfață pentru accesarea căutării full-text pe serverul AltaVista
www.aport.ru Aport - server de căutare în limba rusă
www.yandex.ru Yandex - server de căutare în limba rusă
www.rambler.ru Rambler - server de căutare în limba rusă
Resurse de ajutor pe internet
www.yellow.com Pagini Galbene Internet
călugăr newmail.ru Motoare de căutare de diverse profiluri
www.top200.ru Top 200 de site-uri web
www.allru.net
www.ru Catalogul resurselor rusești de internet
www.allru.net/z09. htm Resurse educaționale
www.students.ru Server student rus
www.cdo.ru/index_new. asp Centrul de învățare la distanță
www.deschis. ac. Regatul Unit Universitatea Deschisă din Marea Britanie
www.ntu.edu Universitatea Națională din SUA
www.translate.ru Traducător electronic de text
www.pomorsu.ru/guide. library.html Lista de link-uri către biblioteci de rețea
www.elibrary.ru Biblioteca electronica stiintifica
www.citforum.ru Biblioteca digitala
www.infamed.com/psy Teste psihologice
www.pokoleniye.ru Site-ul internet al Federației pentru Educație pe Internet
www.metoda. narod.ru Resurse educaționale
www.spb. osi.ru/ic/distant Învățare la distanță pe internet
www.examen.ru Examene și teste
www.kbsu.ru/~book/ Manual de informatică
Mega. km.ru Enciclopedii și dicționare

Căutarea de informații pe internet: capcane

Problemele care nu sunt la suprafață se fac adesea simțite doar „în retrospectivă”, după ce o anumită etapă a lucrărilor de căutare a fost finalizată și, eventual, pe baza rezultatelor acesteia, o decizie a fost deja luată. Ce vă împiedică să faceți situația transparentă încă de la începutul funcționării acestui sau aceluia sistem de recuperare a informațiilor (IRS)? Răspunsul este destul de simplu: lipsa de informații complete de acest fel din partea dezvoltatorului. Consecința directă a acestui fapt este nefiabilitatea datelor primite și pierderea necontrolată a acestora. Este rar să găsiți un motor de căutare pe Internet care să nu aibă unele caracteristici „nedocumentate”. S-ar părea că utilizatorul nu are nevoie de multe informații, și anume:

cum este completată baza de date IPS și care este volumul acesteia;

gamă completă de capabilități de limbă de căutare a sistemului;

principalele caracteristici ale prezentării rezultatelor căutării, în primul rând algoritmul de clasare a înregistrărilor din lista de răspunsuri la o interogare de căutare.

Din păcate, sursa unor astfel de informații nu este de obicei un document accesibil de pe pagina principală a unui server de căutare, ci publicații ale autorilor individuali împrăștiate pe internet, cărți și reviste de computer. Motivele acestei stări de fapt includ, aparent, nu numai neglijența dezvoltatorului, ci și un factor numit politică de marketing. Mai simplu spus, furnizarea unui motor de căutare cu cele mai complete informații despre sine nu are întotdeauna un efect pozitiv asupra clasamentului său. Cu toate acestea, în unele cazuri, utilizatorul este destul de capabil să preia controlul asupra situației. Este adesea posibil să aflați caracteristicile de operare ale unui serviciu de căutare selectat prin testare. Construirea de interogări speciale de testare care clarifică rapid exact acel aspect al funcționării sistemului care este cel mai important pentru sarcina curentă se dovedește a fi netrivială în multe cazuri. Vom dedica discuția noastră modului de a evita unele probleme atunci când lucrați cu IPS. Ca exemple pentru a ilustra prezentarea, vor fi luate în considerare motoarele de căutare de pe Internet binecunoscute.

Trei moduri de a căuta pe internet

Internetul în general și World Wide Web în special oferă abonatului acces la mii de servere și milioane de pagini Web care stochează o cantitate inimaginabilă de informații. Cum să nu te pierzi în acest „ocean informațional”? Pentru a face acest lucru, trebuie să învățați cum să căutați și să găsiți informațiile necesare pe Internet.

După cum am menționat deja, există trei modalități principale de a căuta informații pe Internet.

1. Specificarea adresei paginii. Aceasta este cea mai rapidă metodă de căutare, dar poate fi folosită numai dacă se cunoaște adresa exactă a documentului.

2. Navigare prin hyperlinkuri. Aceasta este metoda cea mai puțin convenabilă, deoarece poate fi folosită pentru a căuta documente care sunt doar apropiate ca semnificație de documentul curent. Dacă documentul actual este dedicat, de exemplu, muzicii, atunci folosind hyperlinkuri din acest document este puțin probabil să puteți ajunge la un site dedicat sportului.

3. Contactarea unui server de căutare (motor de căutare). Utilizarea serverelor de căutare este cea mai convenabilă modalitate de a găsi informații. În prezent, următoarele servere de căutare sunt populare în partea în limba rusă a internetului: Yandex; Hoinar.

Există și alte motoare de căutare. De exemplu, pe serverul serviciului de e-mail mail.ru este implementat un sistem de căutare eficient.

Servere de căutare

Cel mai accesibil și convenabil mod de a căuta informații pe World Wide Web este utilizarea motoarelor de căutare. În acest caz, informațiile pot fi căutate prin cataloage, precum și printr-un set de cuvinte cheie care caracterizează documentul text căutat.

Să ne uităm la utilizarea serverelor de căutare mai detaliat. Server de căutare conține un număr mare de link-uri către o mare varietate de documente, iar toate aceste link-uri sunt sistematizate în cataloage tematice. De exemplu: sport, cinema, mașini, jocuri, știință etc. Mai mult, aceste link-uri sunt instalate de server în mod independent, automat prin vizualizarea regulată a tuturor paginilor Web care apar pe World Wide Web. În plus, motoarele de căutare oferă utilizatorului posibilitatea de a căuta informații folosind cuvinte cheie. După introducerea cuvintelor cheie, serverul de căutare începe să vizualizeze documentele de pe alte servere Web și să afișeze link-uri către acele documente în care apar cuvintele specificate. De obicei, rezultatele căutării sunt sortate în ordine descrescătoare după o evaluare specială a documentului, care arată cât de complet un anumit document îndeplinește termenii de căutare sau cât de des este solicitat online.

Limbajul de interogare a motorului de căutare

Un grup de cuvinte cheie format după anumite reguli - folosind un limbaj de interogare - se numește cerere către un server de căutare. Limbile de interogare pentru diferite servere de căutare sunt foarte asemănătoare. Puteți afla mai multe despre acest lucru vizitând secțiunea „Ajutor” a serverului de căutare dorit. Să ne uităm la regulile de formare a interogărilor folosind motorul de căutare Yandex ca exemplu.

Sintaxa operatorului Ce înseamnă operator? Exemplu de cerere
spatiu sau & ȘI logic (într-o propoziție) Proteze dentare fixe
&& ȘI logic (în cadrul documentului) Tipuri && (proteze fixe)
| SAU logic fotografie | fotografie | instantaneu | imagine fotografică
+ Prezența obligatorie a cuvântului în documentul găsit +a fi sau +a nu fi
() Gruparea cuvintelor (tehnologie | producție) (brânză | brânză de vaci)
~ Operatorul binar ȘI NU (într-o propoziție) banci ~ law
~~ sau _ Operatorul binar AND NOT (în cadrul documentului) Ghid Paris ~~ (agenție | tur)
/(n m) Distanța în cuvinte (minus (-) – înapoi, plus (+) – înainte) furnizori /2 muzică cafea /(-2 4) posturi de învăţământ vacante ~ /+1 studenţi
« « Căutați o frază „Proteză fixă” Echivalent cu: Proteză fixă ​​/+1
&&/(n m) Distanța în propoziții (minus (-) – înapoi, plus (+) – înainte) medicina && /1 protetica