Poruka na temu načina pretraživanja na internetu. Tri glavna načina traženja informacija na internetu. Pronalaženje pojedinačnih informacija

22.12.2020 Programi

Mogu se razlikovati sljedeće glavne metode pretraživanja informacija na Internetu, koje se, ovisno o ciljevima i ciljevima pretraživača, koriste pojedinačno ili u kombinaciji jedna s drugom:

1. Izravna pretraga pomoću hipertekstualnih veza

Budući da su sve stranice u WWW prostoru zapravo povezane jedna s drugom, traženje informacija može se obaviti uzastopnim pregledavanjem povezanih stranica pomoću preglednika.
Iako se ova potpuno ručna metoda pretraživanja čini potpuno anakronom na webu koji sadrži više od 60 milijuna čvorova, "ručno" pregledavanje web stranica često je jedina opcija u završnim fazama pretraživanja informacija, kada mehaničko "kopanje" ustupi mjesto dubljoj analizi.
Korištenje kataloga, klasificiranih i tematskih popisa i svih vrsta malih imenika također se odnosi na ovu vrstu pretraživanja.

2. Korištenje tražilica

Danas je ova metoda jedna od glavnih i, zapravo, jedina metoda pri provođenju preliminarne pretrage. Rezultat potonjeg može biti popis mrežnih resursa koji su predmet detaljnog razmatranja.
Obično se korištenje tražilica temelji na korištenju ključnih riječi koje se prosljeđuju poslužiteljima pretraživanja kao argumenti pretraživanja: što tražiti.
Ako se napravi ispravno, generiranje popisa ključnih riječi zahtijeva preliminarni rad na sastavljanju tezaurusa.

3. Pretraživanje pomoću posebnih alata

Ovaj je potpuno automatizirana metoda može biti vrlo učinkovit za provođenje početne pretrage.
Jedna od tehnologija ove metode temelji se na korištenju specijaliziranih programa - pauka, koji automatski skeniraju web stranice tražeći na njima tražene podatke.
Zapravo, ovo je gore opisana automatizirana verzija pregledavanja pomoću hipertekstualnih veza (tražilice koriste slične metode za izradu svojih indeksnih tablica).
Nepotrebno je reći, rezultati automatsko pretraživanje nužno zahtijevaju daljnju obradu.
Primjena ovu metodu Preporučljivo je ako korištenje tražilica ne može dati potrebne rezultate (primjerice, zbog nestandardne prirode upita, koji se ne može adekvatno specificirati postojećim alatima tražilice).
U nekim slučajevima ova metoda može biti vrlo učinkovita.
Izbor između korištenja pauka ili tražilica varijanta je klasičnog izbora između korištenja univerzalnih ili specijaliziranih alata.

1.4 Analiza novih izvora

Pretraživanje kroz novostvorene izvore može biti potrebno prilikom provođenja ponovljenih ciklusa pretraživanja, traženja najnovijih informacija ili za analizu trendova u razvoju predmeta proučavanja tijekom vremena.
Još mogući razlog Može se dogoditi da većina tražilica ažurira svoje indekse sa značajnim kašnjenjem uzrokovanim ogromnim količinama podataka koji se obrađuju, a to je kašnjenje obično veće što je tema od interesa manje popularna.
Ovo razmatranje može biti vrlo značajno kada se provodi pretraživanje u visoko specijaliziranom predmetnom području.

U globalna mreža Na internetu možete pronaći informacije o bilo kojoj temi koja vas zanima. Ali najteža stvar u radu na Internetu je pronaći informacije koje su vam potrebne. Budući da Internet nema jasnu centraliziranu strukturu, razvija se kaotično, au svijetu se pojavljuje sve više i više novih poslužitelja, pitanja traženja informacija postaju vrlo relevantna.

Tražilice uvelike olakšavaju rad na Internetu i pomažu nam da brzo pronađemo potrebne informacije na velikom broju internetskih poslužitelja. Postoji nekoliko tisuća tražilica na World Wide Webu, uključujući dobro etablirane i one manje poznate.

Najpopularnije tražilice

  • Yandex— sredstvo za pronalaženje informacija o punom tekstu uzimajući u obzir morfologiju ruskog jezika; pretraživanje na stranicama, vaš katalog, vijesti, proizvodi, geografske karte, rječnici, blogovi, slike, Microsoftovi dokumenti Ured i adobe acrobat PDF
    • Yandex
  • Lutalica(OJSC Rambler Internet Holding) - pretraživanje na stranicama uzimajući u obzir morfologiju ruskog i engleski jezici; Također ima sustav pretraživanja kataloga.
    • Rambler Lite: tražilica— skraćena verzija stranice za pretraživanje
  • Usluga pretraživanja Sputnik(OJSC Rostelecom) - pretraživanje na stranicama, državnim službama itd.; Sigurno pretraživanje
  • NIGMa - inteligentna tražilica(M.V. Lomonosov Moscow State University i Stanford University) - traženje dokumenata, slika, knjiga, vijesti putem Googlea, Yahooa, MSN-a, Yandexa, Ramblera, altavista, Aporta; sustav također pruža jedinstvenu pretragu kemijskih formula i reakcija
  • Google — pretraživanje na stranicama (moguće je pretraživanje na stranicama na ruskom jeziku); traženje dokumenata u adobe formatima acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3 itd.; traženje slika, videa, vijesti, pretraživanje na kartama; mogućnost pretraživanja na ruskim i ruskim stranicama; postoji sustav za prevođenje teksta na druge jezike (49 jezika)
  • Bing(Microsoft Corp.) - pretraživanje stranica, slika i videa; mogućnost pretraživanja na ruskim i ruskim stranicama; postoji sustav za prevođenje teksta na druge jezike (22 jezika)
  • Yahoo!(Yahoo) - pretraživanje po stranicama, e-mail adresama itd.

Svaka tražilica ima svoje prednosti i nedostatke, koji su određeni načelom rada tražilice, jednostavnošću korištenja, dizajnom, složenošću jezika upita, prisutnošću raznih naprednih funkcija (upravljanje formatom i rangiranje izlaznih informacija, ispravljanje pravopisnih pogrešaka i pogrešnih rasporeda tipkovnice pri unosu ključnih riječi, prevođenje stranice na druge jezike itd.), brzina rada i drugi parametri. Odabir tražilice za određenu aplikaciju određen je svrhom pretraživanja, prirodom tražene informacije, željenim formatom izlaznih podataka i širinom pokrivenosti nadziranih adresa poslužitelja u Internet svijetu.

Pretraživanje po ključnim riječima. Jezik upita tražilice

Tražilica obično ima polje za unos ključnih riječi, koje koristi za pronalaženje dokumenata koji sadrže te ključne riječi. Što je bolji (kvalitetniji) upit tražilici, to je manji ukupan broj pronađenih dokumenata, a više je dokumenata koji odgovaraju onome što trebate. Ako je zahtjev vrlo jednostavan ili loše sastavljen, tada vam tražilica može dati nekoliko milijuna dokumenata koje nećete moći pogledati cijeli život.

Korištenje upitnog jezika koji sadrži logičke operacije (Booleovi operatori I, ILI, NE, zagrade, itd.), prefikse koji zahtijevaju prisutnost ključnih riječi u dokumentu «+» I «-» (kod traženja uskostručnih pojmova poželjno je koristiti), položaj ključnih riječi u dokumentu u blizini ili na određenoj udaljenosti itd.) i druge elemente, te velika količina ključne riječi povezane s njima, možete značajno suziti područje pretraživanja i postaviti bolji zahtjev poslužitelju za pretraživanje. Treba uzeti u obzir da različite tražilice mogu imati različite ili vrlo slične jezike upita.

Neke tražilice dodatno imaju funkciju napredno pretraživanje, omogućujući korisniku da točnije opiše što mu konkretno treba bez poznavanja jezika upita. Funkcija naprednog pretraživanja dostupna je, primjerice, u tražilicama Yandex i Google.

Glavne vrste tražilica. Koju tražilicu koristiti

Postoje 2 glavne vrste internetskih tražilica: indeks i klasifikacija (katalog). Indeksne tražilice (na primjer, Yandex, Rambler, Sputnik, Google, Bing itd.), radeći u automatskom načinu ažuriranja svojih podataka, pregledavaju sadržaj poslužitelja na Internetu, indeksiraju informacije sadržane u njima i unose informacije o položaju riječi na stranicama web stranica u svoje baze podataka. Kataloške tražilice (primjerice, Rambler, Yahoo! i dr.) sadrže tematski strukturiran katalog poslužitelja, a najčešće se ažuriraju ručno. Tipično, WWW stranica tražilice klasifikacije sadrži i polje za unos ključnih riječi za pretraživanje u vlastitoj bazi podataka. U sustavu pretraživanja kataloga možete započeti s većim tematskim naslovom i postupno se spuštati kroz naslove kako biste došli do poveznice na stranicu koja vam je potrebna. U nekim slučajevima prikladnije je koristiti prvu vrstu tražilica, u drugima - drugu. Postoje tražilice koje kombiniraju oba principa rada. Konkretno, mnoge tražilice indeksa također imaju sustav pretraživanja kataloga. Također, tražilice mogu koristiti i neke druge principe metoda pretraživanja.

Mnoge tražilice transformirale su se u internetske portale koji objedinjuju velik broj resursa i usluga. Na stranicama takvih portala možete čitati vijesti, pratiti TV program, informirati se o vremenu, tečaju, koristiti kartografski servis i još mnogo toga. itd.

Najpopularnije ruske tražilice imaju mogućnosti pretraživanja uzimajući u obzir osobitosti ruskog jezika.

Za istovremeno pretraživanje u nekoliko tražilica možete koristiti tzv. metastrojeve za pretraživanje koji pristupaju više alata za pretraživanje odjednom, primjerice NIGMa.

Postoje i tražilice specijalizirane za traženje jedne teme (npr. informacijska tehnologija, glazba, resursi posvećeni prirodi itd.)

Problem s pretraživanjem World Wide Weba nije u tome što ima malo informacija, već u tome što ih ima puno. Traženje informacija na internetu je kamen temeljac učinkovit rad na liniji. Posjedovanje vještina pretraživanja čini internet korisnim za korisnika i tijekom rada i tijekom slobodnog vremena.
Za organiziranje pretraživanja na Internetu postoje specijalizirani servisi koji se zovu tražilice.

Tražilice.

Tražilice su softverski i hardverski sustavi s web sučeljem koji pružaju mogućnost pretraživanja informacija na internetu.
Većina tražilica traži informacije na World Wide Web stranicama, ali postoje i sustavi koji mogu tražiti datoteke na FTP poslužiteljima, proizvode u online trgovinama i informacije u Usenet grupama. Za traženje informacija pomoću tražilice, korisnik formulira upit za pretraživanje. Na zahtjev korisnika, tražilica generira stranicu s rezultatima pretraživanja. Takav Rezultati pretraživanja može kombinirati Različite vrste datoteke, na primjer: web stranice, slike, audio datoteke. Neke tražilice također dohvaćaju podatke iz baza podataka i direktorija izvora na Internetu.
Svrha tražilice je pronaći dokumente koji sadrže ključne riječi ili riječi na neki način povezane s ključnim riječima. Tražilica je bolja što više dokumenata vraća relevantnih za korisnikov upit. Rezultati pretraživanja mogu postati lošiji zbog prirode algoritama. Na primjer, kada se pita za kućne ljubimce, Yandexov poslužitelj za pretraživanje (pogledajte više o tome u nastavku) daje više od 14.000.000 poveznica na stranice koje sadrže informacije za koje misli da su mu potrebne. Međutim, nije sve tako glatko: kada posjetite neke od pronađenih stranica, ispostavi se da informacije koje tražite nisu dovoljne ili čak nepostoje.
Da biste tražili s maksimalnom učinkovitošću, morate znati kako funkcioniraju poslužitelji za pretraživanje i pravilno formulirati zahtjev za traženje informacija.

Kako rade tražilice

Tražilice rade tako da pohranjuju informacije o mnogim web stranicama s kojih dohvaćaju HTML stranice. Glavne komponente sustava za pretraživanje: robot za pretraživanje, indekser, tražilica. Obično sustavi rade u fazama. Najprije robot za pretraživanje prima sadržaj, a zatim pregledava sadržaj web stranica. Tek tada indekser generira pretraživi indeks. Indeksator je modul koji analizira stranicu, prethodno je razdijelivši na dijelove, koristeći vlastite leksičke i morfološke algoritme.
Rad većine modernih tražilica temelji se na indeksu citiranja, koji izračunava indekser kao rezultat analize poveznica na trenutnu stranicu s drugih internetskih stranica. Što ih je više, to je veći indeks citata analizirane stranice, stranica će biti prikazana više u rezultatima pretraživanja i stranica će biti prikazana na višoj poziciji u popisu pronađenih izvora.

Pravila za konstrukciju upita za pretraživanje

Kao što je već napomenuto, na Internetu postoji mnogo poslužitelja za pretraživanje, domaćih i stranih.
Ruski poslužitelji za pretraživanje: Yandex (www.yandex.ru); Rambler (www.rambler.ru); Aport (www.aport.ru) i Gogo (www.gogo.ru).

Strani poslužitelji za pretraživanje: Google ( www.google.com); Altavista (www.altavista.com) i Yahoo! (www.yahoo.com).
Ruski poslužitelji su prikladniji za pretraživanje na ruskom, strani poslužitelji su prikladniji za pretraživanje na stranom jeziku, iako Google dobro radi pretraživanje na mnogim jezicima. Unatoč tvrdnjama mnogih vlasnika tražilica da se upiti mogu pisati praktički na jeziku kojim ljudi međusobno komuniciraju, to je daleko od slučaja. Zahvaljujući uvođenju novih jezičnih tehnologija, tražilice su postale mnogo bolje razumljive korisniku. Tražilice sada traže ne samo traženu riječ, već i njezine oblike riječi, što rezultate pretraživanja čini preciznijima. Na primjer, ako upit za pretraživanje sadrži riječ pametan, tada će njegovi rezultati sadržavati ne samo ovu riječ, već i njezine izvedenice: pametan, pametan, kao i inteligencija, pa čak i inteligencija. Naravno, stranice s oblicima riječi neće biti među prvim rezultatima pretraživanja, ali elementi umjetne inteligencije su evidentni. Korisno je uzeti u obzir ovu činjenicu prilikom konstruiranja upita za pretraživanje.
Treba imati na umu da tražilice ne uzimaju u obzir veličinu znakova prilikom obrade zahtjeva i uopće nije potrebno koristiti interpunkcijske znakove u upitima za pretraživanje, budući da ih poslužitelji za pretraživanje također ignoriraju. Međutim, pri izradi složenih naprednih upita, čiji su rezultati pretraživanja obično puno bliži očekivanima, koristi se tradicionalna interpunkcija. Većina tražilica može riješiti tipfelere. Ako poslužitelj za pretraživanje smatra da postoji greška ili tipfeler u riječi, upozorit će vas na to istom frazom: Možda ste tražili….

Riječi za upit poslužitelju za pretraživanje

Postoji izraz “Stroj mora raditi, čovjek mora misliti” i kaže se upravo za takvu situaciju. Zadatak korisnika prilikom sastavljanja upita za pretraživanje je istaknuti ključne riječi, zadatak poslužitelja za pretraživanje je obraditi uneseni upit na najbolji mogući način. Pogledajmo primjer koji ilustrira tipične greške korisnicima početnicima prilikom pretraživanja interneta. Tražilica nije dala nikakve korisne rezultate za upit "Zagonetke o glazbenim instrumentima". Zatim korisnik odluči ispraviti upit dodavanjem i pisanjem: "Zagonetke za djecu o glazbenim instrumentima" - rezultati pretraživanja su se pokazali još gori od prethodnog. Za ovaj primjer Dobro rješenje bilo je tražiti ključnu riječ "zagonetke". Takvih stranica na internetu ima mnogo, a odlaskom na samu stranicu i malo pretražujući njezine dijelove lako ćete pronaći informacije koje vas zanimaju. Formulirajmo nekoliko pravila za sastavljanje upita:

  • odabrati samo najvažnije ključne riječi vezane uz temu koja se razmatra;
  • ne smije biti previše riječi, ali ni premalo;
  • ako rezultati pretraživanja nisu zadovoljavajući, upotrijebite blaže uvjete za zahtjev ili pokušajte pretraživati ​​na drugom pretraživač, jer Mehanizmi tražilica nisu isti, stoga i rezultati mogu varirati.

Napredno pretraživanje

Kako bi omogućili učinkovitije pretraživanje na Internetu, tražilice pružaju napredne mogućnosti pretraživanja, kao i pretraživanja pomoću jezika upita. Napredno pretraživanje - mogućnost pretraživanja pomoću mnogo različitih parametara. U tu svrhu tražilice pružaju pojedinačne stranice, na kojem možete postaviti takve parametre. Načela naprednog pretraživanja slična su za većinu tražilica.
Razmotrimo dodatne mogućnosti pretražujte na primjerima tražilica Yandex i Google jer je Yandex najpopularniji poslužitelj za pretraživanje na internetu na ruskom jeziku, a Google je najpopularnija tražilica na svijetu. Prilikom pretraživanja interneta Yandex je bio jedan od prvih koji je uzeo u obzir morfologiju ruskog jezika, odnosno koristio različite oblike riječi, kao što je gore navedeno. Odlaskom na web stranicu www.yandex.ru korisnik može unijeti upit i odmah dobiti rezultate pretraživanja ili možete koristiti vezu Napredno pretraživanje pomoću ikone i otići na odgovarajuću stranicu (pogledajte donju sliku), gdje možete fino podesite parametre pretraživanja.

Yandex stranica za napredno pretraživanje

Razmotrimo dodatne značajke koje se mogu koristiti na stranici naprednog pretraživanja: naznačite vlastitu lokaciju (Moskva), navedite u kojem obliku informacije trebaju biti prikazane (Vrsta datoteke), vremensko razdoblje u kojem tražimo informacije (po danu, po 2 tjedna, mjesečno, Od ..Prije), na kojem jeziku informacije trebaju biti predstavljene (ruski, engleski Više), a možete navesti i URL stranice itd.
Izbor (Točno kao u upitu) je naznačen tražilici tako da se morfologija riječi upita ne mijenja, već se traži samo oblik riječi koji je naveden.

Jezik upita

Jezik upita sustav je naredbi koji vam omogućuje promjenu parametara upita iz glavnog niza pretraživanja pomoću posebnih naredbi. Usmjeren na iskusni korisnici.
Budući da je jezik upita prilično složen i opsežan, predstavit ćemo samo njegove glavne strukture koje bi mogle biti najtraženije od strane korisnika. Neke naredbe Yandex upitnog jezika prikazane su u tablici.

Operater

Opis

Sintaksa

Primjer zahtjeva

Tražite dokumente koji nužno sadrže označenu riječ.

Prihvatljivo je koristiti više operatora + u jednom upitu.

"riječ 1 +riječ 2"

Pronaći će se dokumenti koji nužno sadrže riječi "bulevar" i "Moskva", a mogu sadržavati i riječ "Šolohov".

Pretraživanje po citatu.

Tražite dokumente koji sadrže riječi upita u zadanom nizu i obliku.

"riječ 1 riječ 2...riječ N"

Pronaći će se dokumenti koji sadrže ovaj citat.

Pretraživanje po citatu s nedostajućim riječima.

Jedan * operator odgovara jednoj riječi koja nedostaje.

Pažnja! Može se koristiti samo kao dio operatora.

"riječ 1 * riječ 2 ... riječ N "

Operator je odvojen razmacima.

Pronaći će se dokumenti koji sadrže navedeni citat, uključujući riječ koja nedostaje.

Pronaći će se dokumenti koji sadrže navedeni citat, uključujući riječi koje nedostaju.

Potpuna struktura Yandex jezika upita može se pronaći na stranici pomoći (http://help.yandex.ru/search/?id=481939). Jezik upita za pretraživanje u Googleu razlikuje se od Yandexa, iako postoje neke zajedničke točke. Razmotrite neke od osnovnih naredbi ovog jezika proučavajući tablicu (vidi dolje)

Potpuna struktura Googleova jezika upita može se pronaći na stranici pomoći:

Opće informacije.

Trenutno Internet objedinjuje stotine milijuna poslužitelja koji ugošćuju milijarde različitih stranica i pojedinačnih datoteka koje sadrže različite vrste informacija. Ovo je ogromno skladište informacija. Postoje različite metode za pretraživanje informacija na Internetu.

Pretraživanje po poznatoj adresi. Potrebne adrese su preuzete iz imenika. Znajući adresu, samo je unesite u adresnu traku preglednika.

www.gov.ru - poslužitelj ruskih državnih tijela.

Konstruiranje adrese od strane korisnika. Poznavajući sustav za formiranje internetskih adresa, možete konstruirati adrese prilikom pretraživanja web stranica.

Ključnoj riječi (ime tvrtke, poduzeća, organizacije ili jednostavna engleska imenica) potrebno je dodati tematsku ili geografsku domenu, te povezati svoju intuiciju.

Adrese komercijalnih web stranica:

www.cnn.com (CNN Svjetske vijesti),

www.sony.com (tvrtka SONY),

www.mtv.com (MTV glazbene vijesti).

Adrese obrazovne ustanove:

www.ntu.edu (Nacionalno sveučilište SAD-a).

Regionalne adrese poslužitelja:

www.poland.net (Poljska),

www.israil.net (Izrael).

Internetske tražilice

Za traženje informacija na internetu razvijeni su posebni sustavi za pretraživanje informacija. Tražilice imaju uobičajenu adresu i prikazuju se kao web stranica koja sadrži posebne alate za organiziranje pretraživanja (niz za pretraživanje, imenik predmeta, poveznice). Za pozivanje tražilice jednostavno unesite njenu adresu u adresnu traku preglednika.

Sustavi za pretraživanje informacija prema načinu organiziranja informacija dijele se na dvije vrste: klasifikacijske (rubrikatore) i rječničke.

Kategorije (klasifikatori) su tražilice koje koriste hijerarhijsku (stablastu) organizaciju informacija. Prilikom traženja informacija, korisnik pregledava tematske naslove, postupno sužavajući polje pretraživanja (na primjer, ako trebate pronaći značenje riječi, prvo trebate pronaći rječnik u klasifikatoru, a zatim pronaći željenu riječ u to).

Sustavi za pretraživanje rječnika moćni su automatski softverski i hardverski sustavi. Uz njihovu pomoć informacije se pregledavaju (skeniraju) na internetu. Podaci o lokaciji ove ili one informacije unose se u posebne imenike indeksa. Kao odgovor na zahtjev, vrši se pretraga prema nizu upita. Kao rezultat, korisniku se nude one adrese (URL-ovi) na kojima je pronađena tražena riječ ili skupina riječi u trenutku skeniranja. Odabirom bilo koje od predloženih adresa poveznica možete otići na pronađeni dokument. Većina modernih tražilica je mješovita.

Najpoznatije i najpopularnije tražilice:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

Postoje sustavi specijalizirani za pretraživanje izvori informacija u raznim smjerovima.

Traženje ljudi na internetu:

www.whowhere.ru www. bigfoot.com

Pretraživanje news grupa (Usenet):

www.dejanews.com

Predmetne tražilice:

traži softver:

Pretraživanje arhiva datoteka:

http://ftpseach. city.ru, http://ftpsearch. licos.com

Katalozi (tematske zbirke poveznica s komentarima):

http://www.atrus.ru

Često se učinkovito pretraživanje informacija može provesti pomoću regionalnih imenika - specijaliziranih poslužitelja koji sadrže podatke o poduzećima ili web resursima grada ili regije. Na primjer, za St. Petersburg takav imenik nalazi se na http://www.spb.ru.

Popis IPS-a možete pronaći na web stranici www.monk. newmail.ru

Detaljniji popis tražilica i imenika prikazan je u tablici. 3.2.

Pravila za izvršavanje zahtjeva

Odjeljak pomoći svake tražilice pruža informacije o tome kako pretraživati ​​i kako sastaviti niz upita. Ispod su informacije o tipičnom, "prosječnom" jeziku upita.

Jednostavan zahtjev.

Unesite jednu riječ koja definira temu pretraživanja. Na primjer, u tražilicu Rambler.ru dovoljno je unijeti: automatizacija.

Pronađeni su dokumenti koji sadrže riječi navedene u zahtjevu. Prepoznaju se svi oblici ruskih riječi; u pravilu se zanemaruju velika i mala slova.

U upitu možete koristiti znak "*" ili "?". Znak "?" u ključnoj riječi zamjenjuje se jedan znak umjesto kojeg se može zamijeniti bilo koje slovo, a znak “*” je niz znakova.

Na primjer, upit automatski* omogućit će vam da pronađete dokumente koji sadrže riječi automatski, automatizacija itd.

Kompleksan zahtjev.

Često postoji potreba za kombiniranjem ključnih riječi kako bi se dobile preciznije informacije. U tom se slučaju koriste dodatne povezne riječi, funkcije, operatori, simboli, kombinacije operatora odvojene zagradama.

Na primjer, upit glazba & (beatles | beatles) znači da korisnik traži dokumente koji sadrže riječi glazba i beatles ili glazba i beatles.

Tablica 3.1 prikazuje pravila za generiranje zahtjeva usvojena u sustavu Aport (http://www.aport.ru).

Tablica 3.1

Operatori za formiranje upita

Operater Sinonimi Komentar
I I& Upit će pronaći dokumente koji sadrže oboje ključne riječi. Ne morate to napisati. Na primjer, upit: informatika i udžbenik ekvivalentan je udžbeniku informatike
ILI ILI | Traže se oni dokumenti koji koriste jednu od navedenih riječi ili obje riječi u isto vrijeme.
NE NE - ~ Pretraživanje je ograničeno na dokumente koji ne sadrže riječ navedenu iza operatora
" " " " Dvostruki ili jednostruki navodnici omogućuju vam da pronađete frazu
Datum= datum:datum= Pretraživanje je ograničeno na dokumente koji spadaju unutar navedenog datumskog raspona Primjer 1. datum valute=01/02/2002-01/03/2002. Ovaj zahtjev će proizvesti dokumente koji sadrže riječ "valuta" i imaju datum od 1. veljače 2002. do 1. ožujka 2002. Primjer 2. datum = 01/03/2002 valuta Primjer 3. datum:<02/03/2002 валюта

Tablica 3.2

Popis tražilica i imenika

Adresa Opis
www.excite.com Tražilica s pregledima stranica i vodičima
www.alta-vista.com Poslužitelj za pretraživanje, dostupne mogućnosti naprednog pretraživanja
www.hotbot.com Poslužitelj za pretraživanje
www.poland.net www.israil.net Regionalni poslužitelji za pretraživanje Poljske, Izraela
www.ifoseek.com Poslužitelj za pretraživanje (jednostavan za korištenje)
www.ipl.org Internet Publik knjižnica, narodna knjižnica koja djeluje u okviru projekta Svjetsko selo
www.wisewire.com WiseWire - organizacija pretraživanja pomoću umjetne inteligencije
www.webcrawler.com WebCrawler - poslužitelj za pretraživanje, jednostavan za korištenje
www.yahoo.com CatalogWeb i sučelje za pristup pretrazi cijelog teksta na AltaVista poslužitelju
www.aport.ru Aport - poslužitelj za pretraživanje na ruskom jeziku
www.yandex.ru Yandex - poslužitelj za pretraživanje na ruskom jeziku
www.rambler.ru Rambler - poslužitelj za pretraživanje na ruskom jeziku
Internetski izvori pomoći
www.yellow.com Yellow Pages Internet
redovnik newmail.ru Tražilice raznih profila
www.top200.ru Top 200 web stranica
www.allru.net
www.ru Katalog ruskih internetskih izvora
www.allru.net/z09. htm Obrazovni resursi
www.students.ru Ruski studentski poslužitelj
www.cdo.ru/index_new. asp Centar za učenje na daljinu
www.otvoreno. ak. uk UK Open University
www.ntu.edu Nacionalno sveučilište SAD-a
www.translate.ru Elektronički prevoditelj teksta
www.pomorsu.ru/vodič. knjižnica.html Popis poveznica na mrežne knjižnice
www.elibrary.ru Znanstvena elektronička knjižnica
www.citforum.ru Digitalna knjižnica
www.infamed.com/psy Psihološki testovi
www.pokoleniye.ru Web stranica Internet Education Federation
www.metoda. narod.ru Obrazovni resursi
www.spb. osi.ru/ic/distant Učenje na daljinu na internetu
www.examen.ru Ispiti i kolokviji
www.kbsu.ru/~book/ Udžbenik informatike
Mega. km.ru Enciklopedije i rječnici

Traženje informacija na internetu: zamke

Problemi koji nisu na površini često se pokažu tek “unatrag”, nakon što je završena određena faza traženja i, možda, na temelju njegovih rezultata, već je donesena odluka. Što vas sprječava da situaciju učinite transparentnom od samog početka rada ovog ili onog sustava za pretraživanje informacija (IRS)? Odgovor je prilično jednostavan: nedostatak sveobuhvatnih informacija ove vrste od strane programera. Izravna posljedica toga je nepouzdanost primljenih podataka i njihov nekontrolirani gubitak. Rijetko se može pronaći tražilica na internetu koja nema neke "nedokumentirane" mogućnosti. Čini se da korisnik ne treba puno informacija, naime:

kako se popunjava IPS baza podataka i koliki je njen obujam;

cijeli raspon jezičnih mogućnosti pretraživanja sustava;

glavne značajke prikaza rezultata pretraživanja, prvenstveno algoritam za rangiranje zapisa s liste odgovora na upit za pretraživanje.

Nažalost, izvor takvih informacija obično nije dokument dostupan s glavne stranice poslužitelja za pretraživanje, već publikacije pojedinačnih autora razasute po Internetu, knjige i računalni časopisi. Razlozi za ovakvo stanje stvari, očito, uključuju ne samo nemar programera, već i faktor koji se zove marketinška politika. Jednostavno rečeno, pružanje tražilici najpotpunijih informacija o sebi nema uvijek pozitivan učinak na njezino rangiranje. Međutim, u nekim slučajevima korisnik je sasvim sposoban preuzeti kontrolu nad situacijom. Često je testiranjem moguće saznati karakteristike rada odabrane usluge pretraživanja. Konstruiranje posebnih testnih upita koji brzo razjašnjavaju točno onaj aspekt rada sustava koji je najvažniji za trenutni zadatak u mnogim se slučajevima pokazuje netrivijalnim. Našu ćemo raspravu posvetiti tome kako izbjeći neke probleme pri radu s IPS-om. Kao primjeri za ilustraciju izlaganja razmotrit će se poznate internetske tražilice.

Tri načina pretraživanja interneta

Internet općenito, a posebno World Wide Web pretplatniku pružaju pristup tisućama poslužitelja i milijunima web stranica koje pohranjuju nezamislivu količinu informacija. Kako se ne izgubiti u ovom "okeanu informacija"? Da biste to učinili, morate naučiti pretraživati ​​i pronaći potrebne informacije na internetu.

Kao što je već spomenuto, postoje tri glavna načina traženja informacija na internetu.

1. Određivanje adrese stranice. Ovo je najbrži način pretraživanja, ali se može koristiti samo ako je poznata točna adresa dokumenta.

2. Navigacija preko hiperveza. Ovo je najmanje prikladna metoda, jer se može koristiti za traženje dokumenata koji su samo bliski po značenju trenutnom dokumentu. Ako je trenutni dokument posvećen, na primjer, glazbi, tada korištenjem hiperveza u ovom dokumentu malo je vjerojatno da ćete moći doći do stranice posvećene sportu.

3. Kontaktiranje poslužitelja za pretraživanje (tražilica). Korištenje poslužitelja za pretraživanje najprikladniji je način za pronalaženje informacija. Trenutno su sljedeći poslužitelji za pretraživanje popularni u dijelu interneta na ruskom jeziku: Yandex; Lutalica.

Postoje i druge tražilice. Na primjer, učinkovit sustav pretraživanja implementiran je na poslužitelju usluge pošte mail.ru.

Pretraživanje poslužitelja

Najpristupačniji i najprikladniji način traženja informacija na World Wide Webu je korištenje tražilica. U ovom slučaju informacije se mogu pretraživati ​​kroz kataloge, kao i kroz skup ključnih riječi koje karakteriziraju tekstualni dokument koji se pretražuje.

Pogledajmo detaljnije korištenje poslužitelja za pretraživanje. Poslužitelj za pretraživanje sadrži velik broj poveznica na najrazličitije dokumente, a sve su te poveznice sistematizirane u tematske kataloge. Na primjer: sport, kino, automobili, igrice, znanost, itd. Štoviše, ove veze instalira poslužitelj neovisno, automatski redovitim pregledom svih web stranica koje se pojavljuju na svjetskoj mreži. Osim toga, tražilice korisniku pružaju mogućnost pretraživanja informacija pomoću ključnih riječi. Nakon unosa ključnih riječi poslužitelj za pretraživanje počinje pregledavati dokumente na drugim web poslužiteljima i prikazivati ​​poveznice na te dokumente u kojima se navedene riječi pojavljuju. Obično se rezultati pretraživanja poredaju silaznim redoslijedom prema posebnoj ocjeni dokumenta, koja pokazuje koliko u potpunosti određeni dokument ispunjava uvjete pretraživanja ili koliko se često traži na mreži.

Jezik upita tražilice

Grupa ključnih riječi formirana prema određenim pravilima - pomoću jezika upita - naziva se zahtjev poslužitelju za pretraživanje. Jezici upita za različite poslužitelje za pretraživanje vrlo su slični. Više o tome možete saznati ako posjetite odjeljak "Pomoć" željenog poslužitelja za pretraživanje. Pogledajmo pravila za formiranje upita na primjeru tražilice Yandex.

Sintaksa operatora Što operator znači? Primjer zahtjeva
razmak ili & Logičko I (unutar rečenice) Fiksne proteze
&& Logički I (unutar dokumenta) Vrste && (fiksne proteze)
| Logički ILI fotografija | fotografija | snimka | fotografska slika
+ Obavezna prisutnost riječi u pronađenom dokumentu +biti ili +ne biti
() Grupiranje riječi (tehnologija | proizvodnja) (sir | svježi sir)
~ Binarni operator I NE (unutar rečenice) banke ~ zakon
~~ ili _ Binarni operator I NE (unutar dokumenta) Pariz vodič ~~ (agencija | obilazak)
/(n m) Udaljenost u riječima (minus (-) – natrag, plus (+) – naprijed) dobavljači /2 kava glazba /(-2 4) slobodna radna mjesta za obrazovanje ~ /+1 student
« « Potražite frazu “Fiksne proteze” Ekvivalent: fiksne /+1 proteze
&&/(n m) Udaljenost u rečenicama (minus (-) – natrag, plus (+) – naprijed) medicina && /1 protetika