Traženje podataka na Internetu. Traženje informacija na Internetu

Sve što se može pronaći na internetu (knjige, glazba, fotografije, videi itd.) nalazi se na stranicama. Odnosno, internet ima jako, jako, jako puno stranica. Da biste došli do bilo kojeg od njih, morate otvoriti internetski program koji se zove preglednik.

Preglednik je program putem kojeg osoba otvara Internet. U pravilu postoji nekoliko takvih programa na računalu, ali korisnik radi samo u jednom.

Najpopularniji preglednici: Google Chrome,Opera, Mozilla Firefox, Yandex i Internet Explorer. Ovisno o tome koju ikonu otvorite kada ste na mreži, ovo je program koji koristite.

Gdje tražiti stranice

Budući da su sve informacije na internetu na web stranicama, da biste ih dobili morate otvoriti web stranicu.

Svaki od njih ima svoju adresu. Na primjer, resurs na kojem se trenutno nalazite ima adresu web stranice

Postoje milijarde takvih adresa. Svaki od njih sadrži neke informacije. U jednoj su recepti, u drugoj video, u trećoj novosti... Ispada ogromna hrpa adresa, svaka sa svojim sadržajem.

A kako među njima pronaći potrebne podatke?! Hoće li nam pomoći s ovim tražilice. Ili, jednostavnije, tražilice. To su posebna web mjesta imenika. Princip rada je jednostavan: otvorite adresu stranice tražilice, upišete na nju ono što želite pronaći na internetu i pritisnete tipku "Enter" na tipkovnici. U samo sekundi, tražilica će pretražiti cijeli Internet i pokazati one stranice koje imaju ono što tražite.

Odnosno, da biste radili na internetu (pronalazili i preuzimali informacije, komunicirali itd.), trebate znati samo jednu ili dvije adrese tražilice.

Yandex (yandex.ru)

Počnimo s tražilicom Yandex, jer je to ruska tražilica namijenjena prvenstveno osobama koje govore ruski.

Da biste ga otvorili, trebate upisati adresu yandex.ru engleskim slovima u gornjem retku preglednika i pritisnuti tipku Enter na tipkovnici.

Otvorit će se stranica slična ovoj.

Obratite pažnju na žutu prugu u sredini. Ona je odgovorna za pretraživanje interneta.

Kliknite lijevom tipkom miša unutar ove trake (na bijeloj crti) i upišite na ruskom ono što želite pronaći na internetu.

Usput, možete ga ispisati na engleskom, ukrajinskom i drugim jezicima. Ali ako to nikada niste radili, bolje je početi s ruskim.

Recimo da želim pronaći biografiju Leonarda Da Vincija. Što biste trebali upisati u ovom slučaju?

Možete, naravno, upisati ovako: "Želim pronaći biografiju Leonarda Da Vincija." Ali ovo nije najbolja opcija. Jer tražilica nije osoba. A s njim biste trebali “komunicirati” na malo drugačiji način. Morate tipkati točno i jasno. U mom slučaju, bolje je upisati "Leonardo da Vinci biography."

Svoj zahtjev možete unijeti bilo kojim slovima - velikim i malim. Tražilicu nije briga. Čak i ako tipkate s pogreškama, on će ih najvjerojatnije sam ispraviti.

Nakon unosa zahtjeva potrebno je na kraju kliknuti na gumb “Pronađi”. niz za pretraživanje ili gumb "Enter" na tipkovnici.

Učitavanje nova stranica s rezultatima pretraživanja.

Dogodilo se sljedeće: upisao sam ono što sam želio pronaći na internetu (znanstveno se to zove "unio upit"), pritisnuo "Enter" - i Yandex je brzinom munje "prošetao" internetom i pronašao stranice koje su predstavljale informacije koje sam tražio. zainteresiran za.

Ako se pitanje odnosi na neke poznate pojave (popularne osobe, filmovi i sl.), tada na desnoj strani tražilica prikazuje osnovne informacije. U mom slučaju, ovo je kratka biografija i poznata djela umjetnika.

A u središtu Yandex prikazuje web stranice (ili bolje rečeno stranice web stranica) s informacijama - njihovim adresama i kratkim sadržajem. Reći ću vam više o njima, jer je ovo najvažniji dio potrage.

Yandex ih je pronašao mnogo. Ali prvo tražilica prikazuje one koje iz određenih razloga smatra najboljima. I najčešće ne griješi - preostali resursi su u pravilu lošije kvalitete.

Sve su to male najave. Svaki od njih ima naslov plave boje iza kojeg slijedi kratak opis(crna). A iznad opisa je adresa web stranice na Internetu (zeleno). I da budemo precizniji, adresa stranice članak s potrebnim informacijama.

Uostalom, na svakom mjestu, u pravilu, ne postoji jedna stranica s informacijama, već mnogo njih. Primjerice, jedan je članak o Leonardu Da Vinciju, drugi o Michelangelu, treći o Rembrandtu i tako dalje. I svaki od njih ima vlastitu adresu unutar adrese stranice.

To je kao časopis u kojem ima mnogo stranica i sve su numerirane – svaka ima svoj broj.

Na primjer, svidio mi se prvi opis i želim pročitati cijeli članak. Da biste to učinili, potrebno je kursorom (strelicom) prijeći iznad naslova. Pokazivač će se pojaviti kao ruka s ispruženim prstom. Trebate jednom kliknuti lijevom tipkom miša.

Usput, na Internetu morate kliknuti sve jednom, a ne dva puta, kao na računalu.

Klikom na naslov objave otvara se nova stranica. Ovo je stranica o kojoj nam je Yandex "rekao". Sada trebate preletjeti tekst. Ako informacije na ovoj stranici nisu prikladne, zatvorite je i vratite se na Yandex s rezultatima pretraživanja. Otvaramo još jednu objavu od predloženih.

Možete otvoriti ne jednu, već nekoliko stranica u isto vrijeme. Glavna stvar je ne zbuniti se u njima :)

Sve otvorene stranice nalaze se na vrhu programa preglednika u obliku oznaka:

Odnosno, kada otvorimo objavu, ispada da imamo dva otvorena sajta. Prvi je Yandex s rezultatima pretraživanja, a drugi je onaj koji smo otvorili s popisa (jedan od rezultata).

No, vratimo se na potragu. Već sam rekao da za početak Yandex pokazuje one stranice koje su, po njegovom mišljenju, najbolje. Svi ostali (a ima ih na stotine, pa čak i tisuće) su ispod.

Ako se spustite na samo dno stranice s rezultatima pretraživanja, tamo će biti brojevi.

Da biste to učinili, morate okrenuti kotačić na mišu ili pomaknuti klizač na desnoj strani preglednika.

Iza njih su skrivene druge stranice koje je Yandex pronašao. Kliknite na broj "2". Učitat će se stranica s najavama drugih stranica.

To znači da ako ono što je Yandex dao na samom početku ne radi, možete pogledati druge objave (i stranice) koje su skrivene ispod brojeva na samom dnu rezultata pretraživanja.

Google (google.ru)

Druga tražilica koju biste trebali znati koristiti je Google (google.ru). Princip je isti. Zapošljavanje na adresna traka preglednik google.ru i pritisnite tipku "Enter" na tipkovnici.

Učitat će se stranica vrlo jednostavnog dizajna. U sredini je linija za ispis zahtjeva.

U ovaj red upišite ono što želite pronaći na Internetu (upit za pretraživanje). Nakon toga pritisnite tipku “Enter” na tipkovnici ili tipku “Traži na Googleu” na samoj stranici.

Učitat će se nova stranica s najavama. Sve je vrlo slično onome što smo već vidjeli u Yandexu.

Isto kao i kod Yandexa - čitamo najavu, a ako se čini da je prikladna, kliknite na naslov. Otvorit će se web stranica s informacijama o našoj temi. Ako je to stvarno ono što vam treba, ostanite na ovoj stranici. Što ako ove informacije ne odgovara, zatvorite ga i ponovno se vratite na Google.

I, kao u Yandexu, na samom kraju stranice s rezultatima pretraživanja nalaze se brojevi. Ovi brojevi skrivaju druge objave web stranice na tu temu.

U ovoj lekciji koju smo pogledali univerzalna metoda traženje informacija. Poznavajući samo dvije stranice - yandex.ru i google.ru - na internetu možete pronaći bilo što.

Traženje informacija na Internetu

Internet raste vrlo brzo, pa pronalaženje potrebnih informacija među stotinama milijardi web stranica i stotinama milijuna datoteka postaje sve teže. Za traženje informacija koriste se posebne tražilice koje sadrže stalno ažurirane podatke o lokaciji web stranica i datoteka na stotinama milijuna internetskih poslužitelja.

Tražilice sadrže tematski grupirane informacije o izvorima informacija Svjetska mreža u bazama podataka. Posebni robotski programi povremeno “zaobilaze” internetske web poslužitelje, čitaju sve dokumente na koje naiđu, označavaju ključne riječi u njima i unose internetske adrese dokumenata u bazu podataka.

Većina tražilica dopušta autoru web stranice unos informacija u bazu podataka ispunjavanjem obrasca za registraciju. U procesu popunjavanja upitnika, programer stranice upisuje adresu stranice, njen naziv, kratak opis sadržaja stranice, kao i ključne riječi koje će olakšati pronalaženje stranice.

Pretraživanje po ključnim riječima. Pretraživanje dokumenta u bazi podataka sustava za pretraživanje provodi se unosom upita u polje za pretraživanje.

Zahtjev mora sadržavati jedan ili više ključne riječi, koji su ključni za ovaj dokument. Na primjer, za traženje samih internetskih tražilica možete unijeti ključne riječi " ruski sustav traženje informacija na Internetu" (Sl. 6.21).

Neko vrijeme nakon slanja zahtjeva, tražilica će vratiti popis internetskih adresa dokumenata u kojima su pronađene navedene ključne riječi. Za pregled ovog dokumenta u pregledniku samo aktivirajte poveznicu koja upućuje na njega (Slika 6.22).

Ako su ključne riječi loše odabrane, tada je popis adresa dokumenata možda prevelik (može sadržavati desetke ili čak stotine tisuća poveznica). Kako biste smanjili popis, možete unijeti dodatne ključne riječi u polje za pretraživanje ili koristiti imenik tražilice.

Jedna od najcjelovitijih i najmoćnijih tražilica je Google (www.google.ru), čija baza podataka pohranjuje 8 milijardi web stranica, a svaki mjesec joj robotski programi dodaju 5 milijuna novih stranica. U Runetu (ruskom dijelu interneta), opsežne baze podataka koje sadrže po 200 milijuna dokumenata imaju tražilice Yandex (www.yandex.ru) i Rambler (www.rambler.ru).

Pretraživanje u hijerarhijskom imeničkom sustavu. U bazi podataka tražilice, web stranice su grupirane u hijerarhijski tematski katalozi, koji su analozi predmetnog kataloga u knjižnici.

Tematski dijelovi vrhunska razina, Na primjer: Internet, računala, znanost i obrazovanje itd., sadrže poddirektorije. Na primjer, internetski imenik može sadržavati poddirektorije Pretraživanje, pošta itd. (slika 6.23).

Pretraživanje informacija u katalogu svodi se na odabir određenog kataloga, nakon čega se korisniku prikazuje popis poveznica na internetske adrese najposjećenijih i najinformativnijih web stranica. Svaka poveznica obično je anotirana, odnosno sadrži kratki komentar sadržaja dokumenta.

Najpotpuniji višerazinski hijerarhijski tematski katalog internetskih izvora na ruskom jeziku dostupan je u sustavu pretraživanja Aport (www.aport.ru). Katalog sadrži detaljan sažetak sadržaja web stranica i naznaku njihovog geografskog položaja.

Pretraživanje datoteka. Za pretraživanje datoteka na poslužiteljima arhive datoteka Postoje specijalizirane tražilice, uključujući tražilicu FileSearch (www.filesearch.ru). Za traženje datoteke potrebno je unijeti naziv datoteke u polje za pretraživanje, a tražilica će vratiti internetske adrese poslužitelja za arhiviranje datoteka koji pohranjuju datoteku s navedenim nazivom.

Traženje informacija u dijelu Interneta na ruskom jeziku pomoću većine tražilica: Google, Rambler, Aport, Japs1ex i sustava za pretraživanje datoteka Research moguće je pomoću integrirane tražilice Gogle.ru (Sl. 6.24). Da biste to učinili, samo unesite ključne riječi u traku za pretraživanje, pomoću prekidača postavite vrstu potrebnih informacija i kliknite na gumb s nazivom tražilice Gogle.ru (Slika 6.24). Da biste to učinili, samo unesite ključne riječi u traku za pretraživanje, pomoću prekidača postavite vrstu potrebnih informacija i kliknite na gumb s nazivom tražilice.


Riža. 6.24. Integrirana tražilica Gogle.ru

Načini pretraživanja interneta

Tri načina pretraživanja interneta

Internet općenito, a posebno World Wide Web pretplatniku pružaju pristup tisućama poslužitelja i milijunima web stranica koje pohranjuju nezamislivu količinu informacija. Kako se ne izgubiti u ovom "oceanu informacija"? Da biste to učinili, morate naučiti pretraživati ​​i pronaći potrebne informacije na internetu.

Kao što je već spomenuto, postoje tri glavna načina traženja informacija na internetu.

1. Određivanje adrese stranice. Ovo je najviše brz način pretraživanje, ali se može koristiti samo ako je poznata točna adresa dokumenta.

2. Navigacija preko hiperveza. Ovo je najmanje prikladan način, jer uz njegovu pomoć možete pretraživati ​​dokumente koji su po značenju samo bliski trenutnom dokumentu. Ako je trenutni dokument posvećen, na primjer, glazbi, tada korištenjem hiperveza u ovom dokumentu malo je vjerojatno da ćete moći doći do stranice posvećene sportu.

3. Kontaktiranje poslužitelja za pretraživanje (tražilica). Korištenje poslužitelja za pretraživanje najprikladniji je način za pronalaženje informacija. Trenutno su sljedeće tražilice popularne na ruskom govornom području Interneta:

    Yandex;
    Lutalica;
    Aport.

Postoje i druge tražilice. Na primjer, učinkovit sustav pretraživanja implementiran je na poslužitelju usluge pošte mail.ru.

Pretraživanje poslužitelja

Najpovoljniji i na prikladan način Traženje informacija na World Wide Webu je korištenje tražilica. U ovom slučaju informacije se mogu pretraživati ​​kroz kataloge, kao i kroz skup ključnih riječi koje karakteriziraju tekstualni dokument koji se pretražuje.

Pogledajmo detaljnije korištenje poslužitelja za pretraživanje. Poslužitelj za pretraživanje sadrži velik broj poveznica na najrazličitije dokumente, a sve su te poveznice sistematizirane u tematske kataloge. Na primjer: sport, kino, automobili, igre, znanost, itd. Štoviše, ove veze instalira poslužitelj neovisno, automatski redovitim pregledom svih web stranica koje se pojavljuju na svjetskoj mreži. Osim toga, tražilice korisniku pružaju mogućnost pretraživanja informacija pomoću ključnih riječi. Nakon unosa ključnih riječi poslužitelj za pretraživanje počinje pregledavati dokumente na drugim web poslužiteljima i prikazivati ​​poveznice na te dokumente u kojima se navedene riječi pojavljuju. Obično se rezultati pretraživanja poredaju silaznim redoslijedom prema posebnoj ocjeni dokumenta, koja pokazuje koliko u potpunosti određeni dokument ispunjava uvjete pretraživanja ili koliko se često traži na mreži.

Jezik upita tražilice

Skupina ključnih riječi formirana prema određenim pravilima - korištenjem upitnog jezika - naziva se zahtjev poslužitelju za pretraživanje. Jezici upita za različite poslužitelje za pretraživanje vrlo su slični. Više o tome možete saznati ako posjetite odjeljak "Pomoć" željenog poslužitelja za pretraživanje. Pogledajmo pravila za formiranje upita na primjeru tražilice Yandex.

Sintaksa operatora Što operator znači? Primjer zahtjeva
razmak ili & Logičko I (unutar rečenice) fizikalna terapija
&& Logički I (unutar dokumenta) recepti && (topljeni sir)
| Logički ILI fotografija | fotografija | snimka | fotografska slika
+ Obavezna prisutnost riječi u pronađenom dokumentu +biti ili +ne biti
() Grupiranje riječi (tehnologija | proizvodnja) (sir | svježi sir)
~ Binarni operator I NE (unutar rečenice) banke ~ zakon
~~
ili
_
Binarni operator I NE (unutar dokumenta) Pariz vodič ~~ (agencija | obilazak)
/(n m) Udaljenost u riječima (minus (-) - natrag, plus (+) - naprijed) dobavljači /2 kava glazba /(-2 4) slobodna radna mjesta za obrazovanje ~ /+1 student
" " Potražite frazu "crvenkapica" Ekvivalent: crvena /+1 jahačica
&&/(n m) Udaljenost u rečenicama (minus (-) - natrag, plus (+) - naprijed) banka && /1 porezi

Da biste dobili najbolje rezultate pretraživanja, morate zapamtiti nekoliko jednostavnih pravila:

    1. Nemojte tražiti informacije koristeći samo jednu ključnu riječ.

    2. Bolje je ne unositi ključne riječi sa veliko slovo, jer to može dovesti do toga da iste riječi malim slovima neće biti pronađene.

    3. Ako ne dobijete rezultate pretraživanja, provjerite ima li pravopisnih pogrešaka u vašim ključnim riječima.

Moderne tražilice pružaju mogućnost povezivanja semantičkog analizatora s generiranim upitom. Uz njegovu pomoć možete unijeti riječ i odabrati dokumente u kojima se nalaze izvedenice te riječi u raznim padežima, vremenima itd.

Sigurnosna pitanja

1. Kako se dokumenti pretražuju pomoću ključnih riječi? U imeničkom sustavu?

Zadaci za samostalno rješavanje

6.8 Praktični zadatak. Usporedite rezultate pretraživanja dokumenata po ključnim riječima pomoću različitih tražilica (koristite integriranu tražilicu Gogle).

6.9 Praktični zadatak. Pronađite datoteku WinAmp media playera na poslužiteljima za arhiviranje datoteka.

Tema lekcije: Traženje informacija na internetu

Udžbenik: L. L. Bosova, A. Ya Bosova “Informatika 9” Vrsta sata: sat otkrivanja i usvajanja novih znanja, vještina i sposobnosti.

Cilj lekcije: upoznati učenike s osnovnim pojmovima „tražilica“, „direktorij poveznica“, „tražilica“ i pokazati praktičnu primjenu upitnog jezika, naučiti ih kako pronaći informacije na internetu.

Ciljevi lekcije:

  • Obrazovni: - upoznati učenike s osnovnim pojmovima, naučiti izraditi upite za pretraživanje interneta.
  • Razvojni: nastaviti razvoj pažnje i mišljenja; formiranje općeobrazovnih i općekulturnih vještina rada s informacijama, samokontrole i interesa za predmet.
  • Obrazovni: nastavi se educirati informatička kultura, vještine odgojno-obrazovnog rada i odgovoran odnos prema predmetu.

Oprema, pomoćna sredstva za nastavu

IKT alati korišteni u lekciji:

Elektronički obrazovni resursi

    • prezentacija
      Prezentacija za lekciju
      PPTX / 2,59 MB

Dodatni resursi:

Materijal s praktičnim radom “Tražim na internetu”
Praktičan rad
DOCX / 16,89 KB
i refleksija sataRefleksija
DOCX / 15,5 KB

1. Organizacijska faza

Učitelj pozdravlja učenike, provjerava njihovu spremnost za nastavu i potiče stvaranje pozitivne emocionalne pozadine. Učenici pozdravljaju učitelja i preuzimaju svoja radna mjesta

2. Obnavljanje temeljnih znanja

Nastavnik provjerava usvojenost gradiva obrađenog na prethodnim satovima.

Za to koristi križaljku s osnovnim pojmovima računalne mreže (slajd 2). Sljedeći zadaci za uspostavljanje korespondencije između logotipa popularnih preglednika i njihovih naziva (slajd 3), odnosno nazive protokola i njihovu svrhu (slajd 4).

3. Faza usvajanja novih znanja

Objašnjenje novog gradiva (slajdovi 5 - 20)

Tražilica je sklop hardvera i softvera koji je dizajniran za obavljanje funkcije pretraživanja na Internetu, a na zahtjev korisnika, koji je obično naveden u obliku tekstualne fraze (točnije upita za pretraživanje), odgovara izdavanjem reference popis izvora informacija, na temelju relevantnosti.

Učenici imenuju tražilice koje poznaju.

Glavne karakteristike tražilica

    • Potpunost. Potpunost je jedna od najvažnijih karakteristika pretraživanja; to je omjer brojeva pronađenih za upit informativni dokumenti njihovom ukupnom broju na internetu koji se odnosi na ovaj zahtjev. Što je sama pretraga potpunija, to je veća vjerojatnost da će korisnik pronaći upravo onaj dokument koji mu treba, naravno, ako on uopće postoji.
    • Točnost. Točnost određuje stupanj do kojeg stranice pronađene na internetu odgovaraju zahtjevu korisnika. Što je točnije pretraživanje, prije će korisnik pronaći informacije koje su mu potrebne, manje će se naći različitog "smeća" među rezultatima, manje pronađenih dokumenata neće odgovarati značenju zahtjeva.
    • Relevantnost. Relevantnost označava vrijeme koje protekne od trenutka objave informacije na Internetu do unošenja u indeksnu bazu podataka tražilice. Na primjer, dan nakon pojavljuje se informacija o izlasku novi iPad, mnogi su se korisnici okrenuli pretraživanju s relevantnim vrstama upita. U većini slučajeva, informacije o ovoj vijesti već su dostupne u pretrazi, iako je prošlo vrlo malo vremena od njenog pojavljivanja. To je zbog toga što velike tražilice imaju "brzu bazu podataka" koja se ažurira nekoliko puta dnevno.
    • Brzina pretraživanja. Takva funkcija kao što je brzina pretraživanja usko je povezana s takozvanim "otporom opterećenja". Ogroman broj ljudi pristupa pretrazi svake sekunde; takvo opterećenje zahtijeva značajno smanjenje vremena za obradu jednog zahtjeva. Ovdje se interesi tražilice i korisnika potpuno poklapaju: posjetitelj želi što brže doći do rezultata, a tražilica mora što brže obraditi njegov zahtjev, kako ne bi usporila obradu sljedećih zahtjeva.
    • Vidljivost. Vizualna prezentacija rezultata najvažniji je element pogodnosti pretraživanja. Za mnoge upite tražilica pronađe tisuće, au nekim slučajevima i milijune različite dokumente. Zbog nejasne izrade ključne fraze za pretraživanje ili njegovu netočnost, čak ni prvi rezultati upita nemaju uvijek samo potrebne informacije. To znači da osoba često mora sama pretraživati ​​ponuđene rezultate. Razne komponente stranica s rezultatima tražilice pomažu vam u kretanju rezultatima pretraživanja.

Linkovi imenik- Ovo je popis poveznica na stranice raščlanjene po temama s njihovim kratkim opisima.

Grupe poveznica ovisno o širini teme

    • general
    • specijalizirani (tematski)

Grupe direktorija veza:

    • zatvoreni imenici— dodavanje stranica u ovaj imenik može izvršiti samo jedna odgovorna osoba.
    • bijeli katalozi— NE zahtijevajte povratnu vezu i STAVITE izravnu vezu.
    • sivi katalozi- ZAHTIJEVANJE povratne veze i STAVLJANJE izravne veze.
    • crni katalozi— ZAHTIJEVAJU povratnu vezu i NE DAJU izravnu vezu.
    • imenici stranica s izravnim poveznicama— prilikom registracije stranice u ovom imeniku, webmaster dobiva izravnu (bez preusmjeravanja) vezu na svoju stranicu.
    • imenici stranica s poveznicama— registracija stranice u ovom imeniku ne daje poveznicu do registrirane stranice. Veze u takvim direktorijima daju se putem preusmjeravanja.

Tražilica- Ovo automatski sustav, koji pohranjuje podatke o njemu poznatim web stranicama i na zahtjev daje adrese onih na kojima se nalaze unesene ključne riječi.

Ključne riječi je skup riječi i izraza koji odražavaju potrebne informacije.

Najosnovniji zadatak svake tražilice je isporučiti ljudima upravo onu vrstu informacija koja im je potrebna.

Zato specijalizirani programeri tražilica stvaraju principe i algoritme za svoj rad koji bi korisnicima omogućili pronalaženje informacija koje ih zanimaju. To znači da sustav mora “misliti” na isti način kao što razmišlja osoba koja traži potrebne informacije na internetu.

Kako bi dobili prave odgovore na ovakva pitanja, programeri tražilica neprestano poboljšavaju principe rangiranja i njegove algoritme, dodajući im nove značajke i funkcije, te na sve načine pokušavaju ubrzati rad sustava.

Prvi računalni program za pretraživanje interneta postojao je program koji se zvao Archie (engleski archie - arhiva bez slova “v”). Napravili su ga 1990. godine Alan Emtage, Bill Heelan i J. Peter Deutsch, studenti informatike na Sveučilištu McGill u Montrealu. Program je preuzeo popise svih datoteka sa svih dostupnih anonimnih FTP poslužitelja i napravio bazu podataka koja se može pretraživati ​​prema nazivima datoteka. Međutim, Archiejev program nije indeksirao sadržaj tih datoteka, budući da je količina podataka bila toliko mala da se sve lako moglo pronaći rukom.

Prvi alat za pretraživanje weba napisan u Perlu bio je World Wide Web Wanderer, bot koji je razvio Matthew Gray s MIT-a u lipnju 1993. Ovaj robot stvoren indeks pretraživanja Wandex. Wandererov cilj bio je izmjeriti veličinu World Wide Weba i pronaći sve web stranice koje sadrže riječi iz upita.

Tražilica WebCrawler, pokrenuta 1994. godine, prvi je sustav indeksiranja resursa punog teksta koji koristi robota („bazirano na pretraživaču“).

Sustav je omogućio korisnicima da pretražuju bilo koju riječ koja se nalazi na bilo kojoj web stranici - to je od tada postalo standard za većinu tražilica.

Tražilica WebCrawler bila je prva tražilica koja je postala široko korištena.

Godine 1996. provedeno je pretraživanje uzimajući u obzir rusku morfologiju na tražilici Altavista i pokrenute su originalne ruske tražilice Rambler i Aport. 23. rujna 1997. otvorena je tražilica Yandex. Dana 22. svibnja 2014. Rostelecom je pokrenuo nacionalnu tražilicu Sputnik. 22. travnja 2015. pokrenuta je nova usluga Sputnik. Djeca posebno za djecu s povećanom sigurnošću.

Vrste tražilica:

    • Sustavi koji koriste robote za pretraživanje. Sastoje se od tri dijela: alata za indeksiranje ("bot", "robot" ili "pauk"), indeksa i softvera tražilice. Alat za indeksiranje potreban je za indeksiranje weba i stvaranje popisa web stranica. Indeks - velika arhiva kopije web stranica. Cilj softver— ocijenite rezultate pretraživanja. Zbog činjenice da robot za pretraživanje u ovom mehanizmu neprestano istražuje mrežu, informacije su relevantnije. Većina modernih tražilica jesu ove vrste.
    • Sustavi koje pokreće čovjek (direktorije resursa): Ove tražilice dohvaćaju popise web stranica. Imenik sadrži adresu, naslov i kratak opis stranice. Direktorij resursa traži samo rezultate iz opisa stranica koje su mu poslali webmasteri. Prednost kataloga je u tome što se svi resursi provjeravaju ručno, stoga će kvaliteta sadržaja biti bolja u usporedbi s rezultatima koje prvi tip sustava dobiva automatski. Ali postoji i nedostatak - ažuriranje kataloških podataka vrši se ručno i može značajno zaostajati za stvarnim stanjem stvari.
    • Hibridni sustavi. Tražilice kao što su Yahoo, Google, MSN kombiniraju funkcije sustava koji koriste robote za pretraživanje i sustava kojima upravljaju ljudi.
    • Meta-sustavi. Metatražilice kombiniraju i rangiraju rezultate nekoliko tražilica odjednom. Ove su tražilice bile korisne kada je svaka tražilica imala jedinstveni indeks i tražilice su bile manje "pametne". Budući da se pretraga sada toliko poboljšala, potreba za njima se smanjila.

Mnoge tražilice, poput Googlea i Binga, koriste algoritme za selektivno pogađanje koje bi informacije korisnik želio vidjeti na temelju njihove prethodne aktivnosti pregledavanja. Kao rezultat toga, web stranice prikazuju samo informacije koje su u skladu s prošlim interesima korisnika. Taj se učinak naziva "mjehurić filtera". Sve to dovodi do činjenice da korisnici dobivaju mnogo manje informacija koje su u suprotnosti s njihovim gledištem i postaju intelektualno izolirani u vlastitom “informacijskom balonu”.

Učitelj provodi anketu kako bi saznao koja je tražilica najpopularnija u razredu i upoznaje učenike s rangiranjem tražilica u Rusiji.

Jezik upita

Zabrana nabrajanja svih oblika riječi.

Obavezna prisutnost riječi u pronađenim dokumentima.

Isključivanje riječi iz rezultata pretraživanja.

& - obavezno pojavljivanje riječi u jednoj rečenici.

~ - zahtjev za prisustvom prve riječi u rečenici bez prisustva druge.

| - potražite bilo koju od ovih riječi.

"" - traženje stabilnih izraza.

$title - traženje informacija po nazivu naslova.

$anchor - traženje informacija po nazivima poveznica.

4. Dinamička pauza

(slajd 21-23) Učenicima se daje dinamički odmor, koji se sastoji od tri skupine gimnastičkih vježbi za oči, ublažavanje napetosti i umora prema metodi E. S. Avetisova.

5. Faza konsolidacije proučenog materijala nakon koje slijedi samotestiranje.

(slajd 24-25) Nastavnik s učenicima provodi praktičan rad na pretraživanju interneta.

Praktičan rad.

Zadatak 1.

Značajke pretraživanja po skupini riječi.

Ispunite tablicu pomoću tražilice Yandex.

Struktura zahtjeva

Broj pronađenih stranica

Brz! tramvaj!

Express + tramvaj

Laka željeznica

"Laka željeznica"

Bitka za Staljingrad

Staljingrad i bitka

$title (Rijeka Volga)

$sidro (rijeka Volga)

Zadatak 2.

Pronađite informacije o zanimljive činjenice Volgograd na internetu

1. Što je jedinstveno u ulici Coventry u Volgogradu?

2. Gdje je najviši spomenik na svijetu podignut stvarnoj osobi? Navedite dimenzije i sliku.

3. Koje je veličine najduža kuća u Europi? Navedite njegovu adresu i sliku

4. Kada je Volgograd preimenovan u “grad heroj Staljingrad” (točni datumi)

5. Kolika je duljina najduže ulice u Rusiji, koja nema službeni status ulice? Kako se zove?

Nakon obavljenog rada provjeravaju se rezultati rada, a učenici sami sebi daju ocjenu za sat.

Nastavnik prati napredovanje učenika u radu i pomaže učenicima koji ne mogu sami riješiti zadatak.

Učenici pod vodstvom nastavnika provjeravaju svoje rezultate praktični rad, analizirati dobivene odgovore, te odrediti ocjenu rezultata rada.

Primjeri odgovora na praktični rad (slajd 26-31)

Ocjenjivanje praktičnog rada

5 - odgovori na 1. zadatak su točni, 2. zadatak ispunjen u cijelosti s objašnjenjima i fotografijama.

4 - u 1. zadatku bilo je netočnosti u 1-2 odgovora, na jedno ili dva pitanja u 2. zadatku dat je nepotpun odgovor.

3 - u zadatku 1 bilo je netočnih odgovora u 3-4 odgovora, na tri pitanja zadatka 2 dati su nepotpuni odgovori ili nije bilo odgovora na 2 pitanja

6. Sažimanje lekcije, osvrt na lekciju, postavljanje domaće zadaće

Nastavnik zadaje domaću zadaću i po potrebi je komentira.

domaća zadaća

Naučite materijal predavanja

Udžbenik L. L. Bosova, A. Ya Bosova “Informatika 9”

Radna bilježnica L. L. Bosova, A. Ya Bosova “Informatika 9”

Učitelj i učenici sažimaju lekciju, ocjenjuju i zahvaljuju za lekciju te pozivaju učenike da ispune listić za refleksiju lekcije.

Selektivno odgovorite na 2-3 od sljedećih pitanja:

    • danas sam saznao
    • Uspjela sam
    • Imam poteškoća
    • Izvršio sam zadatke
    • naučila sam
    • sada mogu

Korišteni resursi:

L. L. Bosova, A. Ya. Bosova “Informatika 9”

I.G. Semakin, L.A. Zalogova, S.V. Rusakov, L.V. Šestakova “Informatika i IKT 9”

Problem s pretraživanjem World Wide Weba nije u tome što ima malo informacija, već u tome što ih ima puno. Traženje informacija na internetu je kamen temeljac učinkovit rad na webu. Posjedovanje vještina pretraživanja čini internet korisnim za korisnika i tijekom rada i tijekom slobodnog vremena.
Za organiziranje pretraživanja na Internetu postoje specijalizirani servisi koji se zovu tražilice.

Tražilice.

Tražilice su softverski i hardverski sustavi s web sučeljem koji pružaju mogućnost pretraživanja informacija na internetu.
Većina tražilica traži informacije na World Wide Web stranicama, ali postoje i sustavi koji mogu tražiti datoteke na FTP poslužiteljima, proizvode u online trgovinama i informacije u Usenet grupama. Za traženje informacija pomoću tražilice, korisnik formulira upit za pretraživanje. Na zahtjev korisnika, tražilica generira stranicu s rezultatima pretraživanja. Takvi se rezultati pretraživanja mogu kombinirati razne vrste datoteke, na primjer: web stranice, slike, audio datoteke. Neke tražilice također dohvaćaju podatke iz baza podataka i direktorija izvora na Internetu.
Svrha tražilice je pronaći dokumente koji sadrže ključne riječi ili riječi koje su na neki način povezane s ključnim riječima. Tražilica je bolja što više dokumenata vraća relevantnih za korisnikov upit. Rezultati pretraživanja mogu postati lošiji zbog prirode algoritama. Na primjer, kada se pita za kućne ljubimce, Yandexov poslužitelj za pretraživanje (pogledajte više o tome u nastavku) pruža više od 14.000.000 poveznica na stranice koje sadrže informacije za koje misli da su mu potrebne. Međutim, nije sve tako glatko: kada posjetite neke od pronađenih stranica, ispostavi se da informacije koje tražite nisu dovoljne ili čak nepostoje.
Da biste tražili s maksimalnom učinkovitošću, morate znati kako funkcioniraju poslužitelji za pretraživanje i pravilno formulirati zahtjev za traženje informacija.

Kako rade tražilice

Tražilice rade tako da pohranjuju informacije o mnogim web stranicama s kojih dohvaćaju HTML stranice. Glavne komponente sustava za pretraživanje: robot za pretraživanje, indekser, tražilica. Obično sustavi rade u fazama. Najprije robot za pretraživanje prima sadržaj, a zatim pregledava sadržaj web stranica. Tek tada indekser generira pretraživi indeks. Indeksator je modul koji analizira stranicu, prethodno je razdijelivši na dijelove, koristeći vlastite leksičke i morfološke algoritme.
Rad većine modernih tražilica temelji se na indeksu citiranja, koji izračunava indekser kao rezultat analize poveznica na trenutnu stranicu s drugih internetskih stranica. Što ih je više, to je veći indeks citata analizirane stranice, stranica će biti prikazana više u rezultatima pretraživanja i stranica će biti prikazana na višoj poziciji u popisu pronađenih izvora.

Pravila za konstrukciju upita za pretraživanje

Kao što je već napomenuto, na Internetu postoji mnogo poslužitelja za pretraživanje, domaćih i stranih.
Ruski poslužitelji za pretraživanje: Yandex (www.yandex.ru); Rambler (www.rambler.ru); Aport (www.aport.ru) i Gogo (www.gogo.ru).

Strani poslužitelji za pretraživanje: Google ( www.google.com); Altavista (www.altavista.com) i Yahoo! (www.yahoo.com).
Ruski poslužitelji su prikladniji za pretraživanje na ruskom, strani poslužitelji su prikladniji za pretraživanje na stranom jeziku, iako Google dobro radi pretraživanje na mnogim jezicima. Unatoč tvrdnjama mnogih vlasnika tražilica da se upiti mogu pisati praktički na jeziku kojim ljudi međusobno komuniciraju, to je daleko od slučaja. Zahvaljujući uvođenju novih jezičnih tehnologija, tražilice su postale mnogo bolje razumljive korisniku. Tražilice sada traže ne samo traženu riječ, već i njezine oblike riječi, što rezultate pretraživanja čini preciznijima. Na primjer, ako upit za pretraživanje sadrži riječ pametan, tada će njegovi rezultati sadržavati ne samo ovu riječ, već i njezine izvedenice: pametan, pametan, kao i inteligencija, pa čak i inteligencija. Naravno, stranice s oblicima riječi neće biti među prvim rezultatima pretraživanja, već elementi umjetna inteligencija je očito. Korisno je uzeti u obzir ovu činjenicu prilikom konstruiranja upita za pretraživanje.
Treba imati na umu da tražilice ne uzimaju u obzir veličinu znakova prilikom obrade zahtjeva i uopće nije potrebno koristiti interpunkcijske znakove u upitima za pretraživanje, budući da ih poslužitelji za pretraživanje također ignoriraju. Međutim, pri izradi složenih naprednih upita, čiji su rezultati pretraživanja obično puno bliži očekivanima, koristi se tradicionalna interpunkcija. Većina tražilica može riješiti tipfelere. Ako poslužitelj za pretraživanje smatra da postoji greška ili tipfeler u riječi, upozorit će vas na to istom frazom: Možda ste tražili….

Riječi za upit poslužitelju za pretraživanje

Postoji izraz “Stroj mora raditi, čovjek mora misliti” i kaže se upravo za takvu situaciju. Zadatak korisnika prilikom sastavljanja upita za pretraživanje je istaknuti ključne riječi, zadatak poslužitelja za pretraživanje je na najbolji mogući način obraditi uneseni zahtjev. Pogledajmo primjer koji ilustrira tipične greške korisnicima početnicima prilikom pretraživanja interneta. Tražilica nije dala nikakve korisne rezultate za upit "Zagonetke o glazbenim instrumentima". Zatim korisnik odluči ispraviti upit dodavanjem i pisanjem: "Zagonetke za djecu o glazbenim instrumentima" - rezultati pretraživanja su se pokazali još gori od prethodnog. Za ovaj primjer Dobro rješenje bilo je tražiti ključnu riječ "zagonetke". Takvih stranica ima mnogo na internetu, a odlaskom na samu stranicu i malo pretražujući njezine dijelove lako ćete pronaći informacije koje vas zanimaju. Formulirajmo nekoliko pravila za sastavljanje upita:

  • odabrati samo najvažnije ključne riječi vezane uz temu koja se razmatra;
  • ne smije biti previše riječi, ali ni premalo;
  • Ako rezultati pretrage nisu zadovoljavajući, koristite blaže termine za upit ili pokušajte tražiti u drugoj tražilici, jer Mehanizmi tražilica nisu isti, stoga i rezultati mogu varirati.

Napredno pretraživanje

Kako bi omogućili učinkovitije pretraživanje na Internetu, tražilice pružaju napredne mogućnosti pretraživanja, kao i pretraživanja pomoću jezika upita. Napredno pretraživanje - mogućnost pretraživanja s različitim raznih parametara. U tu svrhu tražilice nude zasebne stranice na kojima možete postaviti takve parametre. Načela naprednog pretraživanja slična su za većinu tražilica.
Razmotrimo dodatne značajke pretražujte na primjerima tražilica Yandex i Google jer je Yandex najpopularniji poslužitelj za pretraživanje na internetu na ruskom jeziku, a Google je najpopularnija tražilica na svijetu. Prilikom pretraživanja interneta Yandex je bio jedan od prvih koji je uzeo u obzir morfologiju ruskog jezika, odnosno koristio različite oblike riječi, kao što je gore navedeno. Odlaskom na web stranicu www.yandex.ru korisnik može unijeti upit i odmah dobiti rezultate pretraživanja ili možete koristiti vezu Napredno pretraživanje pomoću ikone i otići na odgovarajuću stranicu (pogledajte donju sliku), gdje možete fino podesite parametre pretraživanja.

Yandex stranica za napredno pretraživanje

Razmotrimo dodatne značajke koje se mogu koristiti na stranici naprednog pretraživanja: naznačite vlastitu lokaciju (Moskva), navedite u kojem obliku informacije trebaju biti prikazane (Vrsta datoteke), vremensko razdoblje u kojem tražimo informacije (po danu, po 2 tjedna, mjesečno, Od ..Prije), na kojem jeziku informacije trebaju biti predstavljene (ruski, engleski Više), a možete navesti i URL stranice itd.
Odabir (Točno kao u upitu) naznačen je tražilici tako da se morfologija riječi upita ne mijenja, već se traži samo oblik riječi koji je naveden.

Jezik upita

Jezik upita sustav je naredbi koji vam omogućuje promjenu parametara upita iz glavnog niza pretraživanja pomoću posebnih naredbi. Namijenjen iskusnim korisnicima.
Budući da je jezik upita prilično složen i opsežan, predstavit ćemo samo njegove glavne strukture koje bi mogle biti najtraženije od strane korisnika. Neke naredbe Yandex upitnog jezika prikazane su u tablici.

Operater

Opis

Sintaksa

Primjer zahtjeva

Tražite dokumente koji nužno sadrže označenu riječ.

Prihvatljivo je koristiti više operatora + u jednom upitu.

"riječ 1 +riječ 2"

Pronaći će se dokumenti koji nužno sadrže riječi "bulevar" i "Moskva", a mogu sadržavati i riječ "Šolohov".

Pretraživanje po citatu.

Tražite dokumente koji sadrže riječi upita u zadanom nizu i obliku.

"riječ 1 riječ 2...riječ N"

Pronaći će se dokumenti koji sadrže ovaj citat.

Pretraživanje po citatu s nedostajućim riječima.

Jedan * operator odgovara jednoj riječi koja nedostaje.

Pažnja! Može se koristiti samo kao dio operatora.

"riječ 1 * riječ 2 ... riječ N "

Operator je odvojen razmacima.

Pronaći će se dokumenti koji sadrže navedeni citat, uključujući riječ koja nedostaje.

Bit će pronađeni dokumenti koji sadrže navedeni citat, uključujući riječi koje nedostaju.

Potpuna struktura Yandex jezika upita može se pronaći na stranici pomoći (http://help.yandex.ru/search/?id=481939). Jezik upita za pretraživanje u Googleu razlikuje se od Yandexa, iako postoje neke zajedničke točke. Razmotrite neke od osnovnih naredbi ovog jezika proučavajući tablicu (vidi dolje)

Potpuno sa strukturom jezika Google upiti možete pronaći na stranici za pomoć:

Traženje informacija na Internetu

Traženje informacija na Internetu

Za traženje informacija se obično koriste tri načina(Pogledajte sliku 1). Prvi od toga - pretraživanje po adresi. Koristi se kada korisnik zna adresu informacijskog izvora koji sadrži informacije koje su mu potrebne. Prilikom organiziranja pretraživanja informacija po adresi (oblik adrese - IP, domena ili URL - u ovom slučaju nije bitan), korisnik jednostavno treba unijeti adresu resursa u odgovarajuće polje preglednika - programa dizajniranog za omogućiti pristup mrežnim resursima.

Riža. 1. Metode traženja informacija u hipertekstualnim bazama podataka

Drugi- pretraživanje pomoću navigacije hipervezom. Kada koristite ovu vrstu slučaja pretraživanja, korisnik prvo mora dobiti pristup poslužitelju povezanom s odgovarajućom bazom podataka. Zatim možete pronaći dokument pomoću hiperveza. Očito, ova metoda je prikladna kada je adresa resursa nepoznata korisniku. Kao polazište za pretraživanje pri implementaciji ove metode namijenjeni su web portali - poslužitelji koji omogućuju izravan pristup određenom skupu poslužitelja, uključujući i one instalirane na njima izvori informacija, kao i web aplikacije koje implementiraju web servise koji odgovaraju namjeni portala. Poslužitelji kojima se pristupa putem portala mogu pripadati određenom sustavu (primjerice korporativnom) ili različitim sustavima te biti posebno odabrani prema vrsti, tematskim ili drugim karakteristikama dokumenata i podataka koji se nalaze na njihovim stranicama. Portali obično kombiniraju različite funkcije kako bi zadržali klijenta što je duže moguće. Dominantna usluga portala je usluga pomoćna služba: pretraživanje, kategorije, financijski indeksi, informacije o vremenu, itd. Ako su web stranice u većini slučajeva zbirke statičnih web stranica, onda su portali zbirke softver te unaprijed nestrukturirane informacije koje ovi alati pretvaraju u strukturirane podatke na zahtjev određenih korisnika.

Treći Metoda pretraživanja uključuje korištenje internetskih poslužitelja za pretraživanje. Poslužitelji za pretraživanje namjenska su glavna računala koja ugošćuju baze podataka internetskih izvora. Korisničko sučelje takav poslužitelj ima polje za unos ključnih riječi koje opisuju temu koja zanima korisnika (vidi sl. 2).

sl.2. Prikaz prozora poslužitelja za pretraživanje Yandex

Poslužitelj te riječi percipira kao informacijski zahtjev, u skladu s kojim traži resurse i korisniku prikazuje popis pronađenih dokumenata. Očito, pri implementaciji ove metode moguće su pogreške i tipa 1 (promašaj cilja) i tipa 2 (informacijski šum). Treba napomenuti da postoje dvije skupine poslužitelja za pretraživanje: tražilice i predmetni katalozi. Njihova razlika je zbog metode stvaranja i naknadnog nadopunjavanja baze podataka internetskih izvora, koje ovaj poslužitelj koristi za traženje informacija. Dakle, tražilice uključuju poseban program- robot za pretraživanje. Stalno prati mrežu, prikuplja podatke iz web stranice, indeksira ih i bilježi njihovu sliku pretraživanja u svoju bazu podataka. U predmetnim katalozima bazu internetskih dokumenata "ručno" formiraju urednici specijalisti. Kako na Internetu ne postoji jedinstvena administracija, njegovi se informacijski resursi stalno mijenjaju. U njemu se mogu pojaviti novi dokumenti, a postojeći dokumenti mogu nestati. Učestalost ažuriranja informacija u dokumentima za različite stranice je različita: za neke je to nekoliko puta u satu, za neke jednom dnevno, dan, mjesec itd. Stoga je vrlo važno razumjeti da se pri korištenju sustava za pretraživanje informacija za pronalaženje informacija na Internetu pretraživanje ne provodi na stvarnom prostoru internetskih dokumenata, već u nekom modelu, čiji se sadržaj može značajno razlikovati od stvarnog Internetski sadržaj u trenutku pretraživanja. Na temelju pokrivenosti indeksiranih izvora, tražilice se mogu podijeliti u dvije skupine: međunarodne i one na ruskom jeziku. Prvi redom indeksiraju sve dokumente objavljene na internetu. Potonji indeksni resursi koji se nalaze u domenske zone s prevlašću ruskog jezika. Popis najpopularnijih sustava dan je u tablici. 1.

Stol 1. Najpopularnije tražilice

Međunarodni govori ruski
Google Yandex (44,4% Runeta)
Yahoo! Rambler (10,6% Runeta)
Bing Mail.ru (7,3% Runeta)
MSN Nigma (0,5% Runeta)
AltaVista Gogo.ru (0,3% Runeta)
Pitajte Aport (0,2% Runeta)

Napomena: Runet je dio Interneta na ruskom jeziku koji se sastoji od domena s imenima ru i RF.

Potrebno je napomenuti da postoji posebna kategorija poslužitelja za pretraživanje - metapretraživači. Njihova temeljna razlika u odnosu na tražilice i predmetne kataloge je u tome što nemaju vlastitu indeksnu bazu podataka, pa ga po primitku zahtjeva korisnika preusmjeravaju na više poslužitelja za pretraživanje odjednom (vidi sl. 3).

Riža. 3. Shema rada sustava za metapretraživanje

Mogućnost istovremenog korištenja nekoliko poslužitelja za pretraživanje za jedan zahtjev je očita prednost metapretraživači. Trenutno je sustav Metabot.ru, čije je sučelje prikazano na slici 1, pronašao široku upotrebu. 4. Ovaj sustav vam omogućuje korištenje međunarodnih i ruskih poslužitelja za traženje resursa.