Što je predmemorija razine 3. Cache memorija i njezina namjena u procesoru. Osnovni tipovi i razine cache memorije L1 L2 L3

29.04.2020 Sigurnost

Današnji članak nije neovisni materijal - on jednostavno nastavlja proučavanje performansi triju generacija Core arhitekture pod jednakim uvjetima (započeto krajem prošle godine i nastavljeno nedavno). Istina, danas ćemo napraviti mali korak u stranu - frekvencije jezgri i predmemorije ostat će iste kao i prije, ali kapacitet potonje će se smanjiti. Zašto je to potrebno? Koristili smo “puni” Core i7 posljednje dvije generacije za čistoću eksperimenta, testirajući ga s uključenom i isključenom podrškom za Hyper-Threading tehnologiju, budući da već godinu i pol Core i5 nije opremljen s 8, ali 6 MiB od L3. Jasno je da utjecaj kapaciteta cache memorije na performanse nije tako velik kao što se ponekad vjeruje, ali postoji i od toga se ne može pobjeći. Osim toga, Core i5 su masovniji proizvodi od Core i7, au prvoj generaciji im se nitko nije “uvrijedio” po tom pitanju. Ali prije su bili ograničeni malo drugačije: takt UnCore u prvoj generaciji i5 bio je samo 2,13 GHz, tako da naš "Nehalem" nije baš predstavnik linije 700 na 2,4 GHz, već malo više brzi procesor. Međutim, smatrali smo nepotrebnim uvelike proširiti popis sudionika i ponoviti uvjete testiranja - svejedno, kao što smo više puta upozoravali, testiranje ove linije ne daje nikakve nove praktične informacije: pravi procesori rade u potpuno različitim načinima rada. Ali za one koji žele temeljito razumjeti sve suptilne točke, mislimo da će takvo testiranje biti zanimljivo.

Konfiguracija ispitnog stola

Odlučili smo se ograničiti na samo četiri procesora, a bit će dva glavna sudionika: oba četverojezgreni Ivy Bridge, ali s različitim kapacitetima predmemorije treće razine. Treći je “Nehalem HT”: prošli put je po konačnoj ocjeni ispao gotovo identičan “Ivy Bridge Simply”. I “jednostavno Nehalem” koji je, kao što smo već rekli, malo brži od pravog Core i5 prve generacije koji radi na 2,4 GHz (zbog činjenice da je u liniji 700 UnCore frekvencija bila nešto niža), ali ne previše radikal. Ali usporedba je zanimljiva: s jedne strane, postoje dva koraka za poboljšanje mikroarhitekture, s druge strane, cache memorija je ograničena. A priori, možemo pretpostaviti da će prvi prevagnuti u većini slučajeva, ali koliko i općenito - koliko su usporedivi "prvi" i "treći" i5s (naravno, prilagođen frekvenciji UnCore, iako ako ima mnogo ljudi koji žele vidjeti apsolutno točnu usporedbu, učinit ćemo to kasnije, učinimo to) - već dobra tema za istraživanje.

Testiranje

Tradicionalno, sve testove dijelimo u nekoliko skupina i na dijagramima prikazujemo prosječni rezultat za skupinu testova/aplikacija (više o metodologiji testiranja možete saznati u zasebnom članku). Rezultati u dijagramima dani su u bodovima, performanse referentnog sustava uzete su kao 100 bodova. ispitni sustav stranica iz 2011. Temelji se na AMD procesor Athlon II X4 620, ali količina memorije (8 GB) i video kartice () su standardni za sve testove "glavne linije" i mogu se mijenjati samo u okviru posebnih studija. Za one koje zanima više detaljne informacije, ponovno se tradicionalno predlaže preuzimanje tablice u Microsoft Excel formatu, u kojoj su svi rezultati prikazani i pretvoreni u bodove iu "prirodnom" obliku.

Interaktivan rad u 3D paketima

Postoji određeni učinak kapaciteta predmemorije, ali manji je od 1%. Sukladno tome, oba Ivy Bridgea mogu se smatrati identičnima jedan drugome, a arhitektonska poboljšanja omogućuju novom Core i5 da lako nadmaši stari Core i7 na isti način kao što to čini novi Core i7.

Završno renderiranje 3D scena

U ovom slučaju, naravno, nikakva poboljšanja ne mogu nadoknaditi povećanje broja obrađenih niti, ali danas nam nije najvažnije to, već potpuni nedostatak utjecaja kapaciteta predmemorije na performanse. Celeron i Pentium su, kao što smo već utvrdili, različiti procesori, pa su programi za renderiranje osjetljivi na kapacitet L3, ali samo kada je ovaj nedostatan. A 6 MiB za četiri jezgre, kao što vidimo, sasvim je dovoljno.

Pakiranje i raspakiranje

Naravno, ti su zadaci podložni kapacitetu predmemorije, međutim i ovdje je učinak povećanja sa 6 na 8 MiB prilično skroman: otprilike 3,6%. Zanimljivija je zapravo usporedba s prvom generacijom - arhitektonska poboljšanja omogućuju novom i5 da razbije čak i stari i7 na jednakim frekvencijama, ali to je u ukupnom poretku: zbog činjenice da su dva od četiri testa pojedinačni -navoj, a drugi je dvonavoj. Kompresija podataka pomoću 7-Zipa prirodno je najbrža na Nehalemu HT: osam niti je uvijek brže od četiri s usporedivom izvedbom. Ali ako se ograničimo na samo četiri, onda naš "Ivy Bridge 6M" gubi ne samo od svog prethodnika, već i od starog Nehalema: poboljšanja mikroarhitekture potpuno su popustila smanjenju kapaciteta predmemorije.

Audio kodiranje

Ono što je bilo donekle neočekivano nije bila veličina razlike između dva Ivy Bridgea, već činjenica da je razlika uopće postojala. Istina je toliko jeftina da se može pripisati zaokruživanju ili pogreškama mjerenja.

Kompilacija

Niti su važne, ali i kapacitet predmemorije. Međutim, kao i obično, ne previše - oko 1,5%. Zanimljivija je usporedba s prvom generacijom Corea s isključenim Hyper-Threadingom: "na bodove" novi Core i5 pobjeđuje čak i na istoj frekvenciji, ali jedan od tri kompajlera (točnije Microsoft) radio je na oba procesora u isto toliko vremena. Čak i s 5 sekundi prednosti za starijeg - unatoč činjenici da je u ovom programu "puna predmemorija" Ivy Bridge rezultate ima 4 sekunde bolje od Nehalema. Općenito, ni ovdje ne možemo pretpostaviti da je smanjenje kapaciteta L3 nekako jako utjecalo na drugu i treću generaciju Core i5, ali postoje neke nijanse.

Matematički i inženjerski proračuni

Opet manje od 1% razlike u odnosu na “stariji” kristal i opet uvjerljiva pobjeda nad prvom generacijom u svim njenim oblicima. Što je više pravilo nego iznimka za takve low-thread testove, ali zašto se ne uvjeriti još jednom? Pogotovo u tako dorađenom obliku, kada (za razliku od testova u normalnom načinu rada) razlika u frekvencijama ("standardna" ili koja se pojavljuje zbog Turbo Boosta) ne smeta.

Rasterska grafika

Ali čak i uz potpunije korištenje multithreadinga, slika se ne mijenja uvijek. A kapacitet predmemorije ne daje baš ništa.

Vektorska grafika

I ovdje je isto. Istina, potrebno je samo nekoliko računskih niti.

Video kodiranje

Za razliku od ove skupine, gdje, međutim, ni Hyper-Threading ne dopušta Nehalemu da se ravnopravno bori sa sljedbenicima novijih generacija. Ali nisu previše sputani smanjenjem kapaciteta cache memorije. Točnije, praktički uopće ne smeta, budući da je razlika opet manja od 1%.

Uredski softver

Kao što se moglo očekivati, nema poboljšanja performansi od povećanja kapaciteta cache memorije (točnije, nema pada od njegovog smanjenja). Iako ako pogledate detaljne rezultate, možete vidjeti da jedini multi-threaded test u ovoj skupini (tj. prepoznavanje teksta u FineReaderu) radi oko 1,5% brže s 8 MiB L3 nego sa 6 MiB. Čini se - što je 1,5%? S praktične strane - ništa. Ali s istraživačke točke gledišta već je zanimljivo: kao što vidimo, testovi s više niti najčešće nemaju predmemoriju. Kao rezultat toga, razlika (iako mala) ponekad se nađe čak i tamo gdje se čini da ne bi trebala biti. Iako tu nema ništa tako neobjašnjivo – grubo rečeno, u low-threaded testovima imamo 3-6 MiB po threadu, ali u multi-threaded testovima to ispadne 1,5 MiB. Prvog ima dosta, ali drugog možda nije baš dovoljno.

Java

No, Java stroj se ne slaže s ovom ocjenom, ali je i to razumljivo: kao što smo više puta pisali, on je vrlo dobro optimiziran uopće ne za x86 procesore, već za telefone i aparate za kavu, gdje može biti puno jezgri, ali predmemorija je vrlo malo memorije. A ponekad ima malo jezgri i predmemorije - skupi resursi i u smislu površine čipa i potrošnje energije. I, ako je moguće učiniti nešto s jezgrama i megahercima, onda je s predmemorijom sve kompliciranije: u četverojezgrenoj Tegra 3, na primjer, postoji samo 1 MiB. Jasno je da JVM može “stisnuti” više (kao i svi sustavi bajt koda), što smo već vidjeli uspoređujući Celeron i Pentium, ali više od 1,5 MiB po niti, ako i može biti korisno, nije za te zadatke. uključeni su u SPECjvm 2008.

Igre

Polagali smo velike nade u igrice, jer se često pokažu da su zahtjevnije u pogledu kapaciteta cache memorije čak i od arhivara. Ali to se događa kada ga ima vrlo malo, a 6 MiB, kao što vidimo, dovoljno je. A, opet, četverojezgreni Core procesori bilo koje generacije, čak i na frekvenciji od 2,4 GHz, suviše su moćno rješenje za korištene gaming aplikacije, pa usko grlo očito neće biti oni, već druge komponente sustava. Stoga smo odlučili skinuti prašinu s modova s ​​niskom kvalitetom grafike - jasno je da je za takve sustave previše sintetičko, ali sva testiranja radimo i sintetički :)

Kad se sve vrste video kartica i tako dalje ne miješaju, razlika između dva Ivy Bridgea doseže "ludih" 3%: u ovom slučaju to možete zanemariti u praksi, ali u teoriji je puno. Više je izašlo tek u arhivama.

Višezadaćno okruženje

Ovo smo već negdje vidjeli. Pa da – kada smo testirali procesore sa šest jezgri pod LGA2011. I sada se situacija ponavlja: opterećenje je multi-threaded, neki od korištenih programa su "pohlepni" za predmemoriju, ali njezino povećanje samo smanjuje prosječne performanse. Kako se to može objasniti? Osim što se arbitraža komplicira i povećava se broj pogrešaka. Štoviše, napominjemo da se to događa samo kada je kapacitet L3 relativno velik i postoje najmanje četiri računske niti koje rade istovremeno - u proračunski segment potpuno druga slika. U svakom slučaju, kao što je pokazalo naše nedavno testiranje Pentiuma i Celerona, za dvojezgrene procesore povećanje L3 s 2 na 3 MiB dodaje 6% performansi. Ali ne daje ništa četverojezgrenim i šesterojezgrenim, blago rečeno. Čak manje nego ništa.

Ukupno

Logičan sveukupni rezultat: budući da nigdje nije pronađena značajna razlika između procesora s različitim veličinama L3, ne postoji "općenito". Dakle, nema razloga za uzrujavanje zbog smanjenja kapaciteta predmemorije u drugoj i trećoj generaciji Core i5 - prethodnici prve generacije im ionako nisu konkurenti. I stariji Core i7 također u prosjeku pokazuju samo sličnu razinu performansi (naravno, uglavnom zbog zaostajanja u low-thread aplikacijama – a postoje i scenariji s kojima se pod jednakim uvjetima snalaze brže). No, kao što smo već rekli, realni procesori u praksi su daleko od ravnopravnih frekvencija, pa je praktična razlika među generacijama veća nego što se može dobiti u ovakvim studijama.

Samo jedno pitanje ostaje otvoreno: morali smo jako reducirati taktna frekvencija osigurati jednake uvjete s prvom generacijom Corea, ali hoće li se uočeni obrasci sačuvati u uvjetima bližim stvarnosti? Uostalom, samo zato što četiri računske niti male brzine ne vide razliku između 6 i 8 MiB predmemorije, ne slijedi da ona neće biti otkrivena u slučaju četiri brze niti. Istina, suprotno ne slijedi, pa da bismo konačno zatvorili temu teorijskog istraživanja, trebat će nam još jedno laboratorijski rad, što ćemo učiniti sljedeći put.

Radeći razne zadatke Procesor vašeg računala prima potrebne blokove informacija od RAM memorija. Nakon što ih obradi, CPU zapisuje dobivene rezultate izračuna u memoriju i prima sljedeće blokove podataka na obradu. To se nastavlja dok se zadatak ne završi.

Gore navedeni procesi provode se vrlo velikom brzinom. Međutim, brzina čak i najbržeg RAM-a znatno je manja od brzine bilo kojeg slabog procesora. Svaka radnja, bilo upisivanje informacija u njega ili čitanje s njega, oduzima puno vremena. Brzina RAM-a je desetke puta manja od brzine procesora.

Unatoč ovoj razlici u brzini obrade informacija, PC procesor ne miruje i ne čeka da RAM izda i primi podatke. Procesor uvijek radi i sve zahvaljujući prisutnosti predmemorije u njemu.

Predmemorija je posebna vrsta RAM-a. Procesor koristi predmemoriju za pohranu onih kopija informacija iz glavnog RAM-a računala kojima će se vjerojatno pristupiti u bliskoj budućnosti.

U suštini, predmemorija djeluje kao međuspremnik velike brzine memorije koji pohranjuje podatke koje procesor može trebati. Dakle, procesor prima potrebne podatke desetke puta brže nego kada ih čita iz RAM-a.

Glavna razlika između cache memorije i običnog međuspremnika je ugrađeni logičke funkcije. Međuspremnik pohranjuje nasumične podatke koji se obično obrađuju prema shemi "prvo primljeno, prvo izdano" ili "prvo primljeno, zadnje izdano". Predmemorija memorije sadrži podatke kojima će se vjerojatno pristupiti u bliskoj budućnosti. Stoga, zahvaljujući "pametnom cacheu", procesor može raditi punom brzinom i ne čekati da se podaci dohvate iz sporijeg RAM-a.

Osnovni tipovi i razine cache memorije L1 L2 L3

Cache memorija izrađena je u obliku čipova statične memorije s izravnim pristupom (SRAM), koji su instalirani na matičnoj ploči ili ugrađeni u procesor. U usporedbi s drugim vrstama memorije, statička memorija može raditi vrlo velikim brzinama.

Brzina predmemorije ovisi o veličini određenog čipa. Što je čip veći, to ju je teže postići velika brzina za njen rad. S obzirom ovu značajku, tijekom proizvodnje, predmemorija procesora se izrađuje u obliku nekoliko malih blokova koji se nazivaju razinama. Danas je najčešći sustav predmemorije s tri razine L1, L2, L3:

L1 cache memorija - najmanji po volumenu (samo nekoliko desetaka kilobajta), ali najbrži po brzini i najvažniji. Sadrži podatke koje procesor najčešće koristi i radi bez odgode. Obično je broj L1 memorijskih čipova jednak broju procesorskih jezgri, pri čemu svaka jezgra pristupa samo svom L1 čipu.

L2 cache memorija Inferioran je u brzini od L1 memorije, ali je superiorniji u volumenu koji se već mjeri u nekoliko stotina kilobajta. Namijenjen je za privremeno skladištenje važna informacija, čija je vjerojatnost pristupa niža od one informacija pohranjenih u L1 predmemoriju.

Predmemorija treće razine L3 - ima najveći volumen od tri razine (može doseći desetke megabajta), ali ima i najviše spora brzina, što je još uvijek znatno veće od brzine RAM-a. L3 cache memorija zajednička je za sve procesorske jezgre. Razina memorije L3 dizajnirana je za privremenu pohranu onih važnih podataka, čija je vjerojatnost pristupa nešto niža od one informacija pohranjenih u prve dvije razine L1, L2. Također osigurava da procesorske jezgre međusobno komuniciraju.

Neki modeli procesora dizajnirani su s dvije razine predmemorije, u kojoj L2 kombinira sve funkcije L2 i L3.

Kada je velika veličina predmemorije korisna.

Osjetit ćete značajan učinak velikog volumena predmemorije pri korištenju programa za arhiviranje, u 3D igrama, tijekom video obrade i kodiranja. U relativno "laganim" programima i aplikacijama razlika je praktički neprimjetna (uredski programi, igrači itd.).

Slučajno sam u rukama imao procesor i5 2400. A budući da imam 2600k, koji ima 8mb L3 cachea naspram 6mb za i5, htio sam ih usporediti u igrama i aplikacijama. Vrijeme je bilo ograničeno, pa neće biti puno testova. Ali da bih dodao još više informacija, igrao sam se s memorijom i simulirao tri situacije s i5 2400.

1. Config s najjeftinijim matična ploča na čipsetu s indeksom “H”, gdje nema mogućnosti overclockinga i frekvencija svih jezgri će biti 3200MHz. RAM će raditi na 1333MHz s vremenima od 9:9:9:27

2. Konfigurirajte s matičnom pločom na čipsetu s indeksima "P" i "Z", koji imaju mogućnost povećanja množitelja procesora s turbo boost podrškom za četiri boda. U mom slučaju, s procesorom i5 2400, množitelj s 32 može se povećati na 36, ​​čime se dobiva frekvencija od 3600MHz. Nakon što sam također overclockirao bus, dobio sam 3800MHz, što je 600MHz više nego u prvoj konfiguraciji. RAM će u ovom slučaju raditi na frekvenciji od 2252MHz s vremenima 9:9:9:27

3. Konfiguracija je potpuno ista kao i druga, ali s frekvencijom RAM-a od 1689MHz u vremenima 9:9:9:27

4. Konfiguracija s 2600k procesorom na 3,80 GHz, HT onemogućen i 2252 MHz RAM s vremenima 9:9:9:27.

Komponente testa:
Intel Core i7 2600K
Intel Core i5 2400
Matična ploča: ASUS P8Z77-V Deluxe
RAM: 16 GB DDR3 CRUCIAL Ballistix Elite
Video kartica: GTX 780 Ti 1279|7800 Driveri: 381.89
Napajanje: APS-850C 850W
operacijski sustav: Windows 8.1 x64 čist (35 procesa nakon pokretanja sustava)

i5 2400 3200MHz DDR3 1333MHz

i5 2400 3800MHz DDR3 1689MHz

i5 2400 3800MHz DDR3 2252MHz

i7 2600k 3800MHz 2252MHz

NVIDIA GTX 780 Ti 1279|7800

Rezultati testa:

3DMark 2013 CPU rezultat




Dobitak od predmemorije i RAM-a je minimalan.

_________________________________________________________________________________________________

Cinebench R15




U Cinebenchu ​​R15 vidimo sličnu sliku.

_________________________________________________________________________________________________

LinX 0.6.5 Opseg zadatka: 25000




U LinX-u, također, samo overclocking procesora daje povećanje

_________________________________________________________________________________________________

x264 FHD Benchmark




I opet je porast na razini greške.

_________________________________________________________________________________________________

Winrar v4.20



I na kraju dobivamo povećanje iz predmemorije od oko 6% i iz memorije od oko 15%

_________________________________________________________________________________________________

Battlefield 1 za jednog igrača


Dopuštenje: 1280x720
Skala razlučivosti: 100%
Kvaliteta teksture: dno. / prosj. / visoko / ultra
Filtriranje teksture: dno. / prosj. / visoko / ultra
Kvaliteta osvjetljenja: dno. / prosj. / visoko / ultra
Kvaliteta efekta: dno. / prosj. / visoko / ultra
Kvaliteta naknadne obrade: dno. / prosj. / visoko / ultra
Kvaliteta mreže: dno. / prosj. / visoko / ultra
Kvaliteta pejzaža: dno. / prosj. / visoko / ultra
Kvaliteta trave: dno. / prosj. / visoko / ultra
Kvaliteta anti-aliasinga: Ne/ FXAA (srednji) / FXAA (visoki) / TAA
Volumetrijsko svjetlo: ne /SSAO/ HBAO


Postoji blagi porast u odnosu na L3 predmemoriju.

_________________________________________________________________________________________________

Crysis 3 Dobrodošli u džunglu


Dopuštenje: 1280x720
Izglađivanje: isključeno
Rezolucija teksture: nizak / prosjek / visoko / Maks.
Učinci: nizak / prosjek / visoko / Maks.
Objekt: nizak / prosjek / visoko / Maks.
Čestice: nizak / prosjek / visoko / Maks.
Naknadna obrada: nizak / prosjek / visoko / Maks.
Sjenčanje: nizak / prosjek / visoko / Maks.
Sjene: nizak / prosjek / visoko / Maks.
Voda: nizak / prosjek / visoko / Maks.
Anizotropni filter: 1x / 2x / 4x / 8x / 16x
Razina zamućenja: isključeno
Odsjaj: Da/ br


Jedna od CPU intenzivnijih scena u igri. Povećanje ovisi samo o frekvenciji procesora. Opterećenje 780Ti u ovoj sceni čak ni na i7 nije premašilo 50%

_________________________________________________________________________________________________

veličanstven Auto za krađu V Ugrađeni benchmark (posljednja scena)


Dopuštenje: 1280x720
DirectX verzija: 11
FXAA Anti-Aliasing: isključeno/ uključeno
MSAA Antialiasing: isključeno/ x2 / x4 / x8
Stanovništvo grada: max
Tip populacije: max
Ljestvica fokusa: max
Kvaliteta teksture: standardno / visoko / vrlo visoko
Kvaliteta shadera: standardno / visoko / vrlo visoko
Kvaliteta sjene: standardno / visoko / vrlo visoko
Kvaliteta refleksije: najviši stupanj
MSAA za razmišljanje: isključeno/ x2 / x4 / x8
Kvaliteta vode: standardno / visoko / vrlo visoko
Kvaliteta čestica: standardno / visoko / vrlo visoko
Kvaliteta trave: standardno / visoko / vrlo visoko / najviši stupanj
Meke sjene: oštro / meko / mekše / maks. meko / AMD CHS / NVIDIA PCSS
Postavljanje specijalnih efekata: standardno / visoko / vrlo visoko / najviši stupanj
Razina zamućenja kretanja: min
Efekt dubine polja: isključeno/ uključeno
Anizotropno filtriranje: x16
AO sjenčanje: isključeno / standardno / visoka
Teselacija: isključeno / standardno / visoko / vrlo visoko

Dodatne postavke:
Duge sjene: isključeno / na
Sjene visoke rezolucije: isključeno / na
Učitavanje detaljnijih tekstura tijekom leta: isključeno / na
Povećanje udaljenosti utovara za detaljnije objekte: max
Duljina sjene: max


Ova igra definitivno ima povećanje memorije i predmemorije. Vrlo dobro povećanje kod i5 2400 3,80 GHz u odnosu na standardnih 3,20 GHz.

_________________________________________________________________________________________________

Mass Effect Andromeda


Dopuštenje: 1280x720
Izglađivanje: isključeno
Žitarica: isključeno / na
Kromatske aberacije: isključeno / na
Kvaliteta teksture: ultra
Difuzno sjenčanje: isključeno /SSAO/HBAO/ puni HBAO
Kvaliteta naknadne obrade: nisko / srednje / visoko / ultra
Kvaliteta teksture: nisko / srednje / visoko / ultra
Kvaliteta osvjetljenja: nisko / srednje / visoko / ultra
Kvaliteta sjene: nisko / srednje / visoko / ultra
Kvaliteta efekta: nisko / srednje / visoko / ultra
Kvaliteta modela: nisko / srednje / visoko / ultra
Kvaliteta shadera: nizak/ visoka
Kvaliteta pejzaža: nisko / srednje / visoko / ultra
Kvaliteta biljke: nisko / srednje / visoko / ultra


U ovoj sceni niti jedan nije u potpunosti otvorio 780Ti.
_________________________________________________________________________________________________

Svijet tenkova 0.9.18
Karta: Prijelaz

Izglađivanje: otvoren/ uključeno
Grafička umjetnost: standard / poboljšana
Kvaliteta teksture: nisko / srednje / visoko / maksimum
Kvaliteta osvjetljenja: maksimum
Kvaliteta sjene: isključeno/srednje/visoko/ maksimum
Trava u snajperskom načinu rada: isključeno / na
Ekstra kvaliteta učinci: isključeno / nisko / srednje / visoko / maksimum
Dodatni efekti u snajperskom modu: visoka
Količina vegetacije: isključeno / nisko / srednje / visoko / maksimum
Naknadna obrada: isključeno / nisko / srednje / visoko / maksimum
Efekti ispod pjesama: isključeno / na
Kvaliteta pejzaža: minimalno / nisko / srednje / visoko / maksimum
Kvaliteta vode: nisko / srednje / visoko / maksimum
Kvaliteta naljepnica: isključeno / nisko / srednje / visoko / maksimum
Detalji objekta: nisko / srednje / visoko / maksimum
Detalji stabla: nisko / srednje / visoko / maksimum
Udaljenost generiranja: nisko / srednje / visoko / maksimum
Kvaliteta zamućenja pokreta: isključeno / nisko / srednje / visoka
D Dinamička promjena kvalitete efekta: isključeno / na
Tragovi gusjenica: isključeno / na

Zaključak: Neki recenzenti s Youtubea jednostavno onesposobe HT, naprave od I7 “umjetni” i5, ali s velikim cacheom...i kažu da nema razlike. Ali ipak, u nekim igrama dodatna predmemorija daje povećanje.

I općenito, overclocking zaliha i5 2400 daje vrlo snažan porast, ali tada ćete morati potrošiti novac na matičnu ploču.

Dobar dan svima. Danas ćemo vam pokušati objasniti pojam predmemorije. Predmemorija procesora je ultrabrzo polje za obradu podataka, čija brzina premašuje standardni RAM za 16-17 puta, ako govorimo o DDR4.

Iz ovog članka ćete naučiti:

To je volumen predmemorije koji omogućuje CPU-u da radi na maksimalnim brzinama bez čekanja da RAM obradi bilo kakve podatke i pošalje rezultate dovršenih izračuna u čip na daljnju obradu. Sličan princip može se vidjeti u HDD-u, samo što koristi međuspremnik od 8–128 MB. Druga stvar je što su brzine puno manje, ali proces rada je sličan.

Što je predmemorija procesora?

Kako općenito funkcionira proces izračuna? Svi podaci pohranjuju se u RAM memoriju koja je namijenjena privremenom čuvanju važnih korisničkih i sistemskih informacija. Procesor za sebe odabire određeni broj zadataka koji se guraju u ultrabrzi blok koji se naziva predmemorija i počinje se baviti svojim izravnim odgovornostima.

Rezultati izračuna ponovno se šalju u RAM, ali u puno manjim količinama (umjesto tisuću izlaznih vrijednosti, dobivamo puno manje), a novi niz se uzima na obradu. I tako dok se posao ne završi.

Brzina rada određena je učinkovitošću RAM-a. Ali niti jedan moderni DDR4 modul, uključujući rješenja za overclocking s frekvencijama ispod 4000 MHz, ne može se približiti mogućnostima najzakržljalijih procesora sa svojom "sporom" predmemorijom.

To je zato što brzina CPU-a premašuje performanse RAM-a u prosjeku 15 puta, ili čak i više. I ne gledajte samo frekvencijske parametre; postoji mnogo razlika osim njih.
U teoriji, ispada da su čak i super-moćni Intel Xeon i AMD Epyc prisiljeni mirovati, ali zapravo oba poslužiteljska čipa rade na granici svojih mogućnosti. A sve zato što prikupljaju potrebnu količinu podataka prema veličini predmemorije (do 60 MB ili više) i trenutno obrađuju podatke. RAM služi kao neka vrsta skladišta iz kojeg se izvlače nizovi za izračune. Računalna učinkovitost računala se povećava i svi su sretni.

Kratak izlet u povijest

Prvi spomeni cache memorije datiraju iz kasnih 80-ih. Do tog vremena brzina procesora i memorije bile su približno iste. Brzi razvoj čipova zahtijevao je osmišljavanje neke vrste "štake" za povećanje razine performansi RAM-a, ali korištenje ultrabrzih čipova bilo je vrlo skupo, pa su se odlučili zadovoljiti ekonomičnijom opcijom - uvođenjem visoke ubrzati memorijski niz u CPU.

Modul cache memorije prvi se put pojavio u Intelu 80386. U to su vrijeme DRAM radne latencije fluktuirale oko 120 nanosekundi, dok je moderniji SRAM modul smanjio latenciju na impresivnih 10 nanosekundi za to vrijeme. Približna slika jasnije se pokazuje u sukobu između HDD-a i SSD-a.

U početku je cache memorija bila zalemljena izravno na matične ploče, zbog razine tehničkog procesa u to vrijeme. Počevši od Intel 80486, 8 KB memorije bilo je ugrađeno izravno u procesorsku matricu, dodatno povećavajući performanse i smanjujući matricu.

Ova tehnologija rasporeda ostala je relevantna samo do izlaska Pentiuma MMX, nakon čega je SRAM memorija zamijenjena naprednijim SDRAM-om.
I procesori su postali puno manji, pa stoga nema potrebe za vanjskim sklopovima.

Razine predmemorije

Na označavanju modernih CPU-a, osim i , možete pronaći koncept veličine predmemorije razine 1, 2 i 3. Kako se određuje i na što utječe? Shvatimo to jednostavnim riječima.

  • Predmemorija razine 1 (L1) najvažniji je i najbrži čip u CPU arhitekturi. Jedan procesor može primiti broj modula jednak broju jezgri. Važno je napomenuti da čip može pohraniti u memoriju najpopularnije i najvažnije podatke samo iz svoje jezgre. Veličina niza često je ograničena na 32–64 KB.
  • Predmemorija druge razine (L2) - pad brzine kompenzira se povećanjem veličine međuspremnika, koja doseže 256 ili čak 512 KB. Princip rada je isti kao kod L1, ali je frekvencija zahtjeva za memoriju manja, zbog pohranjivanja podataka nižeg prioriteta u njemu.
  • Treća razina predmemorije (L3) je najsporiji i najobimniji odjeljak među svima njima. I dalje je ovaj niz puno brži od RAM-a. Veličina može doseći 20 pa čak i 60 MB kada je riječ o čipovima poslužitelja. Prednosti niza su ogromne: to je ključna karika u razmjeni podataka između svih jezgri sustava. Bez L3, svi elementi čipa bili bi raspršeni.

U prodaji možete pronaći strukture memorije s dvije i tri razine. Koji je bolji? Ako procesor koristite samo za uredski programi i casual igre, nećete osjetiti nikakvu razliku. Ako je sustav sastavljen s pogledom na složene 3D igre, arhiviranje, renderiranje i rad s grafikom, tada će se povećanje u nekim slučajevima kretati od 5 do 10%.
Predmemorija treće razine opravdana je samo ako namjeravate redovito raditi s aplikacijama s više niti koje zahtijevaju redovite složene izračune. Iz tog razloga, modeli poslužitelja često koriste velike L3 predmemorije. Iako postoje slučajevi kada to nije dovoljno, pa morate dodatno instalirati takozvane L4 module, koji izgledaju kao zasebni čip spojen na matičnu ploču.

Kako mogu saznati broj razina i veličinu predmemorije na svom procesoru?

Počnimo s činjenicom da se to može učiniti na 3 načina:

  • kroz naredbeni redak(samo L2 i L3 predmemorija);
  • pretraživanjem specifikacija na internetu;
  • koristeći pomoćne programe trećih strana.

Ako uzmemo kao osnovu činjenicu da je za većinu procesora L1 32 KB, a L2 i L3 mogu jako varirati, zadnje 2 vrijednosti su ono što nam treba. Da biste ih potražili, otvorite naredbeni redak kroz "Start" (unesite vrijednost "cmd" kroz traku za pretraživanje).

Sustav će pokazati sumnjivo visoku vrijednost za L2. Trebate ga podijeliti s brojem jezgri procesora i saznati konačni rezultat.

Ako planirate tražiti podatke na mreži, prvo saznajte točan naziv CPU-a. Kliknite desnom tipkom miša na ikonu "Moje računalo" i odaberite "Svojstva". U stupcu "Sustav" bit će stavka "Procesor", koja nam zapravo treba. Prepišete njegovo ime u Google ili Yandex i pogledate značenje na stranicama. Za pouzdane informacije bolje je odabrati službene portale proizvođača (Intel ili AMD).
Treća metoda također ne uzrokuje probleme, ali zahtijeva instalaciju dodatnog softvera poput GPU‑Z, AIDA64 i drugih uslužnih programa za proučavanje specifikacija kamena. Opcija za one koji vole overclocking i petljanje s detaljima.

Rezultati

Sada razumijete što je predmemorija, o čemu ovisi njezina veličina i za koje se svrhe koristi ultra-brzi podatkovni niz. Na ovaj trenutak Najzanimljivija rješenja na tržištu po pitanju velike cache memorije su AMD Ryzen 5 i 7 uređaji sa svojih 16 MB L3.

U sljedećim člancima obradit ćemo teme kao što su procesori, prednosti čipova i više. i ostanite s nama. Do sljedećeg puta, bok.

Koliko je L3 predmemorija važna za AMD procesore?

Doista, ima smisla višejezgrene procesore opremiti namjenskom memorijom koju će dijeliti sve dostupne jezgre. U ovoj ulozi, brza predmemorija treće razine (L3) može značajno ubrzati pristup podacima koji se najčešće traže. Tada jezgre, ako je moguće, neće morati pristupati sporoj glavnoj memoriji (RAM).

Barem u teoriji. AMD je nedavno najavio Athlon II X4 procesor, koji je model Phenom II X4 bez L3 cachea, nagovještavajući da nije toliko potreban. Odlučili smo izravno usporediti dva procesora (sa i bez L3 predmemorije) kako bismo testirali kako predmemorija utječe na performanse.

Kako radi predmemorija?

Prije nego što zaronimo u testove, važno je razumjeti neke osnove. Princip rada predmemorije je prilično jednostavan. Predmemorija sprema podatke u međuspremnik što je moguće bliže procesnim jezgrama procesora kako bi se zahtjevi procesora smanjili na udaljeniju i sporiju memoriju. Na modernim stolnim platformama hijerarhija predmemorije uključuje čak tri razine koje prethode pristupu RAM-u. Štoviše, predmemorije druge i, posebno, treće razine služe ne samo za međuspremnik podataka. Njihova je svrha spriječiti preopterećenje procesorske sabirnice kada jezgre trebaju razmjenjivati ​​informacije.

Pogoci i promašaji

Učinkovitost arhitektura predmemorije mjeri se stopom pogodaka. Zahtjevi za podacima koje predmemorija može zadovoljiti smatraju se pogocima. Ako data predmemorija ne sadrži potrebne podatke, zahtjev se prosljeđuje dalje duž memorijskog cjevovoda i broji se promašaj. Naravno, promašaji dovode do više vremena potrebnog za dobivanje informacija. Kao rezultat toga, u računalnim cjevovodima pojavljuju se "mjehurići" (mirovanja) i kašnjenja. Hitovi, naprotiv, omogućuju vam da zadržite maksimalnu izvedbu.

Ulaz u predmemoriju, ekskluzivnost, koherencija

Pravila zamjene određuju kako se oslobađa prostor u predmemoriji za nove unose. Budući da se podaci upisani u predmemoriju na kraju moraju pojaviti u glavnoj memoriji, sustavi to mogu činiti istovremeno s pisanjem u predmemoriju (pisanje kroz) ili mogu označiti područja podataka kao "prljava" (unazadno pisanje) i pisati u memorije. kada se izbaci iz predmemorije.

Podaci u nekoliko razina predmemorije mogu se pohraniti ekskluzivno, odnosno bez redundancije. Tada nećete pronaći iste podatkovne linije u dvije različite hijerarhije predmemorije. Ili predmemorije mogu raditi uključivo, to jest, niže razine predmemorije zajamčeno sadrže podatke prisutne u gornjim razinama predmemorije (bliže jezgri procesora). U AMD Phenom koristi se ekskluzivna L3 predmemorija, dok Intel slijedi strategiju uključive predmemorije. Protokoli koherentnosti osiguravaju cjelovitost i svježinu podataka u različitim jezgrama, razinama predmemorije, pa čak i procesorima.

Veličina predmemorije

Veća predmemorija može sadržavati više podataka, ali ima tendenciju povećanja latencije. Osim toga, velika predmemorija troši znatan broj procesorskih tranzistora, pa je važno pronaći ravnotežu između proračuna tranzistora, veličine matrice, potrošnje energije i performansi/latencije.

Asocijativnost

Unosi u RAM-u mogu se izravno preslikati u predmemoriju, to jest, postoji samo jedna pozicija predmemorije za kopiju podataka iz RAM-a, ili mogu biti n-smjerni asocijativni, to jest, postoji n mogućih lokacija u predmemorij gdje ovo podaci mogu biti pohranjeni. Viši stupnjevi asocijativnosti (do potpuno asocijativnih predmemorija) pružaju veću fleksibilnost predmemorije jer postojeće podatke u predmemoriji nije potrebno ponovno pisati. Drugim riječima, visok n-stupanj asocijativnosti jamči veću stopu pogodaka, ali također povećava latenciju jer je potrebno više vremena za provjeru svih tih asocijacija za pogodak. Obično je najviši stupanj povezanosti razuman za posljednju razinu predmemorije, budući da je tamo dostupan maksimalni kapacitet, a traženje podataka izvan ove predmemorije rezultirat će pristupom procesora sporom RAM-u.

Evo nekoliko primjera: Core i5 i i7 koriste 32 KB L1 predmemorije s 8-smjernom asocijativnošću za podatke i 32 KB L1 predmemorije s 4-smjernom asocijativnošću za upute. Razumljivo je da Intel želi da upute budu brže dostupne i da L1 predmemorija podataka ima maksimalnu stopu pogodaka. L2 predmemorija na Intelovim procesorima ima 8-smjernu asocijativnost, a Intel L3 predmemorija još je pametnija jer implementira 16-smjernu asocijativnost za maksimiziranje pogodaka.

Međutim, AMD slijedi drugačiju strategiju s Phenom II X4 procesorima, koji koriste dvosmjernu asocijativnu L1 predmemoriju za smanjenje latencije. Kako bi se nadoknadili mogući propusti, kapacitet predmemorije je udvostručen: 64 KB za podatke i 64 KB za upute. L2 predmemorija ima 8-smjernu asocijativnost, poput Intelovog dizajna, ali AMD-ova L3 predmemorija radi s 48-smjernom asocijativnošću. Ali odluka da se izabere jedna arhitektura predmemorije umjesto druge ne može se procijeniti bez razmatranja cijele CPU arhitekture. Sasvim je prirodno da rezultati testa imaju praktičan značaj, a cilj nam je bio upravo praktična provjera cijele ove složene višerazinske strukture predmemoriranja.