Processador

De Jose Castillo Aliaga
Ir a la navegación Ir a la búsqueda

Característiques

El criteri per a elegir un processador ha sigut, tradicionalment, la seua potència de càlcul. És a dir, la quantitat d'instruccions que pot fer en un temps determinat i la quantitat de dades que pot manipular. Actualment també es mira l'eficiència energètica. És molt més complicat que abans saber quin processador és millor. Ja no sols importa la freqüència de rellotge (no ha augmentat molt en 10 anys).

Anem a veure les característiques que permeten avaluar si un processador és adequat per a les nostres necessitats.

Velocitat

La placa base compta amb un rellotge de quars. Aquest material, al aplicar-li una corrent elèctrica, vibra a una freqüència determinada per el voltatge i la mida del quars. Transformant la vibració en senyals electròniques i aplicant uns divisors de freqüència es pot tindre un pols constant. Cada pols de rellotge és una senyal als circuits digitals per a realitzar un treball. Aquest pot ser des d'enviar unes dades per un cable fins a fer una suma binaria, entre molts altres. Els processadors utilitzen cada pols o cicle de rellotge per a realitzar instruccions o parts d'elles.

Si la freqüència és major, el processador és capaç de realitzar més instruccions per segon i és, per tant, més potent. No obstant, hi ha un limit. Els transistors utilitzats tenen unes latències i els processadors comencen a no ser estables a partir de certes freqüències. Amés, a més velocitat, més es calfa el circuit integrat i es pot cremar o consumeix massa electricitat. Fins a les freqüències actuals el consum i la fiabilitat dels processadors és acceptable, però és molt complicat augmentar més. En els següents apartats veurem cóm es pot millorar el rendiment sense augmentar la freqüència. No obstant, encara hui en dia, la força bruta de la freqüència de rellotge és clau per a determinar el rendiment d'un processador.

En els processadors, en especial els CISC, no es pot parlar d'una proporció directa entre freqüència i instruccions per segon. Això és perquè els processadors necessiten més d'un cicle per completar totes les fases d'una instrucció. Alguns, transformen les instruccions en micro instruccions més menudes i la majoria de processadors tenen instruccions que tarden més que altres. Actualment encara es complica més, perquè tenim la segmentació, les arquitectures multi escalars, l'execució especulativa o el multi nucli. Per intentar mesurar la potència real d'un processador es van inventar conceptes com els MIPS o FLOPS (milions d'instruccions per segon amb sencers o amb coma flotant) o els índex en benchmarks o en jocs coneguts i exigents.

Els processadors Intel Pentium 4 es pensava que arribarien als 10GHz. No va ser possible pel calor i el consum elèctric.

Els primers processadors tenien la mateixa freqüència que la del bus que els connectava amb la resta de dispositius. En el cas dels PC, fins al 486, la freqüència del processador era la mateixa. Però és molt complicat fer una placa base amb un bus tan ràpid com el processador. Per tant, es va optar per multiplicar la freqüència del processador en funció de la freqüència del bus. D'aquesta manera, mentre es fa una transferència pel bus, el processador pot anar fent instruccions o parts d'instruccions que no necessiten comunicació amb l'exterior de la CPU. Això millora les prestacions de la CPU, recolzant-se en memòries cau internes o busos amples (sovint també capaços de realitzar més d'una transferència per cicle de rellotge) per compensar la diferència de freqüència.

Normalment el multiplicador està bloquejat, però alguns processadors (no cal que siguen els més cars) permeten aquesta possibilitat a través de la BIOS. Si no es pot canviar el multiplicador d'aquesta manera, els overclockers opten per augmentar el voltatge amb el perill de cremar el processador. En qualsevol cas, el TDP augmenta i és necessària una millor refrigeració.

El concepte de multiplicador està quedant en desús o no se li dona la mateixa importància, ja que la comunicació del processador amb la resta de components ja no es realitza per el FSB, si no per interfícies de més alt nivell com QPI, DMI o Hypertransport. Amés, l'existència de memòries cau, doble o més transferència per cicle o dual channel cada vegada complica més considerar el multiplicador com una peça clau en el rendiment de l'ordinador.

Memòria cau

La memòria cau, o memòria cache (en francès i en anglès) és aquella memòria d'alta velocitat instal·lada en el mateix processador i en la qual s'emmagatzemen les dades que el microprocessador necessita utilitzar més freqüentment.

Aquesta memòria augmenta notòriament la velocitat de funcionament de l'ordinador. En el moment que el microprocessador necessita una dada, la va a buscar a aquesta memòria ultra-ràpida; en el cas que no la trobés, la buscaria a la memòria RAM; finalment, en cas que tampoc la trobés allà i el sistema operatiu suportés memòria virtual, accediria al disc dur. S'ha de tenir en compte que la memòria RAM és aproximadament unes 10 vegades més lenta, per la qual cosa el microprocessador podria quedar bloquejat si intentés extreure totes les dades directament de la RAM.

També existeix el concepte de nivells de memòria cau. Cadascun dels nivells posseïx una memòria cau. Així doncs, quan el processador necessita una dada, la buscarà al primer nivell de memòria cau L1, si no la trobara ací la buscarà en el següent nivell L2, i així successivament fins que la trobe. El primer nivell de memòria cau és menut però molt ràpid, el segon és més gran però més lent i així successivament. En l'actualitat el processadors comercials incorporen dos o tres nivells de memòria cau.

Quant un processador troba les dades que necessita en la memòria cau, s'anomena un cau hit. Si no el troba és un cau miss. Gràcies al principi de localitat, les dades necessaries solen estar prop de les que s'han utilitzat anteriorment. Per tant, si la memòria cau guardar un area suficientment gran de memòria principal, é smolt probable que augmenten els cau hits. De fet, ja en els primers processadors amb memòria cau, el cau hit ratio era d'aproximadament un 90%. Si tenim cau L2, hi ha un hit ratio del 90% sobre el 10% restant anterior, per tant, un 99% de hit ratio en total.

Al principi, la L2 estava en la placa base i anava a la velocitat de la placa, que és més que la de la RAM, però molt menys que la del processador. A partir del Pentium, Intel la va incloure dins del microprocessador i a la seua velocitat. Això era molt car i van decidir fer els Pentium II amb la L2 en xips per separat i d'altres fabricant però connectats al processador i amb la velocitat de la meitat que el nucli. Per això els processadors amb Slot. A partir del Celeron, tots tenen la L2 al microprocessador i a la mateixa velocitat que la L1

Els processadors actuals que tenen més d'un nucli, poden tindre una cau per nucli o compartida. Per exemple, el AMD Athlon X4 té dos mòduls amb dos 'nuclis' cadascun. Cada nucli té 128KB de cau L1 (64KB per a dades i 64KB per a instruccions) Fins a 1MB de L2 per nucli a la mateixa velocitat que el processador i no té cau L3. El processador Intel Core i7-4790T té 8MB de cau L3 i 64KB L1, 256KB L2 per nucli.

La memòria cau està gestionada per a tindre la part de la memòria principal que es demanarà en el futur. Seleccionar eixa part pot ser complicat, per tant, també es necessita una certa inteligència gestionant-la.

Si tenim en compte que la L1 té un 90% de hit ratio, el 90% del temps el sistema va a la velocitat del processador. El 9% del temps s'alenteix per traure les dades de la L2 i un 1% de la RAM. Si millorem molt la velocitat de la RAM, fins el doble, sols estem millorant eixe 1% a costa de molt més consum elèctric. Per tant, interessa millorar la L2 per millorar el 9% o afegir una L3.

A banda dels nivells de cau, aquesta pot ser en el nivell 1 de instruccions i de dades per separat translation lookaside buffers (TLBs). Els TLB són una cau de les traduccions de direccions de memòria lògica a física i sol tindre una o més per nucli.

Ací tenim una taula amb les latències aproximades:

L1d L2 L3 Memòria principal
Cicles 3-4 10-12 30-70 100-150

La cau funciona pel principi de Localitat temporal (les dades utilitzades recentment són les més probables de ser necessitades després) i espacial (Les dades que van a continuació de les sol·licitades solen ser les següents en ser demanades)

Bus de dades i direccions

Segons l'arquitectura Vonn Neuman, hi ha un bus únic per a comunicar la CPU amb la memòria principal i l'entrada eixida. La manera d'accedir a la memòria i a l'E/S pel mateix bus és mapejant els perifèrics en memòria. Encara es manté aquesta idea, però amb variacions per augmentar el rendiment.

En el cas dels microcomputadors, al principi el Bus era una extensió del bus de la CPU i anava a la mateixa velocitat. Este és el cas del bus ISA per a processadors com el 80286 que anava a 6 o 8MHz. No obstant, un bus extern controlat pel processador no permet millorar la seua velocitat i consumeix part de la energia per al processador. Per tant es va optar per diferenciar el bus del sistema per a connectar amb la RAM i els busos d'expansió per als perifèrics. Per a controlar eixos busos es va crear el xipset. El xipset, durant molt de temps, ha tingut dos parts diferenciades: Northbridge per a connectar el processador amb la RAM i la gràfica i el Southbridge per a connectar amb els dispositius lents com el disc dur, rellotge, PCI...

En l'actualitat, alguns busos no estan sotmesos a la velocitat del rellotge i tenen connexions punt a punt amb capes i protocols de manera anàloga a les xarxes i amb connexions serie. Això permet reduir el nombre de connexions i augmentar la velocitat. Per exemple, el PCI-E o Hypertransport.

El bus està compost per:

  • Bus de direccions: Permet seleccionar la direcció de la paraula a llegir o escriure. L'amplada d'aquest bus afecta a la mida màxima de la memòria.
  • Bus de dades: Per on van les dades fins o des del processador. En els primers processadors era menys ample que la mida de la paraula i es necessitaven més d'una transferència per portar una paraula. Actualment solen ser més amples que una paraula per poder transportar més d'una en cada transferència.
  • Bus de control: Goberna el funcionament del bus indicant si és de lectura o escriptura i el dispositiu la que va dirigit.
Processadors Ample del bus de dades Ample dels registres
8088 8 16
8086 i 286 16 16
386SX 16 32
386DX 486 586 32 32
Intel i AMD x86 amb FSB 64 32
AMD x86 Hypertransport 16 32
AMD x86-64 Hypertransport 16 64
Intel x86-64 FSB 64 64
Intel x86-64 QPI 20 64
Intel x86-64 DMI 4 64

En aquesta taula poden observar dos coses:

  • Que l'amplària del bus no està relacionada amb l'amplària dels registres.
  • Que En els nous busos en sèrie, no són necessaris tants cables per enviar a més velocitat.

Respecte al bus de direccions, es refereix al conjunt de cables que componen les direccions que van a la memòria. Això afecta a la capacitat de direccionament de la memòria. Tampoc és necessari que siga la mateixa que l'ample dels registres.

Processadors Bus de direccions (bits) Memòria direccionable
8088 8086 20 1KB
286, 386SX 24 16KB
386DX, 486, Pentium, K6, Athlon 32 4GB
Pentium w/PAE 36 64GB
Intel i AMD x86-64 40 1TB

Front Side Bus

El front-side bus, també conegut per la seva acrònim FSB (del anglès literalment "bus de la part frontal"), és el tipus de bus usat com a bus principal en alguns dels microprocessador antics de Intel per comunicar-se amb el xipset. Aquest bus inclou senyals de dades, adreces i control, així com senyals de rellotge que sincronitzen el seu funcionament.

La freqüència de treball del microprocessador s'obté com a resultat de multiplicar la freqüència de rellotge del FSB (a MHz, no en MT/s) per un factor multiplicador. Aquest factor multiplicador, així com la freqüència de rellotge del FSB poden alterar-se a través de la configuració de la placa mare, generalment a través de la BIOS, permetent així el overclocking. Per exemple, una CPU de 1.000 MHz podria funcionar amb una freqüència de rellotge de 133 MHz i un factor multiplicador de 7,5.

Amés, es pot fer 2 (Double data transfer o DDR) o 4 (Quad data transfer) transferències per cicle. Si tenim un FSB a 100MHz i DDR es pot calcular que va a 200MT/s

L'amplada de banda de l'FSB depèn de la seva mida de paraula (si és de 16, 32 o 64 bits), la freqüència de rellotge mesura megahertzs i el nombre de transferències que realitza per cicle de rellotge. Per exemple, un FSB de 32 bits d'ample (4 bytes), funcionant a 100 MHz i que realitzi 4 transferències per cada cicle, ofereix un màxim teòric de 1.600 megabytes per segon.

(Ample de paraula)            (Freq)      (Transf x cicle)             
           4                    x          100    x          4                  = 1600 MB/s

Algunes relacions entre freqüència i ample de banda amb paraules de 8 Bytes:

Names Frequency Transfer Rate Theoretical Bandwidth
DDR-200, PC-1600 100 MHz 200 MT/s 1.6 GB/s
DDR2-800, PC2-6400 400 MHz 800 MT/s 6.4 GB/s
DDR3-1600, PC3-12800 800 MHz 1600 MT/s 12.8 GB/s

AMD va substituir el FSB per Hypertranport i Intel, més tard, per QPI o DMI.

Back Side Bus

El Back Side Bus (BSB, literalment "bus del darrere", en contraposició al frontal o FSB) es refereix a la connexió entre un microprocessador i la seva memòria memòria cau externa , en particular i comunament la de segon nivell o L2. Atès que el concepte de BSB complementa al de FSB, els ordinadors moderns utilitzen una "arquitectura de bus dual" o, en la nomenclatura d'Intel, Dual Independent Bus (DIB).

Front al bus unificat dels primers PCs , el BSB presenta uns avantatges:

  • És dedicat, sols comunica la CPU amb la cau L2. (Dins del mateix encapsulat des del Pentium II)
  • Com que el Hit ratio de la L2 és molt alt, allibera el FSB.
  • Està integrat en el mateix xip. Per tant pot operar a velocitats molt altes.

En els Pentium II tenia la mitat de la velocitat del processador. El últims Pentium III ja incorporaven la L2 a la mateixa freqüència que el processador. Els AMD de la època també funcionaven a una fracció de la freüència de rellotge (1/2, 2/5 o 1/3). Des de finals de 1999 en el cas de Intel o principis del 2000 en el cas de AMD, tots els processadors tenen L2 a la mateixa freqüència que el processador.

HyperTransport

HyperTransport (HT), també conegut com a Lightning Data Transport (LDT) és una tecnologia de comunicacions bidireccional, que funciona tant en sèrie com en paral·lel, i que ofereix un gran amplada de banda en connexions punt a punt de baixa latència. Es va publicar el 2 d'abril de 2001. Aquesta tecnologia s'aplica en la comunicació entre xips d'un circuit integrat oferint un enllaç (o bus) avançat d'alta velocitat i alt acompliment; és una connexió universal que està dissenyada per a reduir el nombre de busos dintre d'un sistema, subministrant un enllaç d'alt rendiment a les aplicacions incorporades i facilitant sistemes de multiprocessament altament escalables.

És utilitzat per moltes empreses en microprocessadors i xipsets. En el cas del processadors per a PC, és utilitzat per AMD des de 2003 amb el Athlon 64.

La idea d'aquests busos és funcionar de manera similar al funcionament de les xarxes. Està basat en paquets de 32 bits. El primer paquet d'una transferència és sempre de comandament. Si conté una direcció, els últims 8 bits enllacen a la següent paraula i formen una direcció de 40 bits. (També es poden formar direccions de 64 bits) La resta de paquets tenen la informació útil. La transferència sempre és un múltiple de 32 bits.

Les connexions negocien la velocitat de transferència. La velocitat màxima a 32 bits i dos busos té 20,8GB/s per bus i un total de 41,6GB/s en les dos direccions.

Hi ha varies versions de Hypertransport, 1.x, 2.0, 3.0 i 3.1. Aquesta pot anar de 200Mhz a 3,2GHz. Suporta tecnología DDR anant a 5200MT/s si funciona a 2,6GHz o a 6400MT/s si funciona a 3,2GHz.

Permet reduir el consum elèctric quant la CPU no demana activitat i permet controlar el consum elèctric dels perifèrics com els discos.

AMD utilitza HT per a comunicar varis processadors entre si amb l'arquitectura NUMA.

Les CPU AMD FX i Athlon II que no tenen gràfica integrada, amb socket AM3+ suporten HT 3.1 a 3,2GHz.

El socket AM4 i TR4 ha optat per connectar-se al southbridge per PCI-E x4

Intel QuickPath Interconnect

És la connexió punt a punt de Intel feta per a competir amb HyperTransport de AMD. Va eixir en 2008 per als processadors Intel Core i7.

QPI forma part de la QuickPath arquitecture de Intel i requereix que el processador tinga un controlador de memòria integrat. En màquines multiprocessadors utilitzen l'arquitectura NUMA.

QPI té velocitats de 4 a 6 GT/s per direcció i l'ample de banda va de 12 a 16GB/s en cada direcció o 24 a 32GB/s per connexió.

Encara que alguns processadors Core i7 de gamma alta exposen QPI, la majoria del processadors d'escriptori o mòbils (per exemple, LGA 1156 Core i3, Core i5 i altres processadors Core i7 de la família Lynnfield / Clarksfield) no exposin QPI externament, ja que aquests processadors no tenen la intenció de participar en sistemes multi-socket. No obstant això, QPI s'utilitza internament en aquests xips per comunicar-se amb el "uncore" (L'antic northbridge però dins de l'encapsulat de la CPU), que forma part del xip que conté els controladors de memòria, del costat de la CPU i GPU PCI Express, si està present; Aquests es comuniquen externament a través de les interfícies més lentes DMI i PCI Express, perquè les funcions del Northbridge tradicional són realment integrades en aquests processadors, començant amb Lynnfield, Clarksfield, Clarkdale i Arrandale; per tant, no hi ha necessitat d'incórrer en les despeses de l'exposició de la (antiga) d'interfície de bus frontal a través del sòcol del processador.

DMI

Direct Media Interface (DMI) és el vincle entre el Northbridge i Southbridge en una placa base de l'ordinador. Va ser utilitzat per primera vegada entre els xipsets 9xx i el ICH6, llançat en 2004.

En els processadors Intel actuals que tenen el northbridge integrat, DMI i PCI-E són els busos de comunicació del processador amb els perifèrics.

PCI-E

És un sistema de comunicació en serie utilitzat en els PC per comunicar el processador o el Northbridge amb targetes d'expansió.

PCI-E està estructurat com a carrils serie full-duplex que poden anar fins a 1GB/s en el PCI-E 3.0. Les ranures de la placa base tenen 1, 4, 8 o 16 carrils per a les targetes. En les targetes x16 (normalment les gràfiques) podem tindre 16 * 1GB/s = 16GB/s en cada direcció o 32GB/s en les dos direccions.

Va ser pensat per reemplaçar tots els altres busos del processador. No obstant, encara no és tan ràpid com el QPI o Hypertransport i no pot ser utilitzat per a la RAM.

Els processadors actuals que tenen integrat el PCI-E tenen un màxim de carrils. Per exemple, el Intel Core i5-4690S té PCI-E 3.0 i un màxim de 16 lanes, podent fer configuracions en la placa de: 1x16 (Una targeta gràfica), 2x8 (Dos gràfiques a x8 o una gràfica i un altra targeta d'expansió ràpida com pot ser un SSD), 1x8/2x4 (Una gràfica x8 i dos targetes d'expansió no tan ràpides com poden ser les targetes de xarxa).

Altres tecnologies

Els processadors milloren constantment la velocitat, ample de paraula o mida de la memòria cau, per exemple. En general és la manera més directa de millorar el rendiment, però hi ha "trucs" alternatius per a millorar el rendiment del processador.

Instruccions Multimèdia

Amb el Pentium MMX es va inaugurar la època en la que els processadors de PC s'optimitzaven per a activitats multimèdia.

MMX és un repertori d'instruccions SIMD (una instrucció, múltiples dades) dissenyat per Intel per a millorar els cálculs en coma flotant i altres necessaris en la compressió i descompressió multimèdia o el renderitzat 3D.

AMD, el competidor d'Intel, implementa el repertori d'instruccions en punt flotant 3DNow!, per combatre MMX. Intel dos anys més tard, implementa l'extensió matemàtica SSE per treballar en punt flotant.

Més endavant van apareixer SSE, SSE2, SSE3, SSE4, AVX2, suportats per Intel i AMD.

Segmentació

Les instruccions tenen diferents fases. La segmentació o pipelining permet anar fent al mateix temps diferents fases de varies instruccions a la vegada. Amb aquesta tecnologia es passa de varis cicles per instrucció a varies instruccions per cicle (IPC).

Si les instruccions tenen interdependència no es pot aprofitar aquest avantatge. Si les instruccions formen part de bucles o hi ha condicions, es té que fer una execució especulativa, de manera que decideix una branca de les possibles i si falla ha de tornar enrere. La predicció de branques és complicada i va millorant en els processadors nous.

Quantes més fases tinga el pipeline més es pot segmentar. Els Pentium 4 van arribar a 20 pasos i una millor predicció de branques, no obstant, era molt complex i es calfava molt. Els processadors actuals, com el i7 tenen al voltant de 14 a 19 fases

Lectura interessant: http://stackoverflow.com/questions/11227809/why-is-processing-a-sorted-array-faster-than-an-unsorted-array

Arquitectura Superescalar

Consisteix en duplicar algunes parts funcionals de la CPU, com la ALU, per a fer varies instruccions alhora. No és el mateix que la segmentació, però normalment van unides.

Execució Out-of-order

Com que algunes instruccions poden tindre dependències, una solució és reordenar-les de manera que es puguen fer de la manera més paral·lela possible. Per això es necessita un dataflow analysis.

HyperThreading

Gràcies a l'arquitectura superescalar, el processador simula tindre 2 nuclis en un sol nucli. El SO pot planificar en eixos dos nuclis i millora la multiprogramació i l'aprofitament del processador.

En l'actualitat, els core i3 i i7 el tenen per simular més nuclis.

TurboBoost

El TDP dels processadors está molt relacionat amb la freqüència. Un processador a 4GHz consumeix molt més que un a 3,2GHz. Però en ocasions, la única manera de aconseguir més velocitat és augmentar la freqüència. Alguns processadors Intel poden augmentar temporalment la velocitat d'un nucli o varis si ho consideren necessari sense calfar massa el processador.

La forma de funcionar del turboboost en els Intel Core fa que es puga augmentar la freqüència d'un nucli o varis i en funció de quants estiguen en turbo, la freqüència màxima d'aquest es modifica.

Per exemple, el i7- 8700K a 3.7 GHz de freqüència base té aquestes velocitats turbo en funció del nuclis actius:

Nuclis actius Velocitat Nomenclatura x*100MHz
1 4.7 10 (3.7GHz + 10*100MHz = 4.7GHz)
2 4.6 9
3 4.5 8
4 i 5 4.4 7 7
6 4.3 6

Així, es pot dir que té unes freqüències turbo 6/7/7/8/9/10. La freqüència base d'aquest és molt alta, per tant, el turbo no augmenta tant. Però en contrast, el i7-8700T que és de baix consum, té una freqüència base de 2.4GHz i uns turbos de 14/14/15/15/15/16 arribant a 4.0GHz. [1] El turboboost és molt més efectiu proporcionalment en processadors amb freqüències base baixes.

En el cas de AMD, es diu Turbo Core o simplement Turbo.

Tecnologia Multicore

Açò implica dos o més nuclis en el mateix encapsulat. Dona els avantatges de tindre més d'un processador a molt menys cost. Actualment tots els processadors x86-64 tenen més d'un nucli.

Tindre molts nuclis no millora les tasques amb un sol fil d'execució. Cal fer programes preparats per tindre varis fils d'execució per aprofitar totalment aquests processadors.

Coprocessador matemàtic

Els antics processadors necessitaven un xip extern per a fer les operacions en coma flotant. S'anomenava x87. A partir del 486DX ja estava integrat en el processador.

La unitat de coma flotant està per compatibilitat, però actualment se sol fer ús de les instruccions MMX/SSE que són més ràpides i precises que les del x87

Gestió de l'energia

Els processadors moderns poden canviar el voltatge o inclús la freqüència en funció de les necessitats per consumir menys. La decisió la pren el sistema operatiu amb l'anomenat Performance State o P-State. El processador acomoda el seu voltage o freqüència amb el DVFS (dynamic voltage and frequency scaling). En principi té uns P-State predefinits al fabricar-se. El major P-State és el que té més potència i consumix més. En els dispositius mòbils, és interessant no consumir quant no és necessari per no calfar-se o consumir la bateria. Quant és necessari canvia a un més potent. En Intel es diu Speed Step.

Amb els nous processadors Skylake, la sexta generació de Intel Core, ha cambiat a Speed Shift. Ara el SO pot cedir la decisió sobre la freqüència i el voltatge al processador. Windows 10 ja suporta aquesta tecnologia. Aquesta tecnologia és millor perquè el processador pot decidir per si mateix la millor freqüència en cada moment i li costa menys temps per canviar, ja que no ha d'executar instruccions com el SO. Quant està a tope de potència continua gastant més energia, però tarda menys en tornar a no gastar. Com Intel diu: 'Work fast, finish now'

Un altra cosa diferent és el C-State. Aquests són els estats quant está inactiu o amb el procés idle. Una CPU en estat idle no està fent res (res productiu), però està gastant cicle de rellotge i energia. Per evitar això, el processadors moderns incorporent diversos nivells de C-State. El estat C0 és el productiu. Aquest pot funcionar en varis P-State depenent si vol o no estalviar energia. Però quant acaba de fer el treball pasa a un altre C-State. Per exemple, els intel Core tenen varis C-State: C0 per a ser productiu, C1 o Halt on no fa res, però pot començar inmediatament a fer instruccions útils, C2 o Stop-Clock on es queda parat, por començar de nou, ja que manté la caché, però li costa més, C3 o Sleep on no manté la caché o C6 on s'apaga quasi completament.

http://www.hardwaresecrets.com/everything-you-need-to-know-about-the-cpu-c-states-power-saving-modes/

https://software.intel.com/en-us/articles/power-management-states-p-states-c-states-and-package-c-states

Altres consideracions

Quant es dissenya un processador actual es pot enfocar de dos maneres: tindre poc rendiment per nucli però molts nuclis o tindre pocs nuclis amb molt rendiment. El exemple del primer cas és el Xeon Phi 7290 amb 72 nuclis i sols 1,5GHz o algunes solucions amb ARM amb 64 nuclis. Però són casos extrems per a supercomputadors o altres servidors que necessiten molt de paral·lelisme. En el mon de l'escriptori poques vegades s'utilitzen més de 8 fils al 100%. Són més le vegades que es necessiten grans velocitats en un sol fil. Augmentar la freqüència, les tècniques per augmentar el IPC basades en la segmentació, arquitectura superescalar, i l'execució fora d'ordre són les tècniques més utilitzades en els processadors d'escriptori. Obtindre un bon rendiment global depen de tipus de programes que van a utilitzar-se. El més complicat és obtindre un bon rendiment per nucli. En el rendiment per nucli és on els Intel Core han anat superant als AMD Bulldozer i derivats al llarg de molt de temps. Sembla que la nova arquitectura Zen d'AMD ha tornat a un bon rendiment per nucli i amés amb més nuclis per el mateix preu.

TDP

La potència de disseny tèrmic (TDP), de vegades anomenat punt de disseny tèrmic, es refereix a la quantitat màxima de calor generada per la CPU, el que es requereix que el sistema de refrigeració en un ordinador per dissipar en l'operació típica. En lloc d'especificar veritable dissipació de potència de CPU, TDP serveix com a valor nominal per al disseny dels sistemes de refrigeració de la CPU.

El TDP no és típicament la major quantitat de calor que la CPU mai podria generar (potència màxima), sinó més aviat la màxima quantitat de calor que es generaria quan s'executa "les aplicacions reals." Això assegura que l'ordinador serà capaç de manejar essencialment totes les aplicacions sense excedir el seu envoltant tèrmica, o que requereix un sistema de refrigeració per a la potència màxima teòrica (que costaria més, però en favor d'espai lliure addicional per a la potència de processament).

El TDP pot ser variable en els processadors actuals, ja que poden desactivar parts del processadors per consumir menys si no ho necessiten.

Generalment, augmentar la freqüència de rellotge augmenta el TDP. La quantitat de transistors també afecta al TDP. Si els transistors són més menuts es poden ficar més sense augmentar el TDP.

Per les lleis de la termodinàmica, el calor que desprèn un microprocessador també implica que està consumint més energia elèctrica. En l'actualitat s'intenta que els processadors aprofiten millor la potència de les bateries i gasten menys llum. En portàtils i mòbils donen més autonomia i no són perillosos per el calor. En el cas dels servidors es poden estalviar molts diners amb processadors eficients.

Modes de funcionament

Els processadors x86 han evolucionat des de un PC amb maquinari molt limitat amb un sistema operatiu monousuari, mono-tasca i mono-procés a uns ordinadors amb els mateixos sistemes operatius que els ordinadors grans. Fins i tot, molts servidors no tenen una gran diferència respecte als PC. Els sistemes actuals són multiprocés, multitasca i multiusuari. El maquinari, per tant, ha passat de ser mínim i barat per a l'epoca a ser molt potent per suportar les necessitats - sobretot multimèdia - dels usuaris domèstics.

Els primers processadors per a PC no podien suportar protecció de memòria o planificació de processos. Els sistemes operatius necessiten uns registres, instruccions i unes interrupcions especials per a poder gestionar la multitasca. MS-DOS era un sistema operatiu que no necessitava molta potència de maquinari, però no oferia potència ni seguretat. Per tant, els processadors anteriors al 80286, no implementaven protecció de memòria, multitasca o nivell de privilegis, és el que s'anomena mode real. Més endavant han eixit altres modes, però en el cas dels PC, han conservat la retrocompatibilitat.

I, sobretot, els processadors han evolucionat en els bits dels registres de 16 a 32 i a 64.

Els modes de funcionament són:

  • Mode real: És el mode en que funcionen tots els processadors x86 al principi del seu arranc quant són resetejats. És l'únic mode dels processadors fins l'arribada del 80286. Les característiques són:
    • Instruccions i dades a 16 bits.
    • 20-bits de direccions de memòria segmentada que pot adreçar 1MB.
    • Accés il·limitat per al programari a totes les direccions de memòria, direccions de E/S i maquinari perifèric.
    • No proporciona protecció de memòria, multitasca o nivell d'execució.
    • Fins a l'actualitat (2014), tots els processadors x86, inclús els de 64 bits arranquen en mode real.
  • Mode protegit: El 80286 va ser el primer processador en implementar aquest mode. Les intencions de Intel eren que els sistemes operatius i tots els programes utilitzaren sempre el mode protegit. Però el programes fets per al mode real tenien que ser programats de nou. La solució del 286 era arrancar en mode real i passar fàcilment al mode protegit. Però per a passar al mode real de nou es necessitava un reset del processador. IBM va implementar en les plaques un sistema per a no fer un reset a tot l'ordinador, però encara era ineficient. Els sistemes operatius s'executen en mode real i cada vegada que es necessita el sistema operatiu per gestionar processos o memòria és necessari un canvi a mode real i de nou passar a mode protegit per al programes d'usuari. Com que en canvi és molt lent, la multiprogramació era molt difícil. Com que per a molts programadors, el mode real era suficient, van tardar massa en adoptar els beneficis del mode protegit dels 386 (Fins al Windows XP!). Les característiques principals del mode protegit són:
    • Té mecanismes per a que els sistemes operatius implementen la multitasca, protecció de memòria i paginació.
    • Quant un processador arranca, sempre és en mode real, després activa el bit PE Protection Enable en el registre de control.
    • En el 286 no va ser molt utilitzat perquè el sistema MS-DOS no el necessitava. Els sistemes Xenix o Minix no eren molt populars.
    • En el 386 es van solucionar molts del problemes del 286.
    • Té 32 bits de bus de direccions, que permet 4GB de memòria RAM.
    • El programes estan segmentats i inclou una taula descriptora de segments. Els segments estan paginats, originalment en pàgines de 4KB.
    • El mode protegit és l'usat en pràcticament tots els sistemes operatius moderns per a PC.
  • Mode virtual 8086: Per evitar problemes de retrocompatibilitat, el 80386 va incorporar amés del mode protegit el mode virtual 8086. Es tracta d'una virtualització de maquinari en la que simula el funcionament del mode real per a executar aplicacions antigues mentre està en mode protegit. Les aplicacions tenen 20 bits de direccionament, però sobre una memòria virtual paginada i protegida. Quant executaven una finestra de DOS dins del windows, aquesta s'executa en aquest mode.
  • Mode llarg: Els processadors x86_64 tenen aquest mode com el seu mode protegit per defecte i mantenen la compatibilitat amb el mode protegit de 32 bits o mode real a 16 bits com a submodes. Els programes poden detectar si estan en un processador de 32 o 64 bits.
    • El primer processador de 64 bits per a PC, el AMD Athlon 64, tenia 48 bits de direccionament virtual i 40 bits de direccionament físic (1TB).
    • L'arquitectura K10 de AMD té 48 bits de direccionament físic, (256TB), més adequat per a servidors. I el límit en un futur serà de 64 per a direccionament virtual i 52 per al físic.
    • Aporta nous registres i noves instruccions de 64 bits. Concretament 8 registres de proposit general GPR i 8 per a les extensions SIMD (MMX,SSE,SS3,SSE3)
  • Virtualització: Els processadors moderns ajuden a la virtualització creant processadors virtuals més eficients al estar assistits per maquinari i no tant per el programari de virtualització.
    • AMD-V és la primera aproximació de AMD. Va eixir en 2006 i està suportat per molts processadors de alta gama i alguns més modests. Si volem saber si suporta AMD-V, l'etiqueta en /proc/cpuinfo és svm.
    • Intel VT-x és la tecnologia de Intel, va eixir en 2005 en el Pentium 4 662 i 672. No tots els processadors el tenen i, si es va a virtualitzar, és important mirar en /proc/cpuinfo si està l'etiqueta vmx.
Arquitectura Mode SO Programari Memòria adreçable Operands Registres
Real Real 16 16 24 16 16
IA-32 Protegit 32 32 32 32 32/16
IA-32 Virtual 32 16 24 16 16
IA-32e (x86-64) 64 bits 64 64 64 32 64
IA-32e (x86-64) compatibilitat 64 32 32 32 32/16

Mètode de fabricació

La fabricació de circuits integrats és un procés complex i en el qual intervenen nombroses etapes. Cada fabricant de circuits integrats té les seves pròpies tècniques que guarden com a secret d'empresa, encara que les tècniques són semblants.

Els dispositius integrats poden ser tant analògics com digitals, encara que tots tenen com a base un material semiconductor, normalment el silici.

Els processadors es fabriquen amb una tècnica anomenada Fotolitografía en la que s'aplica una llum que imprimeix els circuits a una superfície fotosensible i es tracta amb productes químics. No és rentable fer un sol processador cada vegada, per tant, es fa un oblea de molts processadors i es talla. El resultat són molts circuits integrats iguals. Es comproven els xips, és possible que un xip no tinga la mateixa qualitat que un altre encara que funcione. Es marca, per tant, la velocitat màxima a la que pot arribar cada xip.

No és un procés determinista, es a dir, amb el mateix procés, pots tindre processadors més o menys ràpids. Però els que no ixen del tot bé no es descarten, si funcionen, es venen amb especificacions més modestes.

Exemple: El P4 2.0, 2.2, 2.53 són EXACTAMENT el mateix xip

Els transistors integrats cada vegada són més menuts.

   10 µm – 1971
   3 µm – 1975
   1.5 µm – 1982
   1 µm – 1985
   800 nm – 1989
   600 nm – 1994
   350 nm – 1995
   250 nm – 1997
   180 nm – 1999
   130 nm – 2002
   90 nm – 2004
   65 nm – 2006
   45 nm – 2008
   32 nm – 2010
   22 nm – 2012
   14 nm – 2014
   10 nm – 2016
   7 nm  – 2018
   5 nm – 2020

No obstant, la miniaturització té un límit físic que cada vegada està més prop. Amb els mètodes actuals, els transistors poden ser inestables.

El ràtio entre els processadors fabricats i els que realment funcionen correctament s'anomena rendiment o Yield. El yield és determinant en la rendibilitat d'un mètode de fabricació i és un secret industrial.

El procés del Haswell en 22nm és el que més rendiment ha proporcionat mai a Intel i esperen arribar al mateix en els Broadwell de 14nm.

Evolució

Els primers ordinadors tenien un disseny exclusiu i adaptat a la necessitat específica per la qual es dissenyava tot l'ordinador. Els programes eren exclusius per a cada maquinari i fets en llenguatge màquina. Inclús dins de la mateixa empresa, els programes fets per a un model no funcionaven en altre.

Com que el programari no era molt extens, aquest desavantatge no era molt important i proporcionava als dissenyadors una gran llibertat per a fer el maquinari més potent estalviant en components electrònics.

Alguns dels avanços dels anys 50:

  • Registres index: Permet generar una direcció de memòria sumant un desplaçament a un registre base.
  • Operands immediats: No cal guardar els operands en registres, algunes instruccions permeten indicar un dels operands en la mateixa instrucció.
  • Detecció d'operacions invalides.

Als anys 60 es va començar a estandarditzar els ordinadors per permetre retrocompatibilitat, al menys dins de la mateixa empresa.

En 1962, IBM va començar a fer ordinadors que pogueren executar el mateix programari encara que el maquinari evolucionara. Per a aconseguir-lo, van inventar el concepte de computadora virtual, la S/360. Tots el programes eren per a aquesta computadora i eren traduïts internament per al processador real. Com que després es traduïa instruccions en microcodi, el llenguatge màquina podia ser molt complex i amb molts modes de direccionament. Es tracta, per tant, d'una arquitectura CISC. (Complex Instruction Set Computer).

Els anys 70 són el principi de la tercera generació de les computadores, la generació de la integració.

En 1971, Intel va fabricar el primer microprocessador, el 4004. És a dir, un sol xip conté totes les parts de la CPU. En 1972, el 8008, amb un joc d'instruccions compatible amb els processadors per a PC actuals. L'ús intensiu de micro-xips va baixar el preu considerablement i va suposar una revolució. El ordenadors més comuns tenien de 4 a 16Kb i processadors de 16 bits.

Es tractaven de processadors CISC, ja que el microcodi era fàcil de guardar en una memòria molt ràpida i eren fàcilment programables al tindre més instruccions i més pròximes al llenguatge natural.

Mentres tant, IBM va continuar amb processadors molt més potents per a Mainframes. De l'ordre de 1MB de RAM, 1MHz i decenes de MB de disc.

A principis dels anys 80, investigadors d'IBM es van adonar que, normalment, sols s'utilitzaven unes poques ordres CISC. Van pensar en que si es reduïen les instruccions seria més fàcil i barat crear nous processadors més ràpids. També es van adonar que la RAM era un coll de botella i que es necessitava augmentar els registres o afegir una memòria intermitja, la cau. El resutlat van ser els processadors RISC Reduced Instruction Set Computers. El processadors RISC tenen poques instruccions, però van més ràpids. A més, internament, tenen una arquitectura Harvard, és a dir, separa la memòria de dades de la de instruccions i poden ser accedides simultàniament.

Els processadors per a servidors i alguns Mainframes comencen a ser RISC.

Els processadors x86 (Intel i AMD) van començar a ser RISC internament oferint un joc d'instruccions CISC.

A final dels 80, s'explota la possibilitat de paral·lelitzar les instruccions en els processadors. Apareix el Pipelining o Segmentació. Que permet executar varies instruccions que es troben en distintes fases d'execució a la vegada. Al mateix temps es pensa en utilitzar vaires ALUs per a executar instruccions que no tinguen interdependències a la vegada. Açò es anomenat arquitectura Superescalar. A partir d'aquest moment, és important la capacitat dels programes per a poder ser paralel·litzats.

En alguns casos, les següents instruccions depenen d'una instrucció anterior. Per exemple, si es compleix una condició. Els processadors que poden anar executant les instruccions posteriors, han de preveure els dos casos. Per tant, hi ha una predicció de ramificacions o branch prediction. I, posteriorment, fer una execució especulativa que serà descartada si no s'ha triat la branca d'execució correcta.

Per optimitzar la segmentació i l'arquitectura superescalar, també apareix el concepte d'execució fora de l'ordre (out-of-order). Que reordena les instruccions per a millorar el paral·lelisme.

Tots aquests avanços permeten als processadors CISC actuar com els RISC i poden executar inclús més de 12 instruccions per cicle, quant normalment eren més de 12 cicles per instrucció en els CISC purs.

A partir dels anys 90 van aparèixer noves optimitzacions al mateix temps que la mida dels transistors disminuïa considerablement i la freqüència augmentava.

Algunes tecnologies, com la Very long instruction word o la Explicitly parallel instruction computing eren, tal vegada, massa complicades per als programadors i per al disseny dels processadors. Alguns com el Intel Itanium no van triomfar com es pensava.

Va aparèixer el multithreading, que perment executar varis fils com si tinguerem més d'un processador aprofitant l'arquitectura superescalar i la segmentació. D'aquesta manera, per al sistema operatiu i les aplicacions, es compta amb més d'un nucli.

Més tard van fer aparició el processadors amb més d'un nucli o multi-core. En el que cada nucli és una CPU i comparteixen part de la cau. Tot en el mateix encapsulat.

Els processadors de PC van canviar a 64 bits impulsats per AMD i la seua arquitectura AMD64.

La capacitat d'integració permet actualment integrar el northbridge al mateix encapsulat, targeta gràfica inclosa. És el cas de la majoria dels iX de Intel o les APUs de AMD.

Actualment els processadors cada vegada integren més components, és el cas dels SoC (System on a Chip) dels telèfons mòbils, tables i altres sistemes menuts.

Mesurar el rendiment

Dir si un processador és millor que un altre no sempre té sentit. En general, les marques intenten cobrir les diverses necessitats del mercat i fan productes molt variats que són adequats per a un propòsit i no per a altres. Dir quin processador és millor es complica en processador del mateix ordre de preus i propòsits. A banda de les característiques tècniques objectives (Velocitat, Nuclis, Cau, Busos, TDP...), s'ha inventat diverses maneres de avaluar el rendiment dels processadors:

  • IPC Instruccions per cicle: Es tracta d'un bona mesura de la qualitat d'un processador. En un mateix cicle pot fer més o menys instruccions i, per tant, augmenta el seu rendiment sense augmentar la freqüència i el TDP. Amb freqüència es considera que un millor IPC millora l'anomenat rendiment mono-fil. L'IPC depén del programari executant-se i de la memòria, per tant, tampoc és una mesura completament objectiva. Augmentant les ALUs i segmentant més les instruccions en general s'aconsegueix més IPC a costa de més complexitat. També es pot parlar de CPI o cicles per instrucció, que és la inversa de l'anterior
  • IPS instruccions per segon, que és multiplicar el IPC per la freqüència del processador i per els nuclis. En general es mostra en MIPS que són milions d'instruccions per segon. Con l'altre, també depen del programa i la memòria.
  • FLOPS Intruccions en coma flotant per segon: Aquesta mesuar és més important per a supercomputadors que van a fer càlculs científics que necessiten coma flotant.
  • 'Rendiment per Watt: Alguns processador són més ràpids que altres a costa de gastar molta energia. Es tracta d'una mesura molt complicada de fer, ja que implica també el lloc on es fa el còmput i el programari. S'utilitza per a CPDs i altres supercomputadors.
  • Rendiment de la cau: No sols cal tindre una gran quantitat de memòria cau, aquesta ha de predir correctament el que es necessitarà. La quantitat i els algorismes de reemplaç afecten a aquest rendiment. L'index AMAT o Average Memory Access Time és el que indica el que tarda tinguent en compte l'index de cache miss o cache hits.

Microprocessadors de PC

Els microprocessadors de PC són CPUs molt complexes ja que tenen que funcionar bé en una gran varietat de funcionalitats. Actualment són molt potents i consumeixen poca potència.

L'estàndard sobre el que s'han construït tots aquests anys és el joc d'instruccions x86, del processador 8086 i 8088.

Prehistòria

Abans de parlar els processadors en el PC tal com el coneguem, cal mencionar els precursors.

4004 Intel (1971)

Aquenst va ser el primer microprocessador integrat de la història. Fins a aquests moments, el circuits integrats existien, però per a fer un processador calia muntar molts d'ells en una placa.

El Intel 4004 va ser un encarreg per a fer calculadores. El client, Busicom, volia el de sempre, però Federico Faggin, un empleat de Intel, va pensar que seria millor fer un únic circuit integrat multipropòsit. Va ser un èxit quant altres fabricants va poder aprofitar-lo per a màquines molt distintes.

El 4004 era poc potent, sols tenia 4 bits de bus de dades i podia direccionar fins a 640 bytes de memòria. La seua velocitat inicial era de 108KHz i va arribar a 740KHz.

8008 Intel (1972)

El 8008 ja tenia 8 bits de transferència i podia direccionar fins a 16KB. LA seua velocitat inicial eren 200KHz. Era un processador per a calculadores i terminals. Era un poc més lent que el 4004, però al poder accedir a més memòria i manipular 8 bits feia que fora molt més ràpid.

Les instruccions del 8008 van formar part de l'estàndar x86.

La década dels 70 va ser la de la implantació del circuit integrat en tots els ordinadors. La competència i la fabricació en masa va baixar els preus. Van apareixer molts minicomputadors de 16 bits i fins a 64KB de RAM.

8080 Intel (1974)

2MHz, 8bits, 64KB de RAM. Va se considerat el primer microprocessador realment utilitzable. Molts fabricants van produir 8080, entre ells, AMD.

Tenía un encapsulat més gran i, pre tant, podia tindre un bus de 16 bits per a direccions de memòria i un de 8 per a les dades. Comptava amb 7 registres de 8 bits, 6 dels quals es podien combinar en per fer registres de 16 bits. Els altres registres eren un punter de pila de 16 bits i un comptador de programa de 16 bits.

Tenia 256 ports de E/S. No utilitzava el mapeig de memòria, com es fa actualment. Alliberava memòria, però requeria instruccions especials de E/S.

Z80 Zilog (1975)

Es tracta d'una versió millorada del 8080. Més capaç i més ràpid que el Intel, va aconseguir un gran èxit en els primers microcomputadors.

Es tracta d'un dels processadors amb més èxit de la història. S'han fet moltes versions posteriors i encara s'utilitza en molts dispositius. Moltes de les consoles dels 90 el tenien instal·lat. Ha arribat a tindre 3.8MHz.

8085 Intel (1977)

Compatible amb el 8080, aquest necessitava menys suport de hardware per a funcionar. No va tindre molta popularitat perquè va ser superat per el Z80.

MOS 6502 MOS Technology (1976)

Era la CPU més barata de l'època. Tenia un preu de uns 25$ front als 179$ del 8080. Amés, era més ràpid que ells. Va ser un processador molt popular per ser utilitzat en els Apple II, Atari 2600, Nintendo NES i en el Commodore.

La seua velocitat inicial era de 1MHz, un poc més lent que els competidors. Però realment anava més ràpid, ja que era un processador pipelined o segmentat. Això vol dir que anava fent varies instruccions al mateix temps al dividir les seues fases. Els competidors eren CISC microprogramats que utilitzaven més cicles per instrucció. Els processadors no tenien multiplicador, per tant, tota la circuiteria anava a la velocitat de la CPU. El 6502 era més lent en MHz i, per tant, necessitava una circuiteria més lenta i més barata.

Era un processador amb molt pocs registres. La memòria RAM era més ràpida que el processador. Per tant, la utilitzava per als registres.


8086 Intel (1978)

El van fer compatible amb els 8008 i 8080. Però el joc d'instruccions va ser ampliat i millorat considerablement. Un de les millores més importants va ser el suport complet al processament amb 16 bits.

La herència del 8086 és el joc d'instruccions bàsic. De fet el 286, 386, 486 i posteriors són compatibles amb ell.

El processador 8086 tenía 20 bits de direcció i podia direccionar fins 1MB. La seua velocitat era de 5MHz a 10MHz. No tenia instruccions de coma flotant. Per tant, necessitava d'un coprocesador matemàtic, en aquest cas el 8087.

Era un processador molt potent però molt car i no va tindre gran èxit comercial.

8088 Intel (1979)

Era una versió retallada del 8086 i més barat. Aquest tenia el bus de dades de 8 bits.

És el processador utilitzat per IBM per al seu primer PC.

El 8088 era molt més barat que el 8086, i no era més barat sols el processador. Fabricar un bus de 16bits necessita un MCC (Memory Chip Controller) i RAM que suporte 16bits, i eren molt cars. Així que el 8088 si necessitava una instrucció de 16bits la demanava en dos cicles de memòria.

IBM PC

Els primer IBM PC va eixir amb el processador 8088 de Intel. Aquest tenía fins 1MB de memòria, 640KB per aplicacions i 384 per al sistema operatiu. En Aquest cas el PC DOS.

Anem a repasar els processadors posteriors per a PC:

80186 i 80188, Intel (1982)

Es tracta de versions millorades del 8086 i 8088.

Integraven DMA, tenien un controlador de interrupcions, i més instruccions. Va arrivar a tindre 6MHz.

Les millores anaven dirigides a reduir la necessitat de circuit externs al processador.

No va ser molt utilitzat en PC, però es va integrar com a processadors empotrats.

80286, Intel (1982)

El 80286 es caracteritza per el seu funcionament en mode real o protegit. Al entrar en mode protegit (si el SO es capaç) permet multiprocés i protecció de memòria, amés de memòria virtual. Quant el processador està en mode protegit, no deixa als programes executar instruccions del mode real.

El bus de dades és de 16 bits i el de direccions de 24 bits. D'aquesta manera es poden direccionar fins a 16MB de RAM.

Amplia el joc d'instruccions del 8086 en 25 més. Té 8 modes de direccionament i en mode virtual pot accedir fins 1GB. Va arribar a tindre de 6MHz a 25MHz.

La quantitat de cicles per instrucció va ser millorada. Es necessiten 4,5 de mitja i la instrucció més llarga té 29 cicles (206 la més llarga del 8086).

Va ser el processador del IBM Personal Computer/AT en 1984.

Un dels problemes més importants és que no podia passar de mode protegit a real sense un reinici. Es van fer instruccions de BIOS per a provocar un reinici sols del processador. Però el rendiment baixava molt. Aquest problema va provocar crítiques de Microsoft, ja que era impossible córrer varies aplicacions en Windows sobre MS/DOS.

80386, Intel (1985)

El 386 va ser el primer de 32 bits. Tenia un bus de 32 bits per a dades i el bus de direccions també era de 32bits. Per tant, era teòricament capaç de direccionar fins 4GB de RAM.

Comptava amb 3 modes de funcionament:

  • Mode Real compatible amb 8086
  • Mode protegit fins a 4GB.
  • Mode virtual 8086. Que permet varis programes 8086 en mode real en un entorn protegit.

A diferència del 286, aquest podia fer el canvi de mode sense reiniciar.

La seua velocitat va ser de 12 a 40 MHz.

Millorava la MMU per a permetre una millor gestió de de les pàgines i permetia fer sistemes operatius amb memòria virtual.

Els canvis en el joc d'instruccions des del 386 han sigut mínims i és molt fàcil adaptar un programa més modern per a funcionar en aquests processadors. Per això, el joc d'instruccions es considera un estàndard, el IA-32. Va eixir una variant, el 386SX amb 16 bits de bus que el fa més lent i més barat.

Van eixir varis processadors compatibles d'altres marques. Entre ells el AMD386, pràcticament un clon més barat i més ràpid.

80486, Intel (1989)

El 486 junta en un sol xip el 386 i el coprocessador matemàtic 80387, amés d'una memòria cau de 8KB.

El 486 executa les instruccions en mode ràfega o pipeline. Per això baixa 2 cicles per instrucció. El 486 a la mateixa velocitat, té un rendiment de més del doble que el 386.

La seua velocitat va anar de 16 a 100MHz.

Introdueix també la multiplicació de la freqüència de la placa. Per tal de no tindre que fer plaques mès ràpides, el que fa es fer que el processador tinga una velocitat muĺtiplo de la de la placa. Aquest va més ràpid però continuen sincronitzades. En el cas del 486, se duplicava o triplicava la velocitat del bus.

La variant DX2 duplicava la freqüència del sistema i tenia 32KB de cau L1.

S'han fabricat processadors 486 fins el 2007.

AMD 486 (1993)

Intel dominava el mercat i AMD fabricava processadors compatibles amb l'estàndard que marcava Intel.

Així i tot, alguns AMD 486 tenien millor rendiment que els de Intel a un preu menor.

Pentium, Intel (1993)

La novetat principal del Pentium és la microarquitectura P5 (586, encara que amb un altre nom comercial per problemes al registre de patents) amb funcionament superescalar. Això vol dir que pot anar executant varies instruccions a la vegada. No es tracta de varis nuclis complets, però pot tindre unitats funcionals duplicades. No és el mateix que el pipeline, però normalment van junts. De fet, el Pentium té dos pipelines de sencers i una unitat de coma flotant més potent. Amés, dos nivells de cau. La L1 amb 8KB per a codi i 8KB per a dades i la L2 de 512KB

Amb velocitats de bus de 50MHz a 66MHz, la velocitat del Pentium multiplicava aquestes arribant a ser de 60MHz a 300MHz.

La primera generació dels Pentium eren massa grans i consumien molt. La segona generació va millorar açò en 1994. Aquesta segona generació tenia un voltatge de 3.3v.

K5, AMD (1996)

El K5 era compatible amb el socket del Pentium.

El disseny era molt ambiciós, paregut al del Pentium Pro. Encara que el rendiment era similar al del Pentium.

La seua arquitectura era un RISC paral·lelitzat en el interior amb una interfície x86. Les característiques eren molt avançades però tenia alguns problemes que no permetien donar tot el potencial a la nova arquitectura.

Pentium-MMX, Intel (1997)

La velocitat del MMX arribava a ser de 233MHz. Però la veritable millora era la introducció del joc d'instruccions MMX. Aquest joc d'instruccions estaven preparades per a millorar els càlculs en aplicacions multimèdia per a la descodificació del àudio i vídeo o els jocs. Amés, duplicava fins els 32KB la cau L1.


Sexta generació

La sexta generació de Intel, P6 o i686 va ser introduïda per el Pentium Pro en 1995. Es tracta de l'arquitectura de referència fins el Pentium III i Pentium M i més endavant per als Intel Core.

Les característiques d'aquesta generació són:

  • Execució dinàmica: És el nom que Intel posa a l'execució especulativa i execució fora d'ordre.
    • Execució especulativa: Tècnica d'optimització en la que el processador realitza alguna tasca que pot no ser realment necessària. La idea principal és fer la feina abans que se sàpiga si serà necessària, a fi d'evitar un retard que hauria de ser efectuats per fer la feina després que se sàpiga si cal. Si resulta que la feina no era necessària després de tot, els canvis realitzats pel treball es reverteixen i els resultats temporals emmagatzemats s'ignoren. Per encertar el que fa és una predicció de salt múltiple.
    • Execució fora d'ordre: (OoOE o Ooe) En aquest paradigma, un processador executa les instruccions en un ordre governat per la disponibilitat de dades d'entrada, en lloc de per la seva ordre original en un programa. D'aquesta manera, el processador pot evitar estar inactiu mentre es recuperen les dades per a la següent instrucció en un programa.
Aquesta execució sols es pot fer en les instruccions que no depenen del resultat d'altres. Amés, l'eficiència del programes passa a dependre de la manera en que s'ha programat a banda de l'algoritme i la velocitat de procés. A partir d'aquest moment, la decisió entre un processador o un altre és molt més complicada, ja que no es pot mesurar tan fàcilment com en MHz, ample del bus o mida de la cau.
  • Millora el pipeline. En Pentium tenia 5 fases i passa a tindre fins a 14 en Pentium III.
  • Dual Independent Bus: Un bus per al sistema i un altre per a la cau.
    • Front-side bus: Per a connectar amb la memòria i xip-set.
    • Back-side bus: Per a la cau L2.
  • Millora de l'arquitectura superescalar.
  • Microinstruccions: El processador per dins és com un RISC i per fora les instruccions són com un CISC. Aquestes microinstruccions poden ser ordenades i executades paral·lelament per aconseguir les millores mencionades anteriorment.


Pentium Pro, Intel (1995)

El primer microprocessador de la sexta generació. La intenció era que reemplaçara al Pentium i el Pentium-MMX. Però va quedar relegat a PCs de alta gama, servidors i supercomputadors.

És el primer processador de Intel amb execució out-of-order i el primer realment preparat per a servidors. Va ser un precursor de la gama Intel Xeon. Tenia implementat suport per a SMP o (arquitectura UMA) per a 4 sockets.

En aquell moment, el mercat dels servidors estava dominat per arquitectures RISC com el Sparc de Sun. Però el Pentium Pro va marcar un punt de decadència d'aquestes arquitectures front al x86.

Pentium II, Intel (1997)

Al igual que el Pro, el Pentium II era de l'arquitectura P6. En quasi tot menys en la cau L2 era millor que el Pentium Pro. Aquest si va tindre un éxit comercial.

En quant a les característiques:

  • De 233 a 450MHz.
  • FSB de 66 a 100MHz.
  • Instruccions IA-32, MMX.
  • cau L2 separada del processador amb el back-side bus i amb la meitat de velocitat que el processador. (El Pentium Pro la tenia dins i era de la mateixa velocitat)

El Pentium II va tindre dos branques:

  • Celeron: Per als equips de gama baixa. Aquest tenia menys o res de cau L2.
  • Xeon: Per als servidors. Amb fins a 2048KB de L2, diferent socket i suport multiprocés simètric, és a dir per a estar en ordinadors amb més d'un processador.

Ficar la cau L2 fora del microprocessador i empaquetar-lo en un slot el van fer més barat que el Pro. Les instruccions MMX i la retrocompatibilitat amb millores en les instruccions de 16 bits orientaven al Pentium II al mercat domèstic on va tindre moltes vendes.

K6, AMD (1997)

Era compatible amb plaques Pentium, tenia un gran rendiment i era molt més barat que els processadors de Intel. Va tindre, per tant, una gran acceptació comercial.

Es tracta d'un processador amb tecnología superescalar i amb execució dinàmica. 64KB de cau L1 i fins a 256KB de L2.

La alternativa a les instruccions MMX de Intel va ser l'anomenat 3DNow!

Pentium III, Intel (1999)

En realitat no va ser una gran evolució front al Pentium II. Sols van afegir el joc d'instruccions SSE amb més instruccions multimèdia i de coma flotant.

Va integrar la cau L2. La velocitat era de 400MHz a 1GHz amb velocitats de FSB de 100 a 133MHz.

De manera similar al PII, va tindre una versió Celeron i una Xeon.

Athlon, AMD (1999)

En aquest moment, AMD tenia ja sockets propis.

El Athlon és el primer microporcessador en superar 1GHz de velocitat i va ser un dur competidor per als Intel Pentium III.

El FSB tenia una freqüència de 100 o 133MHz, però podia fer dos transferències per cicle. Per tant era com si tinguera 200MHz de velocitat. El seu bus de dades era de 64 bits.

Va tindre una versió barata anomenada Duron.

Pentium 4, Intel (2000)

El Pentium 4 implementava la séptima generació de microarquitectures de Intel. Anomenada NetBurst, aquesta arquitectura anava a succeir a la P6 per les nombroses millores tecnològiques. No obstant, el preu i el consum elèctric van fer reprendre la P6 per als processadors posteriors.

NetBurst proporcionava:

  • FSB de 800MHz per a una transferència de 6,2GB/s amb memòries DDR2.
  • Hiper Pipeline amb 20 passos. Encara que incrementa els errors de predicció, permet tindre instruccions més curtes i augmentar la velocitat del cicle de rellotge. Amés, Intel va millorar la fiabilitat de les prediccions un 33% front al PIII.
  • Rapid Execution Engine: Dos ALUs que anaven al doble de velocitat que el rellotge. De 3.8GHZ a 7.6GHZ internament.
  • Hyperthreading: Gràcies a l'arquitectura superescalar, el processador simula tindre 2 nuclis en un sol nucli. El SO pot planificar en eixos dos nuclis i millora la multiprogramació i l'aprofitament del processador.

NetBurst no va poder passar del 3.8GHz sense consumir massa electricitat. Amés, era complicat de escalar en funcionalitats sense consumir més llum. Els primers PIV en codis no optimitzats eren més lents que el PIII a mateixa freqüència de rellotge.

El Pentium VI va estar en el mercat des de 2000 fins 2008 i tenia de 1,3GHz a 3,8GHZ. Va ser un èxit comercial encara que la competència de AMD era molt dura en aquells anys. Va incorporar jocs d'instruccions nous com el SS2 i SS3.

La versió Prescott en 2004 va millorar el rendiment considerablement. Alguns van incorporar la computació en 64 bits adaptant les instruccions dels AMD64.

Els Pentium D van ser PIV amb 2 nuclis.

Athlon XP, AMD (2001)

En quant a velocitat era menor que el P IV, però el seu rendiment comparat al preu era superior. No obstant, la tecnología de Intel era superior i el Pentium IV va tindre molt més èxit.

El FSB era de 266 a 333MT/s.

Tenía el joc d'isntruccions multimèdia 3DNow! professional, que era compatible amb SSE.

La seua versió de baix cost era el Sempron.

Pentium M, Intel

Donat que els Pentium IV consumien molta electricitat per al rendiment, per a portatils es va fer el Pentium M basat en la microarquitectura P6 del PIII incorporant SSE2, les millores en el FSB i la predicció del PIV.

Pentium M no tenia tanta freqüència de rellotge, però ho compensava amb més cau L2 però de menor consum elèctric. El consum elèctric de la L2 i del processador es regulava segons la demanda per no gastar tant quant no era necessari.

En principi va ser sols per a portatils, però alguns fabricants van fer plaques base compatibles.

Athlon 64, AMD (2003)

L'arquitectura K8 de AMD va ser la primera en fer processadors per a PC de 64 bits. El rendiment teòric era molt major, però Windows XP no era de 64 bits i fins el Windows Vista la gent no va veure la necessitat dels 64 bits. Les aplicacions van tardar més en aprofitar aquest nou ample de paraula. D'aquesta manera, AMD va adelantar a Intel i va ser Intel, posteriorment el que adaptara les instruccions AMD per als seus de 64 bits.

La seua velocitat anava de 1GHz a 3,2GHz. Tenia una cau L2 de fins 1MB. Comptava a una tecnologia anomenada Cool'n'Quiet que reduïa la velocitat i el voltatge al processador si no estava gastant-se.

El FSB va se substituït per el que ells anomenaven HyperTransport.

Comptava amb instruccions SSE2.

Tenia una versió més potent, el Athlon 64 FX.

La seua versió per a servidors era el Opteron. Amb els 64 bits, els Opteron eren una dura competència per a Intel en el mercat dels servidors, on ja feia temps existien sistemes operatius de 64 bits.

Phenon, AMD (2007)

Basat en l'aquitectura K10, el Phenon era un processador de alt rendiment de AMD. El Phenon Quad va ser considerat el primer processador amb 4 nuclis reals en el mateix encapsulat.

Hi había de 3 i 4 nuclis (X3 i X4). Els de 2 s'anomenaven Athlon Dual-Core o Single-Core.

En 2008 van traurer el Phenon II amb suport DDR3, 6MB de cau i fins a 6 nuclis.

Intel Core

Diferències entre l'arquitectura Westmere (Evolució de Nehalem), Sandy Bridge i Interlagos (arquitectura dels AMD Opteron amb nuclis Bulldozer)

Es tracta de la familia de processadors de Intel actual per a portatils i PC.

Està basat en el Pentium M que és microarquitectura P6.

Els seus processadors són: Intel Core i9, Intel Core i7, Intel Core i5, Intel Core i3, Intel Core 2 Solo, Intel Core 2 Duo, Intel Core 2 Quad, Intel Core 2 Extreme lines.

Els Core Solo i Core Duo tenen arquitectura yohan. Són millores del Pentium M. El que fan és incorporar SSE3, més velocitat de FSB, 2MB de cau L2 i pipelines de 12 passos. Amés, els Core Duo tenen 2 nuclis amb la L2 compartida.

Els Core Duo i Solo són el primers processadors del canvi de Apple a processadors Intel en el MacBook Pro i el Mac Mini.

Els Intel Core 2 Solo, Core 2 Duo i Core 2 Quad són la evolució en 64 bits del Core. Aquests suporten Intel 64 o x86-64, un joc d'instruccions adaptat dels AMD64. Els Core 2 tenen molt poc de consum, treballen a 64 bits i tenen 6MB de cau L2.

Els Core 2 Duo tenen versions Celeron o Dual Core amb funcionalitats deshabilitades i més barats.

El Xeon 32xx y 33xx són molt pareguts als Core 2 Quad.

Les versions Core 2 Extreme estaven pensats per a l'overcloking.

Core iX

A partir de 2008 va aparèixer un altra manera de classificar alguns processadors Intel Core.

La nomenclatura no indica res técnic:

  • i3 per a baix rendiment
  • i5 per a mig rendiment
  • i7 per a alt rendiment
  • i9 per a rendiment extrem

Aquests processadors tenen un altra manera de anomenar al FSB. Ara li diuen QPI o DIM.

En la majoria dels casos tenen integrat el Northbridge, inclosa la GPU en el mateix processador. Les plaques base que els suporten no tenen un xip per al Northbridge.

Dins d'aquesta nomeclatura han anat millorant l'arquitectura. Aqueste són les generacions dels iX:

  • Nehalem (2007):
    • Succesor directe del Intel Core.
    • Fabricació a 45nm.
    • Reintrodueix el Hyper-Treading.
    • Redueix la cau L2 a 256KB ampliant la L3, compartida per tots els nuclis. La L1 queda a 64KB.
    • Millora la predicció de ramificacions.
    • QPI en els models més potents sense GPU. DMI en els que tenen GPU.
    • PCI-E, controladors de memòria i DMI per eliminar els Northbridge en models intermedis.
    • Segona generació del Intel Virtualization Technology.
    • SSE4.2
    • Noms: i[357]-[9876543]xx (on el primer número indica si és i3, i5 o i7 i l'altre la potència respecte a eixa categoria. Els altres dos són distintes versions.)
  • Sandy Bridge (2009):
    • 32 nm.
    • La cau L3 compartida conté el controlador gràfic en els models de socket 1155.
    • Millores en operacions matemàtiques i de xifrat.
    • Fins a 4 nuclis físics o 8 lògics amb Hyper-threading.
    • Integració total dins del mateix integrat del controlador gràfic.
    • de 14 a 19 passos per al pipeline.
    • Joc d'istruccions AVX
    • Està considerada com una nova arquitectura independent a partir de la P6 i les millores més sofisticades de la generació 7 representada pel Pentium 4.
    • Noms: i[357]-2xxx (El 2 indica segona generació de Intel Core. Aquests noms es mantenen a partir d'aquesta generació)
  • Ivy Bridge (2011):
    • 22nm.
    • 50% meny de consum elèctric.
    • Suport per a PCI-E 3.0
    • Més velocitat de transferència en RAM.
    • Millora considerable en la GPU i suport del 4K.
    • Noms: i[357]-3xxx
  • Haswell:
    • Xipset Intel 8 i 9.
    • Suport per a DDR4 en alguns.
    • Versió per a dispositius mòbils.
    • Més instruccions (AVX2).
    • Millora substancial de l'execució fora d'ordre
    • Menys consum elèctric quant està a l'espera i mès quant està funcionant a tota potència.
    • Noms: i[357]-4xxxx (Els haskell-E són i7-5xxx)
  • Broadwell
    • 2014-2015
    • Fabricació a 14nm
    • Reducció del TDP que permet alguns dissipadors sense ventilador.
    • Millors gràfics,
    • Centrat en el mercat mòbil.
    • Millora un 5% el IPC.
    • Noms: i[357]-5xxxY (On la Y pot ser U "Ultra low power", K "Desbloquejat per overclocking")
  • Skylake
    • És "tock", vol dir que millora l'arquitectura amb el procés de fabricació de 14nm de Broadwell.
    • DMI 3.0 amd velocitats de 8GT/s.
    • Ja no suporta VGA, suporta fins a 5 monitors per HDMI o Displayport.
    • Nous jocs d'instruccions intel MPX, ADX, AVX-512F.
    • Suporta DirectX 12.
    • Gestió d'energia amb Speed Shift.
    • Noms: i[357]-6xxxY (La Y pot ser: U "Ulta low power", H Bons gràfics, K desbloquejat, Q Quad core, T potent però optimitzat )
  • Broadwell-E
    • apareix en 2106
    • Gama extrema per als i7 sense gràfica integrada.
    • Fins a 10 nuclis físics i 20 fils.
    • 25MB de cau.
    • 140W de TDP.
    • 40 pistes PCI-E 3.0. (Pots tindre dos targetes a x16)
    • Intel Turbo Boost Max Technology 3.0 que millora el Turbo Boost anterior al poder aplicar-lo a cada nucli o a tots a la vegada.
    • Aproximàdament un 35% més potents que els Haswell-E i un 50% que els Skylake.
    • Suporta Thunderbolt
    • Noms: i[357]-6xxx[KX] (K desbloquejat, X "Extreme" )
  • Skylake-X
    • La versió extrema de la séptima generació.
    • Fins a 18 Nuclis.
    • Socket LGA 2066
    • 44 lanes de PCI-E
    • Apareix per primera vegada la nomenclatura i9
    • Noms: i[79]-7xxxX[E] [2]
  • Kaby Lake
    • Trenca la línia de desenvolupament Tick-Tock i es tracta d'una millora del Skylake ja que no poden introduir els 10nm encara.
    • Suposa una millora en procés de fabricació i velocitats normals i turbos. Encara que manté el mateix IPC
    • Millora substancial en la targeta gràfica integrada.
    • Els processadors de la línia Pentium que són Kaby Lake tenen HyperThreading i permet OverClocking en els i3.
    • Els xipsets antics són compatibles amb una actualització.
    • Tenen 16 lanes PCI-E en el processador i 24 en la PCH.
    • Noms: i[357]-7xxxY (La Y pot ser: U "Ulta low power", H Bons gràfics, K desbloquejat, Q "Quad core", T potent però optimitzat, Y "Extremly low power") [3]
  • Coffee Lake
    • Una altra millora de Skylake i Kaby Lake.
    • Un TurboBoost millorat Multi Core Turbo que multiplica més la velocitat respecte a la freqüència base i pot estar en més nuclis a la vegada.
    • Fins a 6 nuclis en les versions i5 i i7 i 4 nuclis reals sense Hyperthreading en els i3.
    • Socket 1151 però no compatible en els xipsets anteriors.
    • Noms: i[357]-8xxxY
    • El procés de fabricació anomenat per alguns 14nm++ permet freqüències més altes. Al tindre 2 nuclis més, més Ghz i més Turbo el rendiment és major sense millorar les IPC. En alguns casos també augmenta el TDP.
  • Cannon Lake
    • Igual que coffe lake amb 10nm
    • AVX 512
    • Sols portàtils (de moment)
  • Whiskey lake
    • 14++nm
    • Millores del Coffe Lake en Turbo
    • Suport USB 3.1
    • Per a portàtils
    • Mitigació d’Spectre.
  • Ice Lake
    • 10nm
    • Millores en IPC i noves instruccions
    • Millora de la cache L1 i L2 tant de mida com de ample de banda i millora de la memòria virtual i direccionable.
    • Millores en la gràfica integrada
    • Turbo per més temps
    • Suport de DDR4 3200 i LPDDR4X 3733

Les gràfiques dels Ice Lake són millors que les anteriors i tenen aquestes característiques:

Market Name Tier Execution
units
Base clock
(MHz)
Boost clock
(MHz)
max
GFLOPS
Used in
Consumer UHD Graphics G1 32 300 900 – 1050 460.8 – 537.6 Core i3-10**G1, i5-10**G1
Iris Plus Graphics G4 48 300 900 – 1050 691.2 – 806.4 Core i3-10**G4, i5-10**G4
G7 64 300 1050 – 1100 1075.2 – 1126.4 Core i5-10**G7, i7-10**G7


http://www.muycomputer.com/2016/05/25/todo-sobre-gpus-integradas-de-intel

AMD Accelerated Processing Unit (2011)

AMD Fusion és la denominació comercial d'una família de microprocessadors d'AMD, que destaquen per integrar processadors multi-nucli amb potents gràfiques integrades en un sol circuit integrat. El destacat rendiment gràfic (per tractar-se d'una gràfica integrada) és resultant de la fusió amb ATI, especialitzada en processadors gràfics o GPUs. La principal novetat que aquesta gamma de processadors promet oferir és un sistema multicore heterogeni, amb nuclis de procés especialitzats per a cada tasca. És evident que una de les especialitzacions és el processament gràfic, la descodificació per hardware (MPEG2 o MP3, per exemple) i l'acceleració 2D i 3D.

Es tracta de l'arquitectura anomenada Llano i Brazos (per a baix consum). La segon generació era Trinity i Brazos-2. La tercera generació Kaveri per als potents i Kavini i Temash per als de baix consum. La quarta generació són els Bristol Ridge i els Stoney Ridge

Les consoles Play Station 4 i Xbox One tenen una versió especial de la tercera generació.

Més envadant van passar de ser Fusion a Heterogeneous System Architecture (HSA). La idea d'aquesta HSA és fer processadors amb nuclis de CPU i de GPU amb recursos compartits i fàcilment accessibles als programadors.

De les característiques, algunes de les més destacades són:

  • Millora notable del paral·lelisme, sobretot en la tercera generació amn l'anomenat Steamroller Arquitecture.
  • Capacitat per a poder programar en C++ amb instruccions de GPU per aprofitar la potència combinada.
  • La GPU pot accedir a tota la memòria.
  • La CPU i la GPU comparteixen les mateixes direccions de memòria i poden compartir punters.
  • La GPU pot canviar de context per compartir la seua potència entre varis programes.

Els nuclis estan fets amb les anomenades microarquitectures Bobcat en la primera generació. En la segona piledriver i en la tercera generació estan la microarquitectura Steamroller per als de gran rendiment i la Jaguar per als de baix consum. La Quarta generació està basada en Excavator.

AMD FX (2011)

Es tracta de la família de CPU sense GPU integrada de AMD. Són molt potents, poden arribar als 5GHz i tindre 8 nuclis. No obstant, no poden superar als i7 més potents encara. No obstant, són una aproximació i possiblement en el bon camí i han apostat per un canvi radical respecte a Intel. Mentre que els Intel Core intenten ser els que més rendiment tinguen en un sol fil, els AMD aposten per el nombre de nuclis, encara que cada nucli no siga tant potent. Al compartir la memòria cau i la FPU entre dos cores, els móduls poden ser més menuts. D'aquesta manera es pot competir en procés paral·lel.

Els nuclis són més menuts i més simples, per això també poden tindre freqüències més altes, encara que el consum elèctric augmenta.

Tots els AMD FX estan desbloquejats per a l'overclocking.

Els AMD FX tenen dos microarquitectures:

  • Bulldozer:
    • Succesora de la K10 i dissenyada des de 0.
    • Suporta totes les instruccions de Intel i algunes més proposades per AMD.
    • Aquesta arquitectura introdueix el concepte de Mòdul, que és com un processador de dos nuclis per a sencers o un nucli per a coma flotant. Cada nucli del mòdul comparteix les primeres fases d'instrucció, les FPU i la cau L2 amb la resta del mòdul. Aquesta solució teòricament simplifica el disseny i permet més potència sense tant de consum elèctric.
    • 2MB de L2 per mòdule.
    • Cada mòdul té 2 Integer Clusters que poden fer 4 operacions en sencers per cicle.
    • Els mòduls comparteixen la cau L3 entre ells.
  • Piledriver:
    • Mateixa arquitectura que Bulldozer.
    • Millor predicció.
    • Menys consum elèctric.
    • Millores en el IPC (Instructions Per Clock).
    • TurboCore 3.0.
    • Un rendiment entre un 15% i un 30% més que el Bulldozer.
  • Steamroller:
    • Apareix a principi de 2014.
    • Millor paral·lelisme.
    • Millor predicció de branques.
    • Més memòria cau i més intel·ligent.
    • Memòria cau L2 redimensionable dinàmicament.
    • Millor controlador de memòria.
    • 30% més de IPC (instruccions per cicle) respecte a Bulldozer.
    • Més freqüència però menys consum.
  • Excavator:
    • APUs carrizo
    • Introdueix la HSA

Atom, Intel (2008)

Atom és el nom comercial del processadors de baix consum per a dispossitus menuts i portàtils.

Van soldats a la placa base i no es poden canviar. Tampoc es poden comprar per separat.

No tots els Atom poden executar codi de 64 bits. Els que poden, necessiten suport per la BIOS. Per tant, depèn de la placa base. El suport per a Windows de 64 bits no està totalment aconseguit.

Atom és un processador més paregut al Pentium III o Pentium M. Al contrari de la tendència d'augmentar el Pipeline i fer, internament, processadors RISC, el Atom pot fer algunes operacions complexes de forma atòmica. D'aquesta manera es pot tindre un bon rendiment sense augmentar molt la freqüència de rellotge. Com que no té execució out-of-order i el hyperthreading l'implementa de manera més rudimentària, no necessita subdividir les instruccions. També simplifica en part la circuiteria i baixa el TDP.


Core M, Intel (2014-...)

El Core M és la nova generació de processadors a partir de Broadwell de 14nm amb molta potència i molt poc TDP per a dispositius mòbils. També tenen noms com M3, M5 i M7 que es refereixen a la seua potència. Al ser per a dispositius mòbils tenen un socket BGA, és a dir, soldat a la placa base.

AMD Ryzen

En 2017, AMD trau una nova generació amb l'arquitectura Zen. En Ryzen són processadors d'alt rendiment amb molts nuclis, altes freqüències i capacitat de competir amb els processadors cars d'Intel.

La intenció d'AMD en l'arquitectura Zen és fer processadors de tot tipus, per això té els Ryzen 3, 5 i 7 per a Escriptori, els Threadripper per a entusiastes i els EPYC per a servidors. Aquesta estratègia sembla que per fi ha funcionat i poden competir amb els Intel. EPYC competix als Xeons, Ryzen 7 amb els i7 i Ryzen 5 amb els i5 en preus similars.

Podem observar l'evolució en les microarquitectures al llarg dels últims anys en Intel i AMD:

AMD any Intel
Zen 14nm 2017
Excavator v2 28nm 2016 14nm Kaby Lake
Excavator 28nm 2015 14nm Skylake
Steamroller 28nm 2014 14nm Broadwell
- - 2013 22nm Haswell
Piledriver 32nm 2012 22nm Ivy Bridge
Bulldozer 32nm 2011 32nm Sandy Bridge
- - 2010 32nm Westmere
K10 45nm Other 45nm Nehalem

Els Ryzen tenen com a característiques principals:

  • Cache L3 de 8MB fins a 16MB
  • Millores significatives en la cache com les micro-op que evita tindre que descodificar de nou una instrucció o l'estructura amb més cache per cada nivell, més ràpida i amb un bus més ample.
  • Diuen que un 40% de millora en el IPC
  • SMT o simultaneous multithreading, similar al HyperThreading de Intel. Però amb la possiblitat de tindre més de dos fils en un nucli.
  • Millores en la predicció de branques
  • Quatre FPU
  • Més velocitat en comunicació en la FPU
  • Noves instruccions
  • 16 línies PCI-E.

Ryzens disponibles a mitjans 2017:

Model Nuclis/Fils GHz XFR L3 Cau TDP Preu Disipador
Ryzen 7 1800X 8/16 3.6/4.0 +100 16 MB 95 W $419 -
Ryzen 7 1700X 8/16 3.4/3.8 +100 16 MB 95 W $299 -
Ryzen 7 1700 8/16 3.0/3.7 +50 16 MB 65 W $279 Spire

RGB

Ryzen 5 1600X 6/12 3.6/4.0 +100 16 MB 95 W $229 -
Ryzen 5 1600 6/12 3.2/3.6 +100 16 MB 65 W $209 Spire
Ryzen 5 1500X 4/8 3.5/3.7 +200 16 MB 65 W $189 Spire
Ryzen 5 1400 4/8 3.2/3.4 +50 8 MB 65 W $159 Stealth
Ryzen 3 1300X 4/4 3.5/3.7 +200 8 MB 65 W $129 Stealth
Ryzen 3 1200 4/4 3.1/3.4 +50 8 MB 65 W $109 Stealth

Ryzen Threadripper

Es tracta de la versió més potent i cara dels processadors Ryzen amb arquitectura Zen o Zen+. Mentre que els Ryzen 7 venen a competir en els High-end Desktop de Intel (HEDT), els Threadripper aspiren a una nova categoria que ells anomenen Super HEDT o SHEDT. Es queda en la línia entre el consumidor entusiasta i les Workstations professionals que en Intel són per als Xeon.

Les diferències en Ryzen són:

  • Més nuclis
  • Més Cache
  • 4 Channel DDR4
  • 60 front a 16 línies PCI-E
  • Més consum.
  • Socket TR4.

Threadripperarquitectura.jpg

D'aquesta manera queden 48 línies PCIe per a un SLI de 4 a 16/16/8/8, 12 per als M.2 per a tindre 3 4xNVMe, és a dir, 3 possibles M.2 a PCIe x4. I per últim 4 línies PCI per comunicar en el Xipset on estàn la resta de PCIe i altres ports.

Aquests processadors són un conjunt de mòduls de 8 nuclis interconnectats entre ells. Els que tenen 12 o 16 tenen dos mòduls i els de 24 o 36 tenen 4. Els de 24 o 12 tenen dos nuclis inactius per mòdul. En el cas dels de 4, sols dos mòduls estan connectats dirèctament amb la memòria. Eixos es diuen IO cores. La resta ha de demanar el que necessiten a aquests. La idea és que les aplicacions que necessiten menys nuclis poden aprofitar sols els que són IO i que no tots els processos necessiten constantment accedir a la memòria. En els EPYC, que tenen una arquitectura similar, el socket SP3r2 sí permet 8 canals DDR4, però el TR4 sols permet 4 canals.

Models disponibles en agost de 2017:

Model Nuclis/Fils GHz XFR L3 DRAM PCI-E TDP Preu
TR 1950X 16/32 3.4/4.0 +200* 32 MB 4x2666 60 180W $999
TR 1920X 12/24 3.5/4.0 +200* 32 MB 4x2666 60 180W $799
TR 1920** 12/24 3.2/3.8 ? 32 MB 4-Ch? 60 140W
TR 1900X 8/16 3.8/4.0 +200 16 MB* 4x2666* 60 180W* $549

Aquests processadors tenen més nuclis que els que els jocs normalment necessiten, per tant, no són els més recomanables per potencia/preu. No obstant, en workstations per a treballs de disseny, modelatge 3D amb programari que siga capaç d'aprofitar més nuclis o més programes al mateix temps pot ser recomanable invertir el preu que valen.

Els threadripper d'arquitectura Zen+ són:

Target Processador Nuclis
(threads)
Freqüència (GHz) Cache TDP Socket Memòria PCIe
Lanes
Release
date
Release
price (USD)
Base Precision Boost L2 L3
Entry-level Ryzen 3 2300X 4 (4) 3.5 4.0 512 KB
per core
8 MB 65 W AM4 DDR4-2933
Dual Channel
24 September 11, 2018 OEM
Mainstream Ryzen 5 2500X 4 (8) 3.6 4.0
2600E 6 (12) 3.1 4.0 16 MB 45 W DDR4-2666
Dual Channel
PRO 2600 3.4 3.9 65 W DDR4-2933
Dual Channel
September 6, 2018 ?
2600 April 19, 2018 $199
2600X 3.6 4.2 95 W $229
Performance Ryzen 7 2700E 8 (16) 2.8 4.0 45 W DDR4-2666
Dual Channel
September 11, 2018
PRO 2700 3.2 4.1 65 W DDR4-2933
Dual Channel
September 6, 2018 ?
2700 April 19, 2018 $299
PRO 2700X 3.6 4.1 105 W September 6, 2018 ?
2700X 3.7 4.3 April 19, 2018 $329
HEDT
(High-End Desktop)
Ryzen
Threadripper
2920X 12 (24) 3.5 4.3 32 MB 180 W TR4 DDR4-2933
Quad Channel
64 October 2018 $649
2950X 16 (32) 3.5 4.4 August 31, 2018 $899
2970WX 24 (48) 3.0 4.2 64 MB 250 W October 2018 $1299
2990WX 32 (64) 3.0 4.2 August 13, 2018 $1799

Zen+ respecte a Zen utilitza un procés de fabricació de 12nmm, mentre que els Zen tenen 14nm. Això no augmenta la quantitat de components, però permet més distància entre ells i millor dissipació de la calor. També millora les latències en la cache i amb la DDR4. Zen+ millora un poc el IPC respecte a Zen.

Desxifrar els números del processador

Intel Core i7 5775 C

  • Intel Core = Marca i model
  • i7 = Modificador del model (i7 vol dir que es tracta de la gama alta del Intel Core)
  • 5 = generació, aquesta és la quinta (Broadwell)
  • 775 = números SKU (és un codi intern que no té un significat definit)
  • C = Sufix (C és un processador amb gràfics integrats per a escriptori)
    • K = Desbloquejat para el overcloking
    • T = Optimitzat para poca energia
    • H = En portàtil vol dir que és bó per a gràfics. Pot ser HK (desbloquejat) o HQ (en 4 nuclis).
    • Y = Baix consum
    • U = Ultra baix consum


AMD FX-8350

  • AMD = Marca
  • FX = Linea de productes
  • 8 = número de nuclis
  • 3 = Generació
  • 50 = Model (més és més ràpid)

No obstant, sobretot en AMD, el números no solen ser molt fiables i cal anar a les especificacions per entendre bé el que tenen els processadors.

Processadors per a PC (2018)

En 2018, Intel manté una nomenclatura similar per a alguns productes d'escriptori i mòbils. Encara que tenen una diferència fonamental que és el socket. Ja que els d'escriptori tenen un LGA que es pot intercambiar, els de mòbil tenen distints BGA.

Intel Pentium

Són els processadors de gama baixa de Intel. Tenen l'arquitectura Haswell, Broadwell, Skylake o Kaby Lake però tenen les prestacions retallades respecte als i3. Alguns no tenen HyperTheading, algunes instruccions i la gràfica és menys potent.

Dins dels Pentium, Intel els classifica en la serie D (servidors), G3, G4 (escriptori) , alguns per al segment mòbil no tenen lletra davant o tenen la N o la J (Aquest de 4 nuclis i 4 fils).

Alguns Pentium estan preparats per a servidors que no necessiten una CPU molt potent però un baix consum. Aquest suporten memòria ECC i estan encastrats en la placa base. Intel posa la lletra D davant. Alguns tenen fins a 4 nuclis i 8 fils.

Els processadors per a PC de escriptori són:

  • G3xxx amb el socket 1150 i arquitectura Haswell-DT (22nm).
  • G4xxx amb arquitectura Skylake-S i socket 1151 i els d'arquitectura Kaby Lake que també són
  • Gold G4xxx, que sí tenen HyperThreading (2 nuclis, 4 fils) i una gràfica millor. El nom de Gold és per evitar confusions entre els G4xxx que tenen 2 nuclis i 2 fils i els 'Gold' que tenen 2 nuclis i 4 fils.
  • Gold G5xxx amb arquitectura Coffe Lake-S

Aquests processadors estan recomanats per a PC d'oficina que no necessiten una gran potència. També són recomanables en servidors no molt intensius de CPU, ja que els últims suporten tots ECC.

Intel Celeron

Encara més barats que els Pentium, el Celeron tenen menys cau, menys velocitat amb la RAM i pitjor gràfica.

Estan basats també en les arquitectures Haswell i Skylake amb els seus corresponents sockets.

Els noms són:

  • G18xx per als Haswell.
  • G39xx per als Skylake i alguns Kaby Lake
  • G49xx Per als Coffe Lake

També recomanats per a PC d'oficina amb poca potència o servidors poc potents. També suporten ECC.

i3

Són processadors suficientment potents per a ofimàtica, Internet i jugadors poc exigents. En 2018 trobem de la quarta a octava generació.

Els de la quarta Tenen 2 nuclis físics, HyperThreading i fins a 3,5GHz i 4MB de cau. La gràfica és la Intel HD 4400 o la 4600. Els i3 de Sexta generació (Skylake) tenen 2 cores i 4 fils, fins a 3,9GHz i 4MB de cau. Les gràfiques són les HD 510 o 530. Els i3 de sèptima generació (Kaby Lake) tenen fins a 4,2GHz amb les gràfiques 620, 630 i 650.

Els i3 Coffe Lake (vuitena generació) tenen 4 nuclis reals en 4 fils, freqüències similars i 6MB o 8MB de cau.

El preu és asequible i es recomana un Skylake o Kaby Lake per poder aprofitar els socket (LGA1151) més temps. En el cas dels Coffe Lake té que ser una placa amb un xipset adequat com el Z370, H370 o similars.

i5

Processadors potents per a quasi totes les aplicacions. Són suficients per a jugar si van amb una bona gràfica i RAM.

Compten amb 4 o 6 nuclis físics, 6MB o 9MB de cau i la tecnologia TurboBoost, que accelera un nucli quant aquest demana més potència.

Es pot dir que són la opció intel·ligent si vols potència a un preu raonable.

També els trobem de la 4, 6, 7 i 8 generació. El Coffe Lake tenen 6 nuclis i 9MB. Aquests necessiten una placa compatible encara que siga 1151.

i7

Són els processadors més potents de Intel i, alguns, el més potents del mercat per a PC.

Skylake i Kaby Lake tenen 4 nuclis físics i Hyperthreading, tenen 8 fils virtuals. El Coffe Lake tenen 6 nuclis i

Arriben a tindre 4GHz i 8 MB de cau el de generació 6 i 7. i 4.7 (Turbo) i 12MB de cau en la 8 generació.

i7 Extreme

Els processadors Extreme tenen el socket 2011 o 2066 perquè no tenen la gràfica integrada.

Els Basats en Haswell Tenen fins a 15MB de cau i 6 o 8 nuclis que són 12 o 16 fils amb Hyperthreading.

Els d'arquitectura Broadwell-E tenen fins a 10 nuclis i 20 fils, 25MB de cau i compatibilitat amb els xipsets x99 de la generació anterior.

Els d'arquitectura Skylake-X tenen fins a 8 nuclis i 16 fils. A partir d'aquesta generació, compten amb el socket LGA 2066.

De Kaby-lake sols hi trobem el i7-7740X amb 4 nuclis, 8 fils i una alta freqüència de 4.3GHz.

Els més potents tenen preus molt majors de 1000€. Als que cal sumar la gràfica i memòria i placa adequades per a la potència del processador.

Sembla que Intel ha apostat per deixar als i7 amb menys nuclis i més freqüència respecte als nous i9 i d'aquesta manera queden com els processadors ideals per a jocs front als i9 que són més per a treball multimèdia.

i9

A partir de 2017, Intel ha tret una nova gama de processadors ultra potents amb molts nuclis i molta memòria cache. D'aquesta manera separa la família dels i7, ja que alguns i7 tenien molts nuclis i altres molta velocitat.

Els primers tenen l'arquitectura Skylake-X de 14nm i van de 10 a 18 nuclis amb Hyperthreading, per tant, de 20 a 36 fils d'execució. Les freqüències van de 3.3GHz a 2.6GHz i tenen fins a 25MB de cache. Tots són per a socket LGA 2066.

Coffe-Lake també té un i9 de baix consum amb 6 nuclis i 2.9 de freqüència base.

En els i9 es veu cóm el turboboost els beneficia molt, ja que tenen fins a 4.8GHz de turbo en un sol nucli, el que fa que puga ser molt ràpid també en tasques monofil.

Processadors Intel encastats

Els fabricants de plaques mini-ITX i altres sistemes menuts de baix consum i no molts requisits de potència poden optar per soldar el processador Intel a la placa. Molts d'aquests processadors no necessiten més que un dissipador passiu i són ideals per a media-centers, NAS o servidors menuts.

Intel els classifica en les categories de Atom, Pentium i Celeron amés dels i3, i5, i7 Mobile. Alguns (els que tenen sufix M) amb el socket G3 que ès PGA i es pot intercanviar.

AMD Ryzen

En 2017 apareixen en Ryzen amb l'arquitectura Zen. Són processadors molt potents però amb preus competitius respecte als Intel similars. Tenen fins a 16 nuclis amb 32 fils (Threadripper).

Dins dels Ryzen es classifiquen en les series 3,5,7 i Threadripper. La cau L3 arriba a 32MB i tenen freqüències molt altes per a la quantitat de nuclis. Suporten DDR4 i tenen el sòcul AM4 o el TR4

AMD FX

Processadors sense GPU, molt potents i amb socket AM3+.

Tenen fins a 8 nuclis i al voltant de 4GHz.

AMD APUS A-Series

Processadors amb una potent gràfica integrada. Socket FM2+.

Se divideixen en varies categories: A4, A6, A8, A10, A12. La diferència està en el número de nuclis, la potència de la gràfica i la cau.

AMD APUs Athlon

Processadors més barats amb gràfica integrada. Tenen 4 nuclis i un consum moderat. Són una opció interessant per a equips barats.

El socket és el AM1.

Aquests processadors són SoC perquè integren totes les funcions del xipset, inclús les del southbridge.

AMD APUs Sempron

Processadors molt barats amb especificacions modestes. Encara i tot, tenen 2 o 4 nuclis i gràfica integrada. Poden ser una opció interessant per a un PC de ofimàtica.

Socket AM1.

AMD CPU Athlon II

Processadors sense gràfica integrada, 2, 3 o 4 nuclis i un preu molt competitiu. Poden ser una bona opció per a jocs si van amb una targeta gràfica acceptable. Alguns tenen desbloquejat el overclocking i poden tindre un rendiment similar a altres més cars.

Els models tenen de nom: X2-xxx, X3-xxx o X4-xxx depenguent dels nuclis. Són per al socket AM3. També poden ser un processador per a començar en el socket AM3 abans de comprar un FX.


Processadors AMD encastats

Les APU AMD poden tindre un socket FT3 que és BGA i va soldat a la placa. Són les basades en les arquitectures Kabini i Temash que són les de baix consum. També pot ser el FP3 per a les Kaberi

Sockets

Intel

Els primers processadors per a PC tenien un encapsulat DIP (Dual in-line package). En concret, el 8086 tenía un DIP de 40 pins. Molt prompte van tindre que pensar un altre tipus de encapsulat per la gran quantitat de pins necessaris i per la dificultat de substitució del DIP.

El 80186, 80286 i 80386 ja teníen un encapsulat PGA o PLCC de 68 pins i de 132 en el cas del 386.

Nom Encapsulat Processadors Característiques Notes
Socket 1 PGA 169 pins. 486 SX, DX, DX2 i Overdrive 33MHz de bus. 5V El primer socket amb un nom oficial.
Socket 2 PGA 238 pins. 486 a 66MHz (multiplicador). 33MHz de FSB. 5v Fins a 40MHz no necessita ventiladors. A 66MHz necessita un disipador pasiu.
Socket 3 PGA 237 pins. 486 a 3.3V Primer socket per a 3.3v
Socket 4 PGA 273 pins. Primers Pentium a 5 Volts. 60 a 66MHz de bus.
Socket 5 SPGA 320 pins Pentium a 3.3V.
Socket 7 SPGA 321 pins Pentium MMX, AMD i Cyrix Voltage regulator mode
Socket 8 CPGA 387 pins Pentium Pro FSB de 60 a 66MHz Sols per a Pentium Pro
Slot 1 Slot de 242 contactes Pentium II i III FSB de 60 a 133MHz La CPU i la cau no estan en el mateix xip, redueix el preu de fabricació. És més difícil de trencat els pins.
Slot 2 Slot de 330 contactes Pentium II Xeon FSB a 100-133MHZ
Socket 370 PGA-ZIF de 370 pins Pentium III i Celeron. 66, 100 i 133MHZ Subtitut del Slot 1
Socket 423 PGA-ZIF 423 pins Pentium 4 Willamette FSB de 400MT/s Va tindre una curta vida per no poder suportar més de 2GHz
Socket 478 PGA-ZIF 478 pins Pentium 4 i Celeron FSB a 400, 533 i 800 MT/s Creat per a competir amb el Socket A d'AMD.
Socket LGA 775 LGA 775 contactes Pentium 4 Prescott, Cedar Mill, Pentium D, Core 2 Duo, Core 2 Quad. FSB de 133MHz (533MT/s) a 400MHz (1600MT/s) El primer LGA que permet més pins amb menys perill de trencar un.
Socket LGA 1156 LGA 1156 contactes Intel Pentium, Celeron Core iX Lynnfield i Clarkdale. Al integrar el northbridge, no es pot parlar de FSB. Aquest socket es connecta directament amb: x16 PCI-E 2.0, DMI per a comunicar-se amb el Platform Controller Hub PCH (Antic xipset southbridge) amb PCI-E x4. FDI amb dos DisplayPort, 2 canals per a DDR3-1066 a DDR3-1333. Integra el northbridge en el processador. Ja no hi ha FSB. Xipset Intel H55, H57, P55 i Q57.
Socket LGA 1366 LGA 1366 contactes. Intel Core i7 9xx, Xeon i Celeron P1053 Intel QuickPath. x1 i x2 Aquest no té totes les funcions del northbridge integrades. Es connecta a ell per al QPI. Sols per als processadors d'alta gama. Xipset X58
Socket LGA 1155 LGA 1155 connectors Intel Core iX Sandy Bridge , Ivy Bridge DMI Reemplaç del 1156 per a processadors amb northbridge integrat. Xipsets: Sandy bridge: B65, H61, Q67, H67, P67, Z68 Ivy bridge: Z75, Z77, H77, Q75, Q77, B75
Socket LGA 2011 LGA 2011 contactes Core i7 Sandy Bridge-E, Ivy Bridge-E i Haswell-E, Xeon E5-16xx/26xx QPI i DMI. 4 canals DDR3 Reemplaç per al 1366. Xipset X79, C602, C604, C606, C608
Socket LGA 1150 LGA 1150 Core iX Haswell i BroadWell DMI Disipadors compatibles amb 1155 i 1156. Xipset: H81, B85, Q85, Q87, H87, Z87, H97 i Z97
Socket LGA 1151 LGA 1151 Core iX Skylake, Kaby Lake i Coffe Lake (no compatible) DMI 3.0 Suporta DDR4 o DDR3 en el mateix DIMM, Xipsets H110 B150 Q150 H170 Q170 Z170 B250 Q250 H270 Q270 Z270. Els 1151 per a Coffe Lake no són elèctricament compatibles i tenen els xipsets Z370.
Socket LGA 2066 LGA 2066 contactes Core i7 i i9 Skylake-X QPI DMI 3.0 44 Lanes PCI-E 3.0 4xDDR4 Reemplaç per al LGA 2011. (En els servidors el reemplaç és el LGA 3647) Xipsets X299


Els Intel encastats tenen quasi tots encapsulats BGA que van soldats a la placa. Encara que alguns tenen el socket G3.

AMD

AMD no va tindre el seu primer socket fins els AMD K6

Nom Encapsulat Processadors Característiques Notes
Super 7 SPGA 321 pins AMD K5/K6 Nous xipsets. De 66 a 100MHz. Soporta micros fins 500MHz. AGP. Ulta DMA
Slot A Slot 242 contactes. AMD Athlon fins a 1000MHz FSB a 100MHz Mecanicament compatible, però no electricament amb el Slot 1 de Intel. D'aquesta manera els fabricants sols tenien que fabricar un tipus d'Slot.
Socket A PGA-ZIF 462 pins Athlon, Duron Athlon XP, Sempron FSB 100-200MHz a doble trasferència per cicle -> 400MT/s
Socket 754 PGA-ZIF 754 pins Athlon 64, Sempron, Turion 64 FSB de 200-800MHz, Hypertransport, sense suport per a Dual Channel. Primer socket per a processador de 64 bits per a PC.
Socket 939 PGA-ZIF 939 pins Athlon 64, Athlon 64 FX, Alguns Opteron i Sempron. FSB de 200 a 1000MHz amb Hypertransport i Dual Channel DDR.
Socket AM2 PGA-ZIF 940 pins. Athlon 64, X2, FX, Opteron, Sempron, Phenon. 1GHZ Hypertransport 2.0, DDR2 Compatible amb 939.
Socket AM2+ PGA-ZIF 940 pins. Athlon 64, X2, FX, II, Opteron, Phenon, Phenon II. Hypertransport 3.0 a més de 2.6GHz, Millores en el comsum eléctric. Compatible amb AM2.
Socket AM3 PGA-ZIF 941 contactes en la placa i 938 en la CPU. Phenon II, Athlon II, Sempron i Opteron Hypertransport 3.0, suport per a DDR3. Hi han plaques hibrides per a suportat AM2+ o AM3 amb memòria DDR2 o DDR3 segons el processador.
Socket FM1 PGA-ZIF 905 pins Primers APUs A-series Llano. UMI (Unified Media Interface) per a connectar amb el FCH, (similar al DMI de Intel) més de 5,2GT/s Preparat per als APUs de AMD, que integren la GPU dins del processador.
Socket AM3+ PGA-ZIF 942, (938 en la CPU) Phenon II, Athlon II, FX. Bulldozer Hypertransport 3.1 més de 3.2GHz, Millor regulació de potència. Compatible amb AM3 modificant la BIOS.
Socket FM2 PGA-ZIF 904 pins. APUs Trinity i Richland, Athlon X2 i X4
Socket FM2+ µPGA-ZIF 906 pins APUs Kaveri i Carizzo
Socket AM1 PGA-ZIF 722, SoC Athlon i Sempron Kavini i Temash Baix consum
Socket AM4 PGA-ZIF 1331 AMD Ryzen i APUs Bristol Ridge 4xDDR4 (dual-channel) fins a 64GB, 24 lanes PCI-E
Socket TR4 LGA 4094 AMD Ryzen Threadripper 4xDDR4 (Quad-channel) fins a 128GB, 64 lanes PCI-E

Microprocessadors SmartPhones

En els primers telèfons intel·ligents, Android, Symbian, BlackBerry, Windows Mobile o iOS, el processador o les tecnologies acceleradores de gràfics emprades en la seva construcció no suscitaven interès. La tecnologia s'ocultava després de la mera funcionalitat. A més, l'escassetat de terminals, juntament amb la manca d'informació que es tenia dels primers processadors ARM i dels pocs fabricants que els signaven, contribuïen a ocultar els detalls tecnològics.

El negoci dels dispossitius mòbils ha anat ampliant-se i ha anat apareguent la possibilitat de desenvolupar aplicacions i sistemes operatius. En realitat un mòbil és un computador com qualsevol altre.

Els PC o els servidors tenen un microprocessador, RAM, busos i targeta gràfica. En els mòbils el que es fa és integrar tots en els SoC (System On a Chip).

Al principi eren populars els feature phones, que no permetien la descàrrega d'aplicacions, sinó que depenien de les que tingués preinstal·lades el mateix sistema operatiu tancat, o de les que el fabricant inclogués amb caràcter excepcional posteriorment. Amb Apple, amb l'iPhone original, l'arribada de la seva botiga d'aplicacions en 2008 i mesos després la de Google, tot va canviar: les aplicacions necessitaven un bon maquinari per funcionar, és clar. La seva evolució ha atret l'atenció dels principals fabricants de processadors; des Intel fins NVIDIA, passant per Qualcomm, Samsung, Texas Instruments o Apple, entre d'altres.

SoC vs CPU

Les CPU tradicionals dels 80, 90 i 2000 incorporen el nucli del processador, uns busos, registres i la memòria caché, a més de coprocessadors i altres tecnologies adicionals. No obstant, tot es centra en la capacitat de procés i la velocitat. A partir del Intel Core i les APU de AMD, els processadors per a PC incorporen les funcions del northbridge com els busos amb la GPU o la RAM. Inclús la propia GPU. Una de les raons és millorar el rendiment, però ara sempre pensant en el consum d'energia i la calor disipada.

Els SoC incorporen totes les funcions típiques de la placa base: CPU, RAM, GPU, memòria secundaria, Xarxa, GPS, entre altres. L'objectiu, al ser per a dispositius mòbils, era l'eficiència energètica.

L'anomenada era Post-PC implica que els SoC han desplaçat les CPU d'algunes funcions i els han relegat a equips de sobretaula o portatils potents. La diferència ja no és la velocitat, si no l'experiència d'usuari. Fins i tot, processadors com l'Apple A9X són capaços de oferir una potència comparable a la de moltes CPU d'escriptori.

Els PC confien en CPU potents i molta RAM amb sistemes operatius complexos i moltes capes de programari. Els mòbils són més específics, tenen un sistema més simple i menys funcionalitats. Però, el que poden fer, ho fan eficaçment.

Sembla que en el futur tornaran les diferències entre les workstations o servidors i la computació personal (excepte els PC per a jugar). Les CPU aniran incorporant més funcions, de manera similar als SoC.

ARM

La majoria dels mòbils actuals tenen una arquitectura ARM. ARM ofereix tant els jocs d'instruccions necessaris per programar aplicacions com dissenys de referència per fabricar els processadors capaços de treballar amb ells. Les instruccions tenen un equivalent en operacions lògiques i aritmètiques, que al seu torn tenen el seu «representació» electrònica realitzable mitjançant circuits digitals. Una companyia interessada en oferir solucions CPU basades en ARM pot llicenciar tant les instruccions com el disseny de referència, o dissenyar des de zero l'electrònica capaç de treballar amb elles.

Durant la història d'ARM, hi ha hagut diferents arquitectures caracteritzades pel joc d'instruccions. ARMv1, ARMv2, fins a arribar a ARMv7 amb la vista posada en ARMv8. Per a cada arquitectura, hi ha hagut diferents dissenys de referència. Per exemple, per ARMv6 es tenia el disseny de referència ARM11. I per ARMv7 són populars els ARM Cortex A9 o Cortex A15. Per a ARMv8 està el Cortex-A53 i Cortex-A57, incorporen els 64 bits.

Companyies com Apple, Qualcomm o NVIDIA, en algun dels seus projectes futurs, no fan servir aquests dissenys de referència i, per tant, els seus processadors no poden categoritzar com Cortex A9 ni A15, encara que les seves característiques estaran en línia amb les dels futurs Cortex A15. Per exemple, el processador Samsung Exynos 4412 de quatre nuclis que utilitza el Galaxy S3 és ARMv7 Cortex A9, així com el Tegra 3 de NVIDIA, també quad core, és Cortex A9.

El problema dels processadors Intel x86 és que es tracta d'una arquitectura millorada durant molts anys per oferir el millor rendiment sense importar l'eficiència. No obstant, actualment alguns Atom amb arquitectura x86 comencen a ser eficients i són instal·lats en mòbils, per exemple el Z2460.

ARM, per la seva banda, utilitza un joc d'instruccions (ISA) reduït, més simple que el de x86. És RISC, mentre que x86 és CISC. És una arquitectura més eficient, que ha crescut en rendiment gràcies a millores en el disseny dels micros. Per exemple, Intel va llevar l'execució fora d'ordre per fer eficients els Atom, però ARM ja l'incorpora.

En els smartphones, l'accelerador gràfic està integrat en el SoC. ARM és un dels desenvolupadors de acceleradors gràfics amb els processadors Mali; PowerVR, amb els SGX; NVIDIA, amb les seves GeForce; o Qualcomm, amb els Adreno, amb la tecnologia adquirida a ATI Imageon.

A diferència dels acceleradors gràfics per a equips de sobretaula, els que usen el mòbils són compatibles amb OpenGL i no amb DirectX. Així, els programadors d'aplicacions usen OpenGL per crear els efectes gràfics i moure les geometries dels jocs i aplicacions tant en 2D com 3D.

L'empresa ARM marca l'estàndard teòric amb les diferents arquitectures que va traguent. Aquestes estan relacionades amb el joc d'instruccions i amb l'adicció de noves funcionalitats. Altres empreses poden fer el mateix comprant la llicència o fer les seues millores. Cal indicar que ARM és la CPU que sol ser integrada en els SoC.

Elegir processador

En realitat no es pot elegir un processador concret per a un mòbil perquè van integrats. Però és interessant conèixer els factors (sempre canviants) a tindre en compte.

El primer a mirar és la versió, si és Cortex A9 o A15 o equivalents i l'arquitectura (ARMv7,ARMv8...), per exemple. Una tecnologia superior aporta millores en el rendiment a banda de la freqüència o el nuclis.

Per suposat cal mirar els nuclis i la freqüència. És important pensar que si augmentem nuclis i, sobretot, freqüència, augmentem el comsum i el calor.

Intel Atom SoC

Els Atom SoC de Intel, des de 2012, estan millorant en eficiència i aproximant-se als ARM. Per tant són una bona opció per a tindre un dispositiu mòbil amb x86.

Android suporta processadors x86 i, per tant, podem trobar smartphones o tablets amb android i Atom.

Intel a començat a anomenat X3, X5 i X7 als Atoms, de manera pareguda als Core M o Core iX.

Altres dispositius

Els PC o servidors x86 de 32 o 64 bits són els ordinadors potents més coneguts. Per un altra banda estan els dispossitius mòbil amb els processadors ARM de diferents fabricants. Però no són els únics computadors. Trobem arquitectures diferents tant de més potència com de menys.

Servidors

En el cas de Intel, fins al 2017 trobem les línies de Atom, Xeon D, Xeon E3, Xeon E5 i Xeon E7.

Els Atom són per a servidors menuts pensats en poca potència però un consum molt baix en servidors que van a estar molt de temps en marxa.

Els Xeon D ofereixen l'arquitectura dels Xeon però amb baix consum. Tenen processadors de molts nuclis i molta memòria cau. Però tenen poca freqüència de rellotge. Són bons per a servidors multi-fil però amb poca necessitat de velocitat per fil.

Els E3 mantenen la nomenclatura dels i3 en els processadors d'escriptori. Estan pensats per a Workstations o servidors no massa potents. Tenen una bona freqüència de rellotge i 4 nuclis. Alguns tenen el socket 1151, com els i3. Són comparables als i7 en potència. No permet més d'un processador per placa base.

Els E5 tenen molta potència i molts nuclis (en 2016 fins a 22 nuclis i 44 fils). Permeten fins a 4 processadors per placa base. Estan basats en Haswell i Broadwell.

Els E7 estan basats en Ivi-Bridge. Tenen fins a 18 nuclis (en 2016) Tenen molta potència molta memòria cau i permeten fins a 8 processadors per placa.

A l'hora de seleccionar un processador per a servidor cal pensar en la potència i la densitat de fils que, finalment tindrà el servidor.

En el cas de AMD, ofereix els Opteron i el EPYC. Els últims són els EPYC basats en arquitectura Zen i són, un altra vegada, uns competidors front a alguns Xeon.

En 2019

Els EPYC, en 2017, apareix la serie 7000 amb fins a 32 nuclis i 64 fils, Freqüències de 2GHz a 2.40GHz amb turbo de fins 3.2GHz, una Cache de 64MB, 8Channel DDR4, 128 línies PCI-E i un rendiment per nucli molt millorat gràcies a l'arquitectura Zen. Hi trobem versions per a 1 o 2 sockets.

En 2018 van traure els Epyc encastats amb un menor consum, són la serie 3000.

Intel trau els Skylake-SP amb nombroses millores i una nova nomenclatura en Platinum (81xxxx), Glod (61xxxx, 51xxxx), Silver (41xxxx), Bronze (31xxxx)

Els platinum estan pensats per a configuracions amb 8 sockets, són els successors dels E7 i tenen fins a 28 nuclis a 2.5GHz i 38.5MB de L3

Els gold són els pensats per a 4 sockets i tenen fins a 22 nuclis, molts tipus de cache al voltant de 22 a 30MB.

Els silver i bronze venen a sustituir als E5 i E3 per a configuracions de 2 sockets o 1. Tenen de 6 a 12 nuclis amb la cache de 5 a 16.5MB L3. Tots aquests els denominen escalables.

Encara es poden comprar tant els Skylake-SP com els E5,E3 i E7, ja que els escalables no estan en sockets de PC o encastrats.

També tenen les series D (Baix consum o encastats, útils per a servidors NAS o similar amb un sol processador) W (Skylake, Mateix socket que els i7 extreme, el 2066 els Cascade Lake els LGA 3647) i E (Coffe lake, substitut dels E3 Kaby Lake amb socket 1151 o encastrat amb BGA 1440)

No cal oblidar que Intel també fa processadors per a servidors de les families Atom i que es poden fer servidors amb celerons o pentiums quan no es necessita molta potència de CPU.

MainFrames

Els processadors per als Mainframe IBM són de l'arquitectura Power. Una especificació RISC desenvolupada per IBM per als seus Mainframes, servidors, inclús estacions de treball.

Altres variants s'utilitzen per a tot tipus d'aplicacions. Una de les derivades, PowerPC, era el processador del Mac anteriors a 2007 quant van adoptar processadors Intel. Les consoles PS3, Wii o Xbox 360 tenen processadors amb aquesta arquitectura.

Els Mainframe actuals tenen els processadors POWER7 o POWER8. També poden ser x86.

POWER8 té de 2.5 a 5 GHz està fabricat a 22nm i pot tindre de 6 a 12 nuclis i una cau L3 de fins 96MB.


Microcontroladors

Els microcontroladors són xips similars als SoC però de menys potència. Tenen la seua CPU i memòria RAM i de programa. Han de ser "entrenats" amb plaques especials i serveixen per a automatismes.

Molts tenen una arquitectura de 4 bits i freqüències tan baixes com 4KHz. Per tant no poden ser multiproposit. No obstant, tenen tant baix consum que poden funcionar en piles en aparells molt específics. La típica casa en un pais desenvolupat té més de 50 microcontroladors: Apertura de portes, elecrodomèstics, climatització, domòtica... Un cotxe normal té més de 30.

Els microcontroladors no solen tindre sistema operatiu. Sols un programa predefinit de fàbrica que s'executa en bucle i que pot interaccionar amb les persones per acceptar paràmetres.

Molts tenen arquitectura Harvard, que separa memòria de dades i instruccions.

Entre les arquitectures poden trobar: ARM, Atmel (8 a 32 bits) Microcontrolador de l'arduino, Intel, PowerPC.

Enllaços