Diferencia entre revisiones de «Processador»

De Jose Castillo Aliaga
Ir a la navegación Ir a la búsqueda
Sin resumen de edición
Sin resumen de edición
Línea 1: Línea 1:
<div style="float:left">__TOC__</div>
<div style="float:left; margin: 0 10px 10px 0;">__TOC__</div>
= Característiques =
= Característiques =



Revisión del 16:38 4 ago 2014

Característiques

Actualment és molt més complicat que abans saber quin processador és millor. Ja no sols importa la freqüència de rellotge (no ha augmentat molt en 10 anys). Anem a veure les característiques que permeten avaluar si un processador és adequat per a les nostres necessitats.

Velocitat

La placa base compta amb un rellotge de quars. Aquest material, al aplicar-li una corrent elèctrica, vibra a una freqüència determinada per el voltatge i la mida del quars. Transformant la vibració en senyals electròniques i aplicant uns divisors de freqüència es pot tindre un pols constant. Cada pols de rellotge és una senyal als circuits digitals per a realitzar un treball. Aquest pot ser des d'enviar unes dades per un cable fins a fer una suma binaria entre molts altres. Els processadors utilitzen cada pols o cicle de rellotge per a realitzar instruccions o parts d'elles.

Si la freqüència és major, el processador és capaç de realitzar més instruccions per segon i és, per tant, més potent. No obstant, hi ha un limit. Els transistors utilitzats tenen unes latències i els processadors comencen a no ser estables a partir de certes freqüències. Amés, a més velocitat més es calfa el circuit integrat i es pot cremar o consumeix massa electricitat. Fins a les freqüències actuals el consum i la fiabilitat dels processadors és acceptable, però és molt complicat augmentar més. En els següents apartats veurem cóm es pot millorar el rendiment sense augmentar la freqüència. No obstant, encara hui en dia, la força bruta de la freqüència de rellotge és clau per a determinar el rendiment d'un processador.

En els processadors, en especial els CISC, no es pot parlar d'una proporció directa entre freqüència i instruccions per segon. Això és perquè els processadors necessiten més d'un cicle per completar totes les fases d'una instrucció. Alguns, transformen les instruccions en micro instruccions més menudes i la majoria de processadors tenen instruccions que tarden més que altres. Actualment encara es complica més, perquè tenim la segmentació, les arquitectures multi escalars, l'execució especulativa o el multi nucli. Per intentar mesurar la potència real d'un processador es van inventar conceptes com els MIPS o FLOPS (milions d'instruccions per segon amb sencers o amb coma flotant) o els índex en benchmarks o en jocs coneguts i exigents.

Els processadors Intel Pentium 4 es pensava que arribarien als 10GHz. No va ser possible pel calor i el consum elèctric.

Els primers processadors tenien la mateixa freqüència que la del bus que els connectava amb la resta de dispositius. En el cas dels PC, fins al 486, la freqüència del processador era la mateixa. Però és molt complicat fer una placa base amb un bus tan ràpid com el processador. Per tant, es va optar per multiplicar la freqüència del processador en funció de la freqüència del bus. D'aquesta manera, mentre es fa una transferència pel bus, el processador pot anar fent instruccions o parts d'instruccions que no necessiten comunicació amb l'exterior de la CPU. Això millora les prestacions de la CPU, recolzant-se en memòries cau internes o busos amples (sovint també capaços de realitzar més d'una transferència per cicle de rellotge) per compensar la diferència de freqüència.

Normalment el multiplicador està bloquejat, però alguns processadors (no cal que siguen els més cars) permeten aquesta possibilitat a través de la BIOS. Si no es pot canviar el multiplicador d'aquesta manera, els overclockers opten per augmentar el voltatge amb el perill de cremar el processador. En qualsevol cas, el TDP augmenta i és necessària una millor refrigeració.

El concepte de multiplicador està quedant en desús o no se li dona la mateixa importància, ja que la comunicació del processador amb la resta de components ja no es realitza per el FSB, si no per interfícies de més alt nivell com QPI, DMI o Hypertransport. Amés, l'existència de memòries cau, doble o més transferència per cicle o dual channel cada vegada complica més considerar el multiplicador com una peça clau en el rendiment de l'ordinador.

Memòria cau

La memòria cau, o memòria cau (en francès i en anglès) és aquella memòria d'alta velocitat instal·lada en el mateix processador i en la qual s'emmagatzemen les dades que el microprocessador necessita utilitzar més freqüentment.

Aquesta memòria augmenta notòriament la velocitat de funcionament de l'ordinador. En el moment que el microprocessador necessita una dada, la va a buscar a aquesta memòria ultra-ràpida; en el cas que no la trobés, la buscaria a la memòria RAM; finalment, en cas que tampoc la trobés allà i el sistema operatiu suportés memòria virtual, accediria al disc dur. S'ha de tenir en compte que la memòria RAM és aproximadament unes 10 vegades més lenta, per la qual cosa el microprocessador podria quedar bloquejat si intentés extreure totes les dades directament de la RAM.

També existeix el concepte de nivells de memòria cau. Cadascun dels nivells posseïx una memòria cau. Així doncs, quan el processador necessita una dada, la buscarà al primer nivell de memòria cau, si no la trobara ací la buscarà en el següent nivell, i així successivament fins que la trobe. El primer nivell de memòria cau és menut però molt ràpid, el segon és més gran però més lent i així successivament. En l'actualitat el processadors comercials incorporen dos o tres nivells de memòria cau.

Quant un processador troba les dades que necessita en la memòria cau, s'anomena un cau hit. Si no el troba és un cau miss. Gràcies al principi de localitat, les dades necessaries solen estar prop de les que s'han utilitzat anteriorment. Per tant, si la memòria cau guardar un area suficientment gran de memòria principal, é smolt probable que augmenten els cau hits. De fet, ja en els primers processadors amb memòria cau, el cau hit ratio era d'aproximadament un 90%. Si tenim cau L2, hi ha un hit ratio del 90% sobre el 10% restant anterior, per tant, un 99% de hit ratio en total.

Els processadors actuals que tenen més d'un nucli, poden tindre una cau per nucli o compartida. Per exemple, el AMD Athlon X4 té dos mòduls amb dos 'nuclis' cadascun. Cada nucli té 128KB de cau L1 (64KB per a dades i 64KB per a instruccions) Fins a 1MB de L2 per nucli a la mateixa velocitat que el processador i no té cau L3. El processador Intel Core i7-4790T té 8MB de cau L3 i 64KB L1, 256KB L2 per nucli.

La memòria cau està gestionada per a tindre la part de la memòria principal que es demanarà en el futur. Seleccionar eixa part pot ser complicat, per tant, també es necessita una certa inteligència gestionant-la.

Bus de dades i direccions

Segons l'arquitectura Vonn Neuman, hi ha un bus únic per a comunicar la CPU amb la memòria principal i l'entrada eixida. La manera d'accedir a la memòria i a l'E/S pel mateix bus és mapejant els perifèrics en memòria. Encara es manté aquesta idea, però amb variacions per augmentar el rendiment.

En el cas dels microcoputadors, al principi el Bus era una extensió del bus de la CPU i anava a la mateixa velocitat. Este és el cas del bus ISA per a processadors com el 80286 que anava a 6 o 8MHz. No obstant, un bus extern controlat pel processador no permet millorar la seua velocitat i consumeix part de la energia per al processador. Per tant es va optar per diferenciar el bus del sistema per a connectar amb la RAM i els busos d'expansió per als perifèrics. Per a controlar eixos busos es va crear el xipset. En l'actualitat, alguns busos no estan sotmesos a la velocitat del rellotge i tenen connexions punt a punt smb capes i protocols de manera anàloga a les xarxes i amb connexions serie. Això permet reduir el nombre de connexions i augmentar la velocitat. Per exemple, el PCI-E o Hypertransport.

El bus està compost per:

  • Bus de direccions: Permet seleccionar la direcció de la paraula a llegir o escriure. L'amplada d'aquest bus afecta a la mida màxima de la memòria.
  • Bus de dades: Per on van les dades fins o des del processador. En els primers processadors era menys ample que la mida de la paraula i es necessitaven més d'una transferència per portar una paraula. Actualment solen ser més amples que una paraula per poder transportar més d'una en cada transferència.
  • Bus de control: Goberna el funcionament del bus indicant si és de lectura o escriptura i el dispositiu la que va dirigit.

Front Side Bus

El front-side bus, també conegut per la seva acrònim FSB (del anglès literalment "bus de la part frontal"), és el tipus de bus usat com a bus principal en alguns dels microprocessador antics de Intel per comunicar-se amb el xipset. Aquest bus inclou senyals de dades, adreces i control, així com senyals de rellotge que sincronitzen el seu funcionament.

La freqüència de treball del microprocessador s'obté com a resultat de multiplicar la freqüència de rellotge del FSB (a MHz, no en MT/s) per un factor multiplicador. Aquest factor multiplicador, així com la freqüència de rellotge del FSB poden alterar-se a través de la configuració de la placa mare, generalment a través de la BIOS, permetent així el overclocking. Per exemple, una CPU de 1.000 MHz podria funcionar amb una freqüència de rellotge de 133 MHz i un factor multiplicador de 7,5.

Amés, es pot fer 2 (Double data transfer o DDR) o 4 (Quad data transfer) transferències per cicle. Si tenim un FSB a 100MHz i DDR es pot calcular que va a 200MT/s

L'amplada de banda de l'FSB depèn de la seva mida de paraula (si és de 16, 32 o 64 bits), la freqüència de rellotge mesura megahertzs i el nombre de transferències que realitza per cicle de rellotge. Per exemple, un FSB de 32 bits d'ample (4 bytes), funcionant a 100 MHz i que realitzi 4 transferències per cada cicle, ofereix un màxim teòric de 1.600 megabytes per segon.

(Ample de paraula)            (Freq)      (Transf x cicle)             
           4                    x          100    x          4                  = 1600 MB/s

Algunes relacions entre freqüència i ample de banda amb paraules de 8 Bytes:

Names Frequency Transfer Rate Theoretical Bandwidth
DDR-200, PC-1600 100 MHz 200 MT/s 1.6 GB/s
DDR2-800, PC2-6400 400 MHz 800 MT/s 6.4 GB/s
DDR3-1600, PC3-12800 800 MHz 1600 MT/s 12.8 GB/s

AMD va substituir el FSB per Hypertranport i Intel, més tard per QPI o DMI.

Back Side Bus

En el món de la informàtica, el Back Side Bus (BSB, literalment "bus del darrere", en contraposició al frontal o FSB) es refereix a la connexió entre un microprocessador i la seva memòria memòria cau externa , en particular i comunament la de segon nivell o L2. Atès que el concepte de BSB complementa al de FSB, els ordinadors moderns utilitzen una "arquitectura de bus dual" o, en la nomenclatura d'Intel, Dual Independent Bus (DIB).

Front al bus unificat dels primers PCs , el BSB presenta uns avantatges:

  • És dedicat, sols comunica la CPU amb la cau L2. (Dins del mateix encapsulat des del Pentium II)
  • Com que el Hit ratio de la L2 és molt alt, allibera el FSB.
  • Està integrat en el mateix xip. Per tant pot operar a velocitats molt altes.

En els Pentium II tenia la mitat de la velocitat del processador. El últims Pentium III ja incorporaven la L2 a la mateixa freqüència que el processador. Els AMD de la època també funcionaven a una fracció de la freüència de rellotge (1/2, 2/5 o 1/3). De de finals de 1999 en el cas de Intel o principis del 2000 en el cas de AMD, tots els processadors tenen L2 a la mateixa freqüència que el processador.

HyperTransport

HyperTransport (HT), també conegut com a Lightning Data Transport (LDT) és una tecnologia de comunicacions bidireccional, que funciona tant en sèrie com en paral·lel, i que ofereix un gran amplada de banda en connexions punt a punt de baixa latència. Es va publicar el 2 d'abril de 2001. Aquesta tecnologia s'aplica en la comunicació entre xips d'un circuit integrat oferint un enllaç (o bus) avançat d'alta velocitat i alt acompliment; és una connexió universal que està dissenyada per a reduir el nombre de busos dintre d'un sistema, subministrant un enllaç d'alt rendiment a les aplicacions incorporades i facilitant sistemes de multiprocessament altament escalables.

És utilitzat per moltes empreses en microprocessadors i xipsets. En el cas del processadors per a PC, és utilitzat per AMD des de 2003 amb el Athlon 64.

La idea d'aquests busos és funcionar de manera similar al funcionament de les xarxes. Està basat en paquets de 32 bits. El primer paquet d'una transferència és sempre de comandament. Si conté una direcció, els últims 8 bits enllacen a la següent paraula i formen una direcció de 40 bits. (També es poden formar direccions de 64 bits) La resta de paquets tenen la informació útil. La transferència sempre és un múltiple de 32 bits.

Les connexions negocien la velocitat de transferència. La velocitat màxima a 32 bits i dos busos té 20,8GB/s per bus i un total de 41,6GB/s en les dos direccions.

Hi ha varies versions de Hypertransport, 1.x, 2.0, 3.0 i 3.1. Aquesta pot anar de 200Mhz a 3,2GHz. Suporta tecnología DDR anant a 5200MT/s si funciona a 2,6GHz o a 6400MT/s si funciona a 3,2GHz.

Permet reduir el consum elèctric quant la CPU no demana activitat i permet controlar el consum elèctric dels perifèrics com els discos.

AMD utilitza HT per a comunicar varis processadors entre si amb l'arquitectura NUMA.

Les CPU AMD FX i Athlon II actuals que no tenen gràfica integrada, amb socket AM3+ suporten HT 3.1 a 3,2GHz.

Intel QuickPath Interconnect

És la connexió punt a punt de Intel feta per a competir amb HyperTransport de AMD. Va eixir en 2008 per als processadors Intel Core i7.

QPI forma part de la QuickPath arquitecture de Intel i requereix que el processador tinga un controlador de memòria integrat. En màquines multiprocessadors utilitzen l'arquitectura NUMA.

QPI té velocitats de 4 a 6 GT/s per direcció i l'ample de banda va de 12 a 16GB/s en cada direcció o 24 a 32GB/s per connexió.

Encara que alguns processadors Core i7 de gamma alta exposen QPI, la majoria del processadors d'escriptori o mòbils (per exemple, LGA 1156 Core i3, Core i5 i altres processadors Core i7 de la família Lynnfield / Clarksfield) no exposin QPI externament, ja que aquests processadors no tenen la intenció de participar en sistemes multi-socket. No obstant això, QPI s'utilitza internament en aquests xips per comunicar-se amb el "uncore" (L'antic northbridge però dins de l'encapsulat de la CPU), que forma part del xip que conté els controladors de memòria, del costat de la CPU i GPU PCI Express, si està present; Aquests es comuniquen externament a través de les interfícies més lentes DMI i PCI Express, perquè les funcions del Northbridge tradicional són realment integrades en aquests processadors, començant amb Lynnfield, Clarksfield, Clarkdale i Arrandale; per tant, no hi ha necessitat d'incórrer en les despeses de l'exposició de la (antiga) d'interfície de bus frontal a través del sòcol del processador.

DMI

Direct Media Interface (DMI) és el vincle entre el Northbridge i Southbridge en una placa base de l'ordinador. Va ser utilitzat per primera vegada entre els xipsets 9xx i el ICH6, llançat en 2004.

En els processadors Intel actuals que tenen el northbridge integrat, DMI i PCI-E són els busos de comunicació del processador amb els perifèrics.

Altres tecnologies

Els processadors milloren constantment la velocitat, ample de paraula o mida de la memòria cau, per exemple. En general és la manera més directa de millorar el rendiment, però hi ha "trucs" alternatius per a millorar el rendiment del processador.

Instruccions Multimèdia

Amb el Pentium MMX es va inaugurar la època en la que els processadors de PC s'optimitzaven per a activitats multimèdia.

MMX és un repertori d'instruccions SIMD (una instrucció, múltiples dades) dissenyat per Intel per a millorar els cálculs en coma flotant i altres necessaris en la compressió i descompressió multimèdia o el renderitzat 3D.

AMD, el competidor d'Intel, implementa el repertori d'instruccions en punt flotant 3DNow!, per combatre MMX. Intel dos anys més tard, implementa l'extensió matemàtica SSE per treballar en punt flotant.

Més endavant van apareixer SSE, SSE2, SSE3, SSE4, AVX2, suportats per Intel i AMD.

Segmentació

Les instruccions tenen diferents fases. La segmentació o pipelining permet anar fent al mateix temps diferents fases de varies instruccions a la vegada. Amb aquesta tecnologia es passa de varis cicles per instrucció a varies instruccions per cicle.

Si les instruccions tenen interdependència no es pot aprofitar aquest avantatge. Si les instruccions formen part de bucles o hi ha condicions, es té que fer una execució especulativa, de manera que decideix una branca de les possibles i si falla ha de tornar enrere. La predicció de branques és complicada i va millorant en els processadors nous.

Quantes més fases tinga el pipeline més es pot segmentar. Els Pentium 4 van arribar a 20 pasos i una millor predicció de branques, no obstant, era molt complex i es calfava molt. Els processadors actuals, com el i7 tenen al voltant de 14 a 19 fases

Arquitectura Superescalar

Consisteix en duplicar algunes parts funcionals de la CPU, com la ALU, per a fer varies instruccions alhora. No és el mateix que la segmentació, però normalment van unides.

Execució Out-of-order

Com que algunes instruccions poden tindre dependències, una solució és reordenar-les de manera que es puguen fer de la manera més paral·lela possible.

HyperThreading

Gràcies a l'arquitectura superescalar, el processador simula tindre 2 nuclis en un sol nucli. El SO pot planificar en eixos dos nuclis i millora la multiprogramació i l'aprofitament del processador.

En l'actualitat, els core i3 i i7 el tenen per simular més nuclis.

TurboBoost

El TDP dels processadors está molt relacionat amb la freqüència. Un processador a 4GHz consumeix molt més que un a 3,2GHz. Però en ocasions, la única manera de aconseguir més velocitat és augmentar la freqüència. Alguns processadors Intel poden augmentar temporalment la velocitat d'un nucli si ho consideren necessari sense calfar massa el processador.

En el cas de AMD, es diu Turbo Core o símplement Turbo.

TDP

La potència de disseny tèrmic (TDP), de vegades anomenat punt de disseny tèrmic, es refereix a la quantitat màxima de calor generada per la CPU, el que es requereix que el sistema de refrigeració en un ordinador per dissipar en l'operació típica. En lloc d'especificar veritable dissipació de potència de CPU, TDP serveix com a valor nominal per al disseny dels sistemes de refrigeració de la CPU.

El TDP no és típicament la major quantitat de calor que la CPU mai podria generar (potència màxima), sinó més aviat la màxima quantitat de calor que es generaria quan s'executa "les aplicacions reals." Això assegura que l'ordinador serà capaç de manejar essencialment totes les aplicacions sense excedir el seu envoltant tèrmica, o que requereix un sistema de refrigeració per a la potència màxima teòrica (que costaria més, però en favor d'espai lliure addicional per a la potència de processament).

El TDP pot ser variable en els processadors actuals, ja que poden desactivar parts del processadors per consumir menys si no ho necessiten.

Generalment, augmentar la freqüència de rellotge augmenta el TDP. La quantitat de transistors també afecta al TDP. Si els transistors són més menuts es poden ficar més sense augmentar el TDP.

Per les lleis de la termodinàmica, el calor que desprèn un microprocessador també implica que està consumint més energia elèctrica. En l'actualitat s'intenta que els processadors aprofiten millor la potència de les bateries i gasten menys llum. En portàtils i mòbils donen més autonomia i no són perillosos per el calor. En el cas dels servidors es poden estalviar molts diners amb processadors eficients.

Modes de funcionament

Els processadors x86 han evolucionat des de un PC amb maquinari molt limitat amb un sistema operatiu monousuari, mono-tasca i mono-procés a uns ordinadors amb els mateixos sistemes operatius que els ordinadors grans. Fins i tot, molts servidors no tenen una gran diferència respecte als PC. Els sistemes actuals són multiprocés, multitasca i multiusuari. El maquinari, per tant, ha passat de ser mínim i barat per a l'epoca a ser molt potent per suportar les necessitats - sobretot multimèdia - dels usuaris domèstics.

Els primers processadors per a PC no podien suportar protecció de memòria o planificació de processos. Els sistemes operatius necessiten uns registres, instruccions i unes interrupcions especials per a poder gestionar la multitasca. MS-DOS era un sistema operatiu que no necessitava molta potència de maquinari, però no oferia potència ni seguretat. Per tant, els processadors anteriors al 80286, no implementaven protecció de memòria, multitasca o nivell de privilegis, és el que s'anomena mode real. Més endavant han eixit altres modes, però en el cas dels PC, han conservat la retrocompatibilitat.

Els modes de funcionament són:

  • Mode real: És el mode en que funcionen tots els processadors x86 al principi del seu arranc quant són resetejats. És l'únic mode dels processadors fins l'arribada del 80286. Les característiques són:
    • Instruccions i dades a 16 bits.
    • 20-bits de direccions de memòria segmentada que pot adreçar 1MB.
    • Accés il·limitat per al programari a totes les direccions de memòria, direccions de E/S i maquinari perifèric.
    • No proporciona protecció de memòria, multitasca o nivell d'execució.
    • Fins a l'actualitat (2014), tots els processadors x86, inclús els de 64 bits arranquen en mode real.
  • Mode protegit: El 80286 va ser el primer processador en implementar aquest mode. Les intencions de Intel eren que els sistemes operatius i tots els programes utilitzaren sempre el mode protegit. Però el programes fets per al mode real tenien que ser programats de nou. La solució del 286 era arrancar en mode real i passar fàcilment al mode protegit. Però per a passar al mode real de nou es necessitava un reset del processador. IBM va implementar en les plaques un sistema per a no fer un reset a tot l'ordinador, però encara era ineficient. Els sistemes operatius s'executen en mode real i cada vegada que es necessita el sistema operatiu per gestionar processos o memòria és necessari un canvi a mode real i de nou passar a mode protegit per al programes d'usuari. Com que en canvi és molt lent, la multiprogramació era molt difícil. Les característiques principals del mode protegit són:
    • Té mecanismes per a que els sistemes operatius implementen la multitasca, protecció de memòria i paginació.
    • Quant un processador arranca, sempre és en mode real, després activa el bit PE Protection Enable en el registre de control.
    • En el 286 no va ser molt utilitzat perquè el sistema MS-DOS no el necessitava. Els sistemes Xenix o Minix no eren molt populars.
    • En el 386 es van solucionar molts del problemes del 286.
    • Té 32 bits de bus de direccions, que permet 4GB de memòria RAM.
    • El programes estan segmentats i inclou una taula descriptora de segments. Els segments estan paginats, originalment en pàgines de 4KB.
    • El mode protegit és l'usat en pràcticament tots els sistemes operatius moderns per a PC.
  • Mode virtual 8086: Per evitar problemes de retrocompatibilitat, el 80386 va incorporar amés del mode protegit el mode virtual 8086. Es tracta d'una virtualització de maquinari en la que simula el funcionament del mode real per a executar aplicacions antigues mentre està en mode protegit. Les aplicacions tenen 20 bits de direccionament, però sobre una memòria virtual paginada i protegida.
  • Mode llarg: Els processadors x86_64 tenen aquest mode com el seu mode protegit per defecte i mantenen la compatibilitat amb el mode protegit de 32 bits o mode real a 16 bits com a submodes. Els programes poden detectar si estan en un processador de 32 o 64 bits.
    • El primer processador de 64 bits per a PC, el AMD Athlon 64, tenia 48 bits de direccionament virtual i 40 bits de direccionament físic (1TB).
    • L'arquitectura K10 de AMD té 18 bits de direccionament físic, (256TB), més adequat per a servidors. I el llimit en un futur será de 64 per a direccionament virtual i 52 per al físic.
  • Virtualització: Els processadors moderns ajuden a la virtualització creant processadors virtuals més eficients al estar assistits per maquinari i no tant per el programari de virtualització.
    • AMD-V és la primera aproximació de AMD. Va eixir en 2006 i està suportat per molts processadors de alta gama i alguns més modests. Si volem saber si suporta AMD-V, l'etiqueta en /proc/cpuinfo és svm.
    • Intel VT-x és la tecnologia de Intel, va eixir en 2005 en el Pentium 4 662 i 672. No tots els processadors el tenen i, si es va a virtualitzar, és important mirar en /proc/cpuinfo si està l'etiqueta vmx.

Mètode de fabricació

La fabricació de circuits integrats és un procés complex i en el qual intervenen nombroses etapes. Cada fabricant de circuits integrats té les seves pròpies tècniques que guarden com a secret d'empresa, encara que les tècniques són semblants.

Els dispositius integrats poden ser tant analògics com digitals, encara que tots tenen com a base un material semiconductor, normalment el silici.

Els processadors es fabriquen amb una tècnica anomenada Fotolitografía en la que s'aplica una llum que imprimeix els circuits a una superfície fotosensible i es tracta amb productes químics. No és rentable fer un sol processador cada vegada, per tant, es fa un oblea de molts processadors i es talla. El resultat són molts circuits integrats iguals. Es comproven els xips, és possible que un xip no tinga la mateixa qualitat que un altre encara que funcione. Es marca, per tant, la velocitat màxima a la que pot arribar cada xip.

No és un procés determinista, es a dir, amb el mateix procés, pots tindre processadors més o menys ràpids. Però els que no ixen del tot bé no es descarten, si funcionen, es venen amb especificacions més modestes.

Exemple: El P4 2.0, 2.2, 2.53 són EXACTAMENT el mateix xip

Els transistors integrats cada vegada són més menuts.

   10 µm – 1971
   3 µm – 1975
   1.5 µm – 1982
   1 µm – 1985
   800 nm – 1989
   600 nm – 1994
   350 nm – 1995
   250 nm – 1997
   180 nm – 1999
   130 nm – 2002
   90 nm – 2004
   65 nm – 2006
   45 nm – 2008
   32 nm – 2010
   22 nm – 2012
   14 nm – 2014
   10 nm – 2016
   7 nm  – 2018
   5 nm – 2020

No obstant, la miniaturització té un límit físic que cada vegada està més prop. Amb els mètodes actuals, els transistors poden ser inestables.

Evolució

Els primers ordinadors tenien un disseny exclusiu i adaptat a la necessitat específica per la qual es dissenyava tot l'ordinador. Els programes eren exclusius per a cada maquinari i fets en llenguatge màquina. Inclús dins de la mateixa empresa, els programes fets per a un model no funcionaven en altre.

Com que el programari no era molt extens, aquest desavantatge no era molt important i proporcionava als dissenyadors una gran llibertat per a fer el maquinari més potent estalviant en components electrònics.

Alguns dels avanços dels anys 50:

  • Registres index: Permet generar una direcció de memòria sumant un desplaçament a un registre base.
  • Operands immediats: No cal guardar els operands en registres, algunes instruccions permeten indicar un dels operands en la mateixa instrucció.
  • Detecció d'operacions invalides.

Als anys 60 es va començar a estandarditzar els ordinadors per permetre retrocompatibilitat, al menys dins de la mateixa empresa.

En 1962, IBM va començar a fer ordinadors que pogueren executar el mateix programari encara que el maquinari evolucionara. Per a aconseguir-lo, van inventar el concepte de computadora virtual, la S/360. Tots el programes eren per a aquesta computadora i eren traduïts internament per al processador real. Com que després es traduïa instruccions en microcodi, el llenguatge màquina podia ser molt complex i amb molts modes de direccionament. Es tracta, per tant, d'una arquitectura CISC. (Complex Instruction Set Computer).

Els anys 70 són el principi de la tercera generació de les computadores, la generació de la integració.

En 1971, Intel va fabricar el primer microprocessador, el 4004. És a dir, un sol xip conté totes les parts de la CPU. En 1972, el 8008, amb un joc d'instruccions compatible amb els processadors per a PC actuals. L'ús intensiu de micro-xips va baixar el preu considerablement i va suposar una revolució. El ordenadors més comuns tenien de 4 a 16Kb i processadors de 16 bits.

Es tractaven de processadors CISC, ja que el microcodi era fàcil de guardar en una memòria molt ràpida i eren fàcilment programables al tindre més instruccions i més pròximes al llenguatge natural.

Mentres tant, IBM va continuar amb processadors molt més potents per a Mainframes. De l'ordre de 1MB de RAM, 1MHz i decenes de MB de disc.

A principis dels anys 80, investigadors d'IBM es van adonar que, normalment, sols s'utilitzaven unes poques ordres CISC. Van pensar en que si es reduïen les instruccions seria més fàcil i barat crear nous processadors més ràpids. També es van adonar que la RAM era un coll de botella i que es necessitava augmentar els registres o afegir una memòria intermitja, la cau. El resutlat van ser els processadors RISC Reduced Instruction Set Computers. El processadors RISC tenen poques instruccions, però van més ràpids. A més, internament, tenen una arquitectura Harvard, és a dir, separa la memòria de dades de la de instruccions i poden ser accedides simultàniament.

Els processadors per a servidors i alguns Mainframes comencen a ser RISC.

Els processadors x86 (Intel i AMD) van començar a ser RISC internament oferint un joc d'instruccions CISC.

A final dels 80, s'explota la possibilitat de paral·lelitzar les instruccions en els processadors. Apareix el Pipelining o Segmentació. Que permet executar varies instruccions que es troben en distintes fases d'execució a la vegada. Al mateix temps es pensa en utilitzar vaires ALUs per a executar instruccions que no tinguen interdependències a la vegada. Açò es anomenat arquitectura Superescalar. A partir d'aquest moment, és important la capacitat dels programes per a poder ser paralel·litzats.

En alguns casos, les següents instruccions depenen d'una instrucció anterior. Per exemple, si es compleix una condició. Els processadors que poden anar executant les instruccions posteriors, han de preveure els dos casos. Per tant, hi ha una predicció de ramificacions o branch prediction. I, posteriorment, fer una execució especulativa que serà descartada si no s'ha triat la branca d'execució correcta.

Per optimitzar la segmentació i l'arquitectura superescalar, també apareix el concepte d'execució fora de l'ordre (out-of-order). Que reordena les instruccions per a millorar el paral·lelisme.

Tots aquests avanços permeten als processadors CISC actuar com els RISC i poden executar inclús més de 12 instruccions per cicle, quant normalment eren més de 12 cicles per instrucció en els CISC purs.

A partir dels anys 90 van aparèixer noves optimitzacions al mateix temps que la mida dels transistors disminuïa considerablement i la freqüència augmentava.

Algunes tecnologies, com la Very long instruction word o la Explicitly parallel instruction computing eren, tal vegada, massa complicades per als programadors i per al disseny dels processadors. Alguns com el Intel Itanium no van triomfar com es pensava.

Va aparèixer el multithreading, que perment executar varis fils com si tinguerem més d'un processador aprofitant l'arquitectura superescalar i la segmentació. D'aquesta manera, per al sistema operatiu i les aplicacions, es compta amb més d'un nucli.

Més tard van fer aparició el processadors amb més d'un nucli o multi-core. En el que cada nucli és una CPU i comparteixen part de la cau. Tot en el mateix encapsulat.

Els processadors de PC van canviar a 64 bits impulsats per AMD i la seua arquitectura AMD64.

La capacitat d'integració permet actualment integrar el northbridge al mateix encapsulat, targeta gràfica inclosa. És el cas de la majoria dels iX de Intel o les APUs de AMD.

Actualment els processadors cada vegada integren més components, és el cas dels SoC (System on a Chip) dels telèfons mòbils, tables i altres sistemes menuts.

Microprocessadors de PC

Els microprocessadors de PC són CPUs molt complexes ja que tenen que funcionar bé en una gran varietat de funcionalitats. Actualment són molt potents i consumeixen poca potència.

L'estàndard sobre el que s'han construït tots aquests anys és el joc d'instruccions x86, del processador 8086 i 8088.

Prehistòria

Abans de parlar els processadors en el PC tal com el coneguem, cal mencionar els precursors.

4004 Intel (1971)

Aquenst va ser el primer microprocessador integrat de la història. Fins a aquests moments, el circuits integrats existien, però per a fer un processador calia muntar molts d'ells en una placa.

El Intel 4004 va ser un encarreg per a fer calculadores. El client, Busicom, volia el de sempre, però Federico Faggin, un empleat de Intel, va pensar que seria millor fer un únic circuit integrat multipropòsit. Va ser un èxit quant altres fabricants va poder aprofitar-lo per a màquines molt distintes.

El 4004 era poc potent, sols tenia 4 bits de bus de dades i podia direccionar fins a 640 bytes de memòria. La seua velocitat inicial era de 108KHz i va arribar a 740KHz.

8008 Intel (1972)

El 8008 ja tenia 8 bits de transferència i podia direccionar fins a 16KB. LA seua velocitat inicial eren 200KHz. Era un processador per a calculadores i terminals. Era un poc més lent que el 4004, però al poder accedir a més memòria i manipular 8 bits feia que fora molt més ràpid.

Les instruccions del 8008 van formar part de l'estàndar x86.

La década dels 70 va ser la de la implantació del circuit integrat en tots els ordinadors. La competència i la fabricació en masa va baixar els preus. Van apareixer molts minicomputadors de 16 bits i fins a 64KB de RAM.

8080 Intel (1974)

2MHz, 8bits, 64KB de RAM. Va se considerat el primer microprocessador realment utilitzable. Molts fabricants van produir 8080, entre ells, AMD.

Tenía un encapsulat més gran i, pre tant, podia tindre un bus de 16 bits per a direccions de memòria i un de 8 per a les dades. Comptava amb 7 registres de 8 bits, 6 dels quals es podien combinar en per fer registres de 16 bits. Els altres registres eren un punter de pila de 16 bits i un comptador de programa de 16 bits.

Tenia 256 ports de E/S. No utilitzava el mapeig de memòria, com es fa actualment. Alliberava memòria, però requeria instruccions especials de E/S.

Z80 Zilog (1975)

Es tracta d'una versió millorada del 8080. Més capaç i més ràpid que el Intel, va aconseguir un gran èxit en els primers microcomputadors.

Es tracta d'un dels processadors amb més èxit de la història. S'han fet moltes versions posteriors i encara s'utilitza en molts dispositius. Moltes de les consoles dels 90 el tenien instal·lat. Ha arribat a tindre 3.8MHz.

8085 Intel (1977)

Compatible amb el 8080, aquest necessitava menys suport de hardware per a funcionar. No va tindre molta popularitat perquè va ser superat per el Z80.

MOS 6502 MOS Technology (1976)

Era la CPU més barata de l'època. Tenia un preu de uns 25$ front als 179$ del 8080. Amés, era més ràpid que ells. Va ser un processador molt popular per ser utilitzat en els Apple II, Atari 2600, Nintendo NES i en el Commodore.

La seua velocitat inicial era de 1MHz, un poc més lent que els competidors. Però realment anava més ràpid, ja que era un processador pipelined o segmentat. Això vol dir que anava fent varies instruccions al mateix temps al dividir les seues fases. Els competidors eren CISC microprogramats que utilitzaven més cicles per instrucció. Els processadors no tenien multiplicador, per tant, tota la circuiteria anava a la velocitat de la CPU. El 6502 era més lent en MHz i, per tant, necessitava una circuiteria més lenta i més barata.

Era un processador amb molt pocs registres. La memòria RAM era més ràpida que el processador. Per tant, la utilitzava per als registres.


8086 Intel (1978)

El van fer compatible amb els 8008 i 8080. Però el joc d'instruccions va ser ampliat i millorat considerablement. Un de les millores més importants va ser el suport complet al processament amb 16 bits.

La herència del 8086 és el joc d'instruccions bàsic. De fet el 286, 386, 486 i posteriors són compatibles amb ell.

El processador 8086 tenía 20 bits de direcció i podia direccionar fins 1MB. La seua velocitat era de 5MHz a 10MHz. No tenia instruccions de coma flotant. Per tant, necessitava d'un coprocesador matemàtic, en aquest cas el 8087.

Era un processador molt potent però molt car i no va tindre gran èxit comercial.

8088 Intel (1979)

Era una versió retallada del 8086 i més barat. Aquest tenia el bus de dades de 8 bits.

És el processador utilitzat per IBM per al seu primer PC.

IBM PC

Els primer IBM PC va eixir amb el processador 8088 de Intel. Aquest tenía fins 1MB de memòria, 640KB per aplicacions i 384 per al sistema operatiu. En Aquest cas el PC DOS.

Anem a repasar els processadors posteriors per a PC:

80186 i 80188, Intel (1982)

Es tracta de versions millorades del 8086 i 8088.

Integraven DMA, tenien un controlador de interrupcions, i més instruccions. Va arrivar a tindre 6MHz.

Les millores anaven dirigides a reduir la necessitat de circuit externs al processador.

No va ser molt utilitzat en PC, però es va integrar com a processadors empotrats.

80286, Intel (1982)

El 80286 es caracteritza per el seu funcionament en mode real o protegit. Al entrar en mode protegit (si el SO es capaç) permet multiprocés i protecció de memòria, amés de memòria virtual. Quant el processador està en mode protegit, no deixa als programes executar instruccions del mode real.

El bus de dades és de 16 bits i el de direccions de 24 bits. D'aquesta manera es poden direccionar fins a 16MB de RAM.

Amplia el joc d'instruccions del 8086 en 25 més. Té 8 modes de direccionament i en mode virtual pot accedir fins 1GB. Va arribar a tindre de 6MHz a 25MHz.

La quantitat de cicles per instrucció va ser millorada. Es necessiten 4,5 de mitja i la instrucció més llarga té 29 cicles (206 la més llarga del 8086).

Va ser el processador del IBM Personal Computer/AT en 1984.

Un dels problemes més importants és que no podia passar de mode protegit a real sense un reinici. Es van fer instruccions de BIOS per a provocar un reinici sols del processador. Però el rendiment baixava molt. Aquest problema va provocar crítiques de Microsoft, ja que era impossible córrer varies aplicacions en Windows sobre MS/DOS.

80386, Intel (1985)

El 386 va ser el primer de 32 bits. Tenia un bus de 32 bits per a dades i el bus de direccions també era de 32bits. Per tant, era teòricament capaç de direccionar fins 4GB de RAM.

Comptava amb 3 modes de funcionament:

  • Mode Real compatible amb 8086
  • Mode protegit fins a 4GB.
  • Mode virtual 8086. Que permet varis programes 8086 en mode real en un entorn protegit.

A diferència del 286, aquest podia fer el canvi de mode sense reiniciar.

La seua velocitat va ser de 12 a 40 MHz.

Millorava la MMU per a permetre una millor gestió de de les pàgines i permetia fer sistemes operatius amb memòria virtual.

Els canvis en el joc d'instruccions des del 386 han sigut mínims i és molt fàcil adaptar un programa més modern per a funcionar en aquests processadors. Per això, el joc d'instruccions es considera un estàndard, el IA-32. Va eixir una variant, el 386SX amb 16 bits de bus que el fa més lent i més barat.

Van eixir varis processadors compatibles d'altres marques. Entre ells el AMD386, pràcticament un clon més barat i més ràpid.

80486, Intel (1989)

El 486 junta en un sol xip el 386 i el coprocessador matemàtic 80387, amés d'una memòria cau de 8KB.

El 486 executa les instruccions en mode ràfega o pipeline. Per això baixa 2 cicles per instrucció. El 486 a la mateixa velocitat, té un rendiment de més del doble que el 386.

La seua velocitat va anar de 16 a 100MHz.

Introdueix també la multiplicació de la freqüència de la placa. Per tal de no tindre que fer plaques mès ràpides, el que fa es fer que el processador tinga una velocitat muĺtiplo de la de la placa. Aquest va més ràpid però continuen sincronitzades. En el cas del 486, se duplicava o triplicava la velocitat del bus.

La variant DX2 duplicava la freqüència del sistema i tenia 32KB de cau L1.

S'han fabricat processadors 486 fins el 2007.

AMD 486 (1993)

Intel dominava el mercat i AMD fabricava processadors compatibles amb l'estàndard que marcava Intel.

Així i tot, alguns AMD 486 tenien millor rendiment que els de Intel a un preu menor.

Pentium, Intel (1993)

La novetat principal del Pentium és la microarquitectura P5 amb funcionament superescalar. Això vol dir que pot anar executant varies instruccions a la vegada. No es tracta de varis nuclis complets, però pot tindre unitats funcionals duplicades. No és el mateix que el pipeline, però normalment van junts. De fet, el Pentium té dos pipelines de sencers i una unitat de coma flotant més potent. Amés, dos nivells de cau. La L1 amb 8KB per a codi i 8KB per a dades i la L2 de 512KB

Amb velocitats de bus de 50MHz a 66MHz, la velocitat del Pentium multiplicava aquestes arribant a ser de 60MHz a 300MHz.

La primera generació dels Pentium eren massa grans i consumien molt. La segona generació va millorar açò en 1994. Aquesta segona generació tenia un voltatge de 3.3v.

K5, AMD (1996)

El K5 era compatible amb el socket del Pentium.

El disseny era molt ambiciós, paregut al del Pentium Pro. Encara que el rendiment era similar al del Pentium.

La seua arquitectura era un RISC paral·lelitzat en el interior amb una interfície x86. Les característiques eren molt avançades però tenia alguns problemes que no permetien donar tot el potencial a la nova arquitectura.

Pentium-MMX, Intel (1997)

La velocitat del MMX arribava a ser de 233MHz. Però la veritable millora era la introducció del joc d'instruccions MMX. Aquest joc d'instruccions estaven preparades per a millorar els càlculs en aplicacions multimèdia per a la descodificació del àudio i vídeo o els jocs. Amés, duplicava fins els 32KB la cau L1.


Sexta generació

La sexta generació de Intel, P6 o i686 va ser introduïda per el Pentium Pro en 1995. Es tracta de l'arquitectura de referència fins el Pentium III i Pentium M i més endavant per als Intel Core.

Les característiques d'aquesta generació són:

  • Execució dinàmica: És el nom que Intel posa a l'execució especulativa i execució fora d'ordre.
    • Execució especulativa: Tècnica d'optimització en la que el processador realitza alguna tasca que pot no ser realment necessària. La idea principal és fer la feina abans que se sàpiga si serà necessària, a fi d'evitar un retard que hauria de ser efectuats per fer la feina després que se sàpiga si cal. Si resulta que la feina no era necessària després de tot, els canvis realitzats pel treball es reverteixen i els resultats temporals emmagatzemats s'ignoren. Per encertar el que fa és una predicció de salt múltiple.
    • Execució fora d'ordre: (OoOE o Ooe) En aquest paradigma, un processador executa les instruccions en un ordre governat per la disponibilitat de dades d'entrada, en lloc de per la seva ordre original en un programa. D'aquesta manera, el processador pot evitar estar inactiu mentre es recuperen les dades per a la següent instrucció en un programa.
Aquesta execució sols es pot fer en les instruccions que no depenen del resultat d'altres. Amés, l'eficiència del programes passa a dependre de la manera en que s'ha programat a banda de l'algoritme i la velocitat de procés. A partir d'aquest moment, la decisió entre un processador o un altre és molt més complicada, ja que no es pot mesurar tan fàcilment com en MHz, ample del bus o mida de la cau.
  • Millora el pipeline. En Pentium tenia 5 fases i passa a tindre fins a 14 en Pentium III.
  • Dual Independent Bus: Un bus per al sistema i un altre per a la cau.
    • Front-side bus: Per a connectar amb la memòria i xip-set.
    • Back-side bus: Per a la cau L2.
  • Millora de l'arquitectura superescalar.
  • Microinstruccions: El processador per dins és com un RISC i per fora les instruccions són com un CISC. Aquestes microinstruccions poden ser ordenades i executades paral·lelament per aconseguir les millores mencionades anteriorment.


Pentium Pro, Intel (1995)

El primer microprocessador de la sexta generació. La intenció era que reemplaçara al Pentium i el Pentium-MMX. Però va quedar relegat a PCs de alta gama, servidors i supercomputadors.

És el primer processador de Intel amb execució out-of-order i el primer realment preparat per a servidors. Va ser un precursor de la gama Intel Xeon. Tenia implementat suport per a SMP o (arquitectura UMA) per a 4 sockets.

En aquell moment, el mercat dels servidors estava dominat per arquitectures RISC com el Sparc de Sun. Però el Pentium Pro va marcar un punt de decadència d'aquestes arquitectures front al x86.

Pentium II, Intel (1997)

Al igual que el Pro, el Pentium II era de l'arquitectura P6. En quasi tot menys en la cau L2 era millor que el Pentium Pro. Aquest si va tindre un éxit comercial.

En quant a les característiques:

  • De 233 a 450MHz.
  • FSB de 66 a 100MHz.
  • Instruccions IA-32, MMX.
  • cau L2 separada del processador amb el back-side bus i amb la meitat de velocitat que el processador. (El Pentium Pro la tenia dins i era de la mateixa velocitat)

El Pentium II va tindre dos branques:

  • Celeron: Per als equips de gama baixa. Aquest tenia menys o res de cau L2.
  • Xeon: Per als servidors. Amb fins a 2048KB de L2, diferent socket i suport multiprocés simètric, és a dir per a estar en ordinadors amb més d'un processador.

Ficar la cau L2 fora del microprocessador i empaquetar-lo en un slot el van fer més barat que el Pro. Les instruccions MMX i la retrocompatibilitat amb millores en les instruccions de 16 bits orientaven al Pentium II al mercat domèstic on va tindre moltes vendes.

K6, AMD (1997)

Era compatible amb plaques Pentium, tenia un gran rendiment i era molt més barat que els processadors de Intel. Va tindre, per tant, una gran acceptació comercial.

Es tracta d'un processador amb tecnología superescalar i amb execució dinàmica. 64KB de cau L1 i fins a 256KB de L2.

La alternativa a les instruccions MMX de Intel va ser l'anomenat 3DNow!

Pentium III, Intel (1999)

En realitat no va ser una gran evolució front al Pentium II. Sols van afegir el joc d'instruccions SSE amb més instruccions multimèdia i de coma flotant.

Va integrar la cau L2. La velocitat era de 400MHz a 1GHz amb velocitats de FSB de 100 a 133MHz.

De manera similar al PII, va tindre una versió Celeron i una Xeon.

Athlon, AMD (1999)

En aquest moment, AMD tenia ja sockets propis.

El Athlon és el primer microporcessador en superar 1GHz de velocitat i va ser un dur competidor per als Intel Pentium III.

El FSB tenia una freqüència de 100 o 133MHz, però podia fer dos transferències per cicle. Per tant era com si tinguera 200MHz de velocitat. El seu bus de dades era de 64 bits.

Va tindre una versió barata anomenada Duron.

Pentium IV, Intel (2000)

El Pentium IV implementava la séptima generació de microarquitectures de Intel. Anomenada NetBurst, aquesta arquitectura anava a succeir a la P6 per les nombroses millores tecnològiques. No obstant, el preu i el consum elèctric van fer reprendre la P6 per als processadors posteriors.

NetBurst proporcionava:

  • FSB de 800MHz per a una transferència de 6,2GB/s amb memòries DDR2.
  • Hiper Pipeline amb 20 passos. Encara que incrementa els errors de predicció, permet tindre instruccions més curtes i augmentar la velocitat del cicle de rellotge. Amés, Intel va millorar la fiabilitat de les prediccions un 33% front al PIII.
  • Rapid Execution Engine: Dos ALUs que anaven al doble de velocitat que el rellotge. De 3.8GHZ a 7.6GHZ internament.
  • Hyperthreading: Gràcies a l'arquitectura superescalar, el processador simula tindre 2 nuclis en un sol nucli. El SO pot planificar en eixos dos nuclis i millora la multiprogramació i l'aprofitament del processador.

NetBurst no va poder passar del 3.8GHz sense consumir massa electricitat. Amés, era complicat de escalar en funcionalitats sense consumir més llum. Els primers PIV en codis no optimitzats eren més lents que el PIII a mateixa freqüència de rellotge.

El Pentium VI va estar en el mercat des de 2000 fins 2008 i tenia de 1,3GHz a 3,8GHZ. Va ser un èxit comercial encara que la competència de AMD era molt dura en aquells anys. Va incorporar jocs d'instruccions nous com el SS2 i SS3.

La versió Prescott en 2004 va millorar el rendiment considerablement. Alguns van incorporar la computació en 64 bits adaptant les instruccions dels AMD64.

Els Pentium D van ser PIV amb 2 nuclis.

Athlon XP, AMD (2001)

En quant a velocitat era menor que el P IV, però el seu rendiment comparat al preu era superior. No obstant, la tecnología de Intel era superior i el Pentium IV va tindre molt més èxit.

El FSB era de 266 a 333MT/s.

Tenía el joc d'isntruccions multimèdia 3DNow! professional, que era compatible amb SSE.

La seua versió de baix cost era el Sempron.

Pentium M, Intel

Donat que els Pentium IV consumien molta electricitat per al rendiment, per a portatils es va fer el Pentium M basat en la microarquitectura P6 del PIII incorporant SSE2, les millores en el FSB i la predicció del PIV.

Pentium M no tenia tanta freqüència de rellotge, però ho compensava amb més cau L2 però de menor consum elèctric. El consum elèctric de la L2 i del processador es regulava segons la demanda per no gastar tant quant no era necessari.

En principi va ser sols per a portatils, però alguns fabricants van fer plaques base compatibles.

Athlon 64, AMD (2003)

L'arquitectura K8 de AMD va ser la primera en fer processadors per a PC de 64 bits. El rendiment teòric era molt major, però Windows XP no era de 64 bits i fins el Windows Vista la gent no va veure la necessitat dels 64 bits. Les aplicacions van tardar més en aprofitar aquest nou ample de paraula. D'aquesta manera, AMD va adelantar a Intel i va ser Intel, posteriorment el que adaptara les instruccions AMD per als seus de 64 bits.

La seua velocitat anava de 1GHz a 3,2GHz. Tenia una cau L2 de fins 1MB. Comptava a una tecnologia anomenada Cool'n'Quiet que reduïa la velocitat i el voltatge al processador si no estava gastant-se.

El FSB va se substituït per el que ells anomenaven HyperTransport.

Comptava amb instruccions SSE2.

Tenia una versió més potent, el Athlon 64 FX.

La seua versió per a servidors era el Opteron. Amb els 64 bits, els Opteron eren una dura competència per a Intel en el mercat dels servidors, on ja feia temps existien sistemes operatius de 64 bits.

Phenon, AMD (2007)

Basat en l'aquitectura K10, el Phenon era un processador de alt rendiment de AMD. El Phenon Quad va ser considerat el primer processador amb 4 nuclis reals en el mateix encapsulat.

Hi había de 3 i 4 nuclis (X3 i X4). Els de 2 s'anomenaven Athlon Dual-Core o Single-Core.

En 2008 van traurer el Phenon II amb suport DDR3, 6MB de cau i fins a 6 nuclis.

Intel Core

Diferències entre l'arquitectura Westmere (Evolució de Nehalem), Sandy Bridge i Interlagos (arquitectura dels AMD Opteron amb nuclis Bulldozer)

Es tracta de la familia de processadors de Intel actual per a portatils i PC.

Està basat en el Pentium M que és microarquitectura P6.

Els seus processadors són: Intel Core i7, Intel Core i5, Intel Core i3, Intel Core 2 Solo, Intel Core 2 Duo, Intel Core 2 Quad, Intel Core 2 Extreme lines.

Els Core Solo i Core Duo tenen arquitectura yohan. Són millores del Pentium M. El que fan és incorporar SSE3, més velocitat de FSB, 2MB de cau L2 i pipelines de 12 passos. Amés, els Core Duo tenen 2 nuclis amb la L2 compartida.

Els Core Duo i Solo són el primers processadors del canvi de Apple a processadors Intel en el MacBook Pro i el Mac Mini.

Els Intel Core 2 Solo, Core 2 Duo i Core 2 Quad són la evolució en 64 bits del Core. Aquests suporten Intel 64 o x86-64, un joc d'instruccions adaptat dels AMD64. Els Core 2 tenen molt poc de consum, treballen a 64 bits i tenen 6MB de cau L2.

Els Core 2 Duo tenen versions Celeron o Dual Core amb funcionalitats deshabilitades i més barats.

El Xeon 32xx y 33xx són molt pareguts als Core 2 Quad.

Les versions Core 2 Extreme estaven pensats per a l'overcloking.

Core iX

A partir de 2008 va aparèixer un altra manera de classificar alguns processadors Intel Core.

La nomenclatura no indica res técnic:

  • i3 per a baix rendiment
  • i5 per a mig rendiment
  • i7 per a alt rendiment

Aquests processadors tenen un altra manera de anomenar al FSB. Ara li diuen QPI.

En la majoria dels casos tenen integrat el Northbridge, inclosa la GPU en el mateix processador. Les plaques base que els suporten no tenen un xip per al Northbridge.

Tenen 256 KB de cau L2 per nucli i fins a 12MB de L3.

Dins d'aquesta nomeclatura han anat millorant l'arquitectura. Aqueste són les generacions dels iX:

  • Nehalem (2007):
    • Succesor directe del Intel Core.
    • Fabricació a 45nm.
    • Reintrodueix el Hyper-Treading.
    • Redueix la cau L2 a 256KB ampliant la L3, compartida per tots els nuclis. La L1 queda a 64KB.
    • Millora la predicció de ramificacions.
    • QPI en els models més potents sense GPU. DMI en els que tenen GPU.
    • PCI-E, controladors de memòria i DMI per eliminar els Northbridge en models intermedis.
    • Segona generació del Intel Virtualization Technology.
    • SSE4.2
  • Sandy Bridge (2009):
    • 32 nm.
    • La cau L3 compartida conté el controlador gràfic en els models de socket 1155.
    • Millores en operacions matemàtiques i de xifrat.
    • Fins a 8 nuclis físics o 16 lògics amb Hyper-threading.
    • Integració total dins del mateix integrat del controlador gràfic.
    • de 14 a 19 passos per al pipeline.
    • Joc d'istruccions AVX
    • Està considerada com una nova arquitectura independent a partir de la P6 i les millores més sofisticades de la generació 7 representada pel Pentium 4.
  • Ivy Bridge (2011):
    • 22nm.
    • 50% meny de consum elèctric.
    • Suport per a PCI-E 3.0
    • Més velocitat de transferència en RAM.
    • Millora considerable en la GPU i suport del 4K.
  • Haswell:
    • Xipset Intel 8 i 9.
    • Suport per a DDR4 en alguns.
    • Versió per a dispositius mòbils.
    • Més instruccions (AVX2).
    • Millora substancial de l'execució fora d'ordre
    • Menys consum elèctric quant està a l'espera i mès quant està funcionant a tota potència.

AMD Accelerated Processing Unit (2011)

AMD Fusion és la denominació comercial d'una família de microprocessadors d'AMD, que destaquen per integrar processadors multi-nucli amb potents gràfiques integrades en un sol circuit integrat. El destacat rendiment gràfic (per tractar-se d'una gràfica integrada) és resultant de la fusió amb ATI, especialitzada en processadors gràfics o GPUs. La principal novetat que aquesta gamma de processadors promet oferir és un sistema multicore heterogeni, amb nuclis de procés especialitzats per a cada tasca. És evident que una de les especialitzacions és el processament gràfic, la descodificació per hardware (MPEG2 o MP3, per exemple) i l'acceleració 2D i 3D.

Es tracta de l'arquitectura anomenada Llano i Brazos (per a baix consum). La segon generació era Trinity i Brazos-2. La última generació Kaveri per als potents i Kavini i Temash per als de baix consum.

Les consoles Play Station 4 i Xbox One tenen una versió especial de la tercera generació.

Més envadant van passar de ser Fusion a Heterogeneous System Architecture (HSA). La idea d'aquesta HSA és fer processadors amb nuclis de CPU i de GPU amb recursos compartits i fàcilment accessibles als programadors.

De les característiques, algunes de les més destacades són:

  • Millora notable del paral·lelisme, sobretot en la tercera generació amn l'anomenat Steamroller Arquitecture.
  • Capacitat per a poder programar en C++ amb instruccions de GPU per aprofitar la potència combinada.
  • La GPU pot accedir a tota la memòria.
  • La CPU i la GPU comparteixen les mateixes direccions de memòria i poden compartir punters.
  • La GPU pot canviar de context per compartir la seua potència entre varis programes.

Els nuclis estan fets amb les anomenades microarquitectures Bobcat en la primera generació. En la segona piledriver i en la tercera generació estan la microarquitectura Steamroller per als de gran rendiment i la Jaguar per als de baix consum.

AMD FX (2011)

Es tracta de la família de CPU sense GPU integrada de AMD. Són molt potents, poden arribar als 5GHz i tindre 8 nuclis. No obstant, no poden superar als i7 més potents encara. No obstant, són una aproximació i possiblement en el bon camí i han apostat per un canvi radical respecte a Intel. Mentre que els Intel Core intenten ser els que més rendiment tinguen en un sol fil, els AMD aposten per el nombre de nuclis, encara que cada nucli no siga tant potent. Al compartir la memòria cau i la FPU entre dos cores, els móduls poden ser més menuts. D'aquesta manera es pot competir en procés paral·lel.

Els nuclis són més menuts i més simples, per això també poden tindre freqüències més altes, encara que el consum elèctric augmenta.

Tots els AMD FX estan desbloquejats per a l'overclocking.

Els AMD FX tenen dos microarquitectures:

  • Bulldozer:
    • Succesora de la K10 i dissenyada des de 0.
    • Suporta totes les instruccions de Intel i algunes més proposades per AMD.
    • Aquesta arquitectura introdueix el concepte de Mòdul, que és com un processador de dos nuclis per a sencers o un nucli per a coma flotant. Cada nucli del mòdul comparteix les primeres fases d'instrucció, les FPU i la cau L2 amb la resta del mòdul. Aquesta solució teòricament simplifica el disseny i permet més potència sense tant de consum elèctric.
    • 2MB de L2 per mòdule.
    • Cada mòdul té 2 Integer Clusters que poden fer 4 operacions en sencers per cicle.
    • Els mòduls comparteixen la cau L3 entre ells.
  • Piledriver:
    • Mateixa arquitectura que Bulldozer.
    • Millor predicció.
    • Menys consum elèctric.
    • Millores en el IPC (Instructions Per Clock).
    • TurboCore 3.0.
    • Un rendiment entre un 15% i un 30% més que el Bulldozer.
  • Steamroller:
    • Apareix a principi de 2014.
    • Millor paral·lelisme.
    • Millor predicció de branques.
    • Més memòria cau i més intel·ligent.
    • Memòria cau L2 redimensionable dinàmicament.
    • Millor controlador de memòria.
    • 30% més de IPC (instruccions per cicle) respecte a Bulldozer.
    • Més freqüència però menys consum.

Atom, Intel (2008)

Atom és el nom comercial del processadors de baix consum per a dispossitus menuts i portàtils.

Van soldats a la placa base i no es poden canviar. Tampoc es poden comprar per separat.

No tots els Atom poden executar codi de 64 bits. Els que poden, necessiten suport per la BIOS. Per tant, depèn de la placa base. El suport per a Windows de 64 bits no està totalment aconseguit.

Processadors Intel per a PC (2014)

És complicat concretar el catáleg de processadors en un any concret. Molts no són mencionats en la web oficial de Intel, però estan en els catàlegs de moltes tendes. Alguns processadors de gama baixa tenen classificacions confuses per part dels assembladors. Però anem a fer un repás dels més importants:

Intel Pentium Dual Core

Són els processadors de gama baixa de Intel. Tenen l'arquitectura Sandy Bridge o Ivi Bridge, però tenen les prestacions retallades respecte als i3. No tenen HyperTheading, algunes instruccions i la gràfica és menys potent.

Estan fets per als sockets 1155 com els iX Sandy Bridge.

Els noms són:

  • G6xx o G8xx per als Sandy Bridge.
  • G2xxx per als Ivy Bridge.

En alguns casos no els nombren Dual Core.

Intel Pentium G3XXX

Són els Pentium basats en els i3 de la generació Haswell. El socket és el 1150.

Tenen 2 nuclis i no tener Hyperthreading.

Intel Celeron

Encara més barats que els Pentium, el Celeron tenen menys cau, menys velocitat amb la RAM i pitjor gràfica.

Estan basats també en les arquitectures Sandy, Ivy i Haswell.

Els noms són:

  • G5xx o G4xx per als Sandy Bridge.
  • G16xx per als Ivy.
  • G18xx per als Haswell.

i3

Són processadors suficientment potents per a ofimàtica, Internet i jugadors poc exigents.

Tenen 2 nuclis físics, HyperThreading i fins a 3,5GHz i 4MB de cau. La gràfica és la Intel HD 4400 o la 4600.

i5

Processadors potents per a quasi totes les aplicacions. Són suficients per a jugar si van amb una bona gràfica i RAM.

Compten amb 4 nuclis físics, 6MB de cau i la tecnología TurboBoost, que accelera un nucli quant aquest demana més potència.

Es pot dir que són la opció inteligent si vols potència a un preu raonable.

i7

Són els processadors més potents de Intel i, alguns, el més potents del mercat per a PC.

Amb 4 nuclis físics i Hyperthreading, tenen 8 fils virtuals.

Arriben a tindre 4GHz i 8 MB de cau.

i7 Extreme

Els processadors Extreme tenen el socket 2011 perquè no tenen la gràfica integrada.

Tenen fins a 15MB de cau i 6 nuclis.

Els més potents tenen preus al voltant de 1000€.


Processadors AMD per a PC (2014)

AMD FX

Processadors sense GPU, molt potents i amb socket AM3+.

AMD APUS A-Series

Processadors amb una potent gràfica integrada. Socket FM2+.

Se divideixen en 4 categories: A4, A6, A8, A10. La diferència està en el número de nuclis, la potència de la gràfica i la cau.

Alguns més antics tenen socket FM2 i són més barats.

AMD APUs Athlon

Processadors més barats amb gràfica integrada. Tenen 4 nuclis i un cosum moderat. Són una opció interessant per a equips barats.

El socket és el AM1. Encara que parega més antic, el AM1 és prou nou, encara que per a PC low-cost.

AMD APUs Sempron

Processadors molt barats amb especificacions modestes. Encara i tot, tenen 2 o 4 nuclis i gràfica integrada. Poden ser una opció interessant per a un PC de ofimàtica.

Socket AM1.

AMD CPU Athlon II

Processadors sense gràfica integrada, 2, 3 o 4 nuclis i un preu molt competitiu. Poden ser una bona opció per a jocs si van amb una targeta gràfica acceptable. Alguns tenen desbloquejat el overclocking i poden tindre un rendiment similar a altres més cars.

Els models tenen de nom: X2-xxx, X3-xxx o X4-xxx depenguent dels nuclis.

AMD Athlon i Sempron CPU

Processadors obsolets amb baix consum, preu baix i no molta disponibilitat en 2014. Per preus pareguts tens ja el Athlon II o els APUs Athlon.

Socket AM2 i AM3.

Sockets

Intel

Els primers processadors per a PC tenien un encapsulat DIP (Dual in-line package). En concret, el 8086 tenía un DIP de 40 pins. Molt prompte van tindre que pensar un altre tipus de encapsulat per la gran quantitat de pins necessaris i per la dificultat de substitució del DIP.

El 80186, 80286 i 80386 ja teníen un encapsulat PGA o PLCC de 68 pins i de 132 en el cas del 386.

Nom Encapsulat Processadors Característiques Notes
Socket 1 PGA 169 pins. 486 SX, DX, DX2 i Overdrive 33MHz de bus. 5V El primer socket amb un nom oficial.
Socket 2 PGA 238 pins. 486 a 66MHz (multiplicador). 33MHz de FSB. 5v Fins a 40MHz no necessita ventiladors. A 66MHz necessita un disipador pasiu.
Socket 3 PGA 237 pins. 486 a 3.3V Primer socket per a 3.3v
Socket 4 PGA 273 pins. Primers Pentium a 5 Volts. 60 a 66MHz de bus.
Socket 5 SPGA 320 pins Pentium a 3.3V.
Socket 7 SPGA 321 pins Pentium MMX, AMD i Cyrix Voltage regulator mode
Socket 8 CPGA 387 pins Pentium Pro FSB de 60 a 66MHz Sols per a Pentium Pro
Slot 1 Slot de 242 contactes Pentium II i III FSB de 60 a 133MHz La CPU i la cau no estan en el mateix xip, redueix el preu de fabricació. És més difícil de trencat els pins.
Slot 2 Slot de 330 contactes Pentium II Xeon FSB a 100-133MHZ
Socket 370 PGA-ZIF de 370 pins Pentium III i Celeron. 66, 100 i 133MHZ Subtitut del Slot 1
Socket 423 PGA-ZIF 423 pins Pentium 4 Willamette FSB de 400MT/s Va tindre una curta vida per no poder suportar més de 2GHz
Socket 478 PGA-ZIF 478 pins Pentium 4 i Celeron FSB a 400, 533 i 800 MT/s Creat per a competir amb el Socket A d'AMD.
Socket LGA 775 LGA 775 contactes Pentium 4 Prescott, Cedar Mill, Pentium D, Core 2 Duo, Core 2 Quad. FSB de 133MHz (533MT/s) a 400MHz (1600MT/s) El primer LGA que permet més pins amb menys perill de trencar un.
Socket LGA 1156 LGA 1156 contactes Intel Pentium, Celeron Core iX Lynnfield i Clarkdale. Al integrar el northbridge, no es pot parlar de FSB. Aquest socket es connecta directament amb: x16 PCI-E 2.0, DMI per a comunicar-se amb el Platform Controller Hub PCH (Antic xipset southbridge) amb PCI-E x4. FDI amb dos DisplayPort, 2 canals per a DDR3-1066 a DDR3-1333. Integra el northbridge en el processador. Ja no hi ha FSB. Xipset Intel H55, H57, P55 i Q57.
Socket LGA 1366 LGA 1366 contactes. Intel Core i7 9xx, Xeon i Celeron P1053 Intel QuickPath. x1 i x2 Aquest no té totes les funcions del northbridge integrades. Es connecta a ell per al QPI. Sols per als processadors d'alta gama. Xipset X58
Socket LGA 1155 LGA 1155 connectors Intel Core iX Sandy Bridge , Ivy Bridge DMI Reemplaç del 1156 per a processadors amb northbridge integrat. Xipsets: Sandy bridge: B65, H61, Q67, H67, P67, Z68 Ivy bridge: Z75, Z77, H77, Q75, Q77, B75
Socket LGA 2011 LGA 2011 contactes Core i7 Sandy Bridge-E, Ivy Bridge-E i Haswell-E, Xeon E5-16xx/26xx QPI i DMI. 4 canals DDR3 Reemplaç per al 1366. Xipset X79, C602, C604, C606, C608
Socket LGA 1150 LGA 1150 Core iX Haswell i BroadWell DMI Disipadors compatibles amb 1155 i 1156. Xipset: H81, B85, Q85, Q87, H87, Z87, H97 i Z97

AMD

AMD no va tindre el seu primer socket fins els AMD K6

Nom Encapsulat Processadors Característiques Notes
Super 7 SPGA 321 pins AMD K5/K6 Nous xipsets. De 66 a 100MHz. Soporta micros fins 500MHz. AGP. Ulta DMA
Slot A Slot 242 contactes. AMD Athlon fins a 1000MHz FSB a 100MHz Mecanicament compatible, però no electricament amb el Slot 1 de Intel. D'aquesta manera els fabricants sols tenien que fabricar un tipus d'Slot.
Socket A PGA-ZIF 462 pins Athlon, Duron Athlon XP, Sempron FSB 100-200MHz a doble trasferència per cicle -> 400MT/s
Socket 754 PGA-ZIF 754 pins Athlon 64, Sempron, Turion 64 FSB de 200-800MHz, Hypertransport, sense suport per a Dual Channel. Primer socket per a processador de 64 bits per a PC.
Socket 939 PGA-ZIF 939 pins Athlon 64, Athlon 64 FX, Alguns Opteron i Sempron. FSB de 200 a 1000MHz amb Hypertransport i Dual Channel DDR.
Socket AM2 PGA-ZIF 940 pins. Athlon 64, X2, FX, Opteron, Sempron, Phenon. 1GHZ Hypertransport 2.0, DDR2 Compatible amb 939.
Socket AM2+ PGA-ZIF 940 pins. Athlon 64, X2, FX, II, Opteron, Phenon, Phenon II. Hypertransport 3.0 a més de 2.6GHz, Millores en el comsum eléctric. Compatible amb AM2.
Socket AM3 PGA-ZIF 941 contactes en la placa i 938 en la CPU. Phenon II, Athlon II, Sempron i Opteron Hypertransport 3.0, suport per a DDR3. Hi han plaques hibrides per a suportat AM2+ o AM3 amb memòria DDR2 o DDR3 segons el processador.
Socket FM1 PGA-ZIF 905 pins Primers APUs A-series Llano. UMI (Unified Media Interface) per a connectar amb el FCH, (similar al DMI de Intel) més de 5,2GT/s Preparat per als APUs de AMD, que integren la GPU dins del processador.
Socket AM3+ PGA-ZIF 942, (938 en la CPU) Phenon II, Athlon II, FX. Bulldozer Hypertransport 3.1 més de 3.2GHz, Millor regulació de potència. Compatible amb AM3 modificant la BIOS.
Socket FM2 PGA-ZIF 904 pins. APUs Trinity i Richland, Athlon X2 i X4
Socket FM2+ µPGA-ZIF 906 pins APUs Kaveri i Carizzo

Microprocessadors SmartPhones

Altres dispositius

Enllaços