El Procesador intel Celeron se ha vuelto bastante popular para los usuarios domésticos de PC. La razón para este incremento de ventas se debe a su coste relativamente bajo. Intel tomó la decisión de reducir los costes de los procesadores ( lo que redujo en consecuencia los precios de lo PC) realizando algunos cambios en su familias ya existentes de procesadores . Recuerde que los Chips Pentium Standart tenían 32kb de caché L1 y 512 Kb de caché L2, la caché de tipo 2 era caro, así que tiene sentido que si se reduce su tamaño, se reduce el costo del procesador, eso es lo que hizo intel. El procesador celeron se encuentra con velocidades que van de 300 Mhz a 550-650 Mhz ( que funcionan a un bus de 66 Mhz y aun tienen 32 Kb de caché L1, pero estos procesadores integran en caché L2 solamente 128 Kb. Aunque esto supone una reducción muy drástica en el tamaño de la caché L2, la elección de precio es muy apetecible para los compradores que buscan ahorrar dinero al comprar un PC nuevo.
Como intel intentó que resultara difícil acelerar los relojes para llevar a los pentium II , PIII por encima de sus velocidades marcadas. El Celeron se convirtió en el favorito para los defensores de esta práctica. Si la técnica de overclocking falla, resulta mucho menos traumático quemar una CPU barata que un PIII o un P4, mucho más caros.
Intel lanzó su procesador Pentium III con un bombardeo publicitario que costará olvidar. Pero ¿ se merecía el nuevo chip tanta publicidad ? Vamos a verlo.
En primer lugar, las velocidades que ofrecía el Pentium 2 eran más elevadas que ninguna de las que había ofrecido antes Intel. Comenzando a partir de 450-550 Mhz y llegando a 1 Ghz, los chips Pentium II también incluían la tecnología MMX y (típicamente) 512 KB de caché L2. pero más alla del incremento de velocidad, ¿ era algo significativo? Bueno, el punto fuerte de Pentium II residía en su capacidad para procesar gráficos más rápidos ¿ se acuerda de MMX? y el Pentium II mejoró el procesamiento con 70 instrucciones MMX ! Estas nuevas instrucciones estaban diseñadas para el vídeo en tiempo real, los flujos de vídeo, prestaciones mejoradas de gráficos.
Es importante comprender que las diferencias entre una PII y un PIII están principalmente en la velocidad ( la línea del PII se detuvo en los 450 Mhz.) y las 70 instrucciones adicionales ya comentadas. En cuanto al resto, el PIII se insertaba directamente en un zócalo de PII como una sustitución en la placa base , al igual que el Xeon II/III las instrucciones adicionales incluidas resultan útiles en áreas específicas: flujo de contenidos trasmitido desde Internet, el rendimiento de un PIII es de 10 y 15 mayor que el PII en las áreas en que cuenta este conjunto de instrucciones.
No obstante, el Pentium II no es lineal, realmente hay dos tipos de pentium III. El original estaba basado en la misma tecnología que el Pentium II. Pero con esas instrucciones adicionales. En 1999 sobrevino un cambio con la arquitectura Coppermine de intel. Que reemplazaba los conectores tradicionales con cobre, alteraba el proceso utilizado para fabricar los chips de 0.25 micras al de 0.18 micras, además ofrecía un bus de sistema a 133 Mhz (el original era de 100 Mhz ), al igual que 256Kb de Cahé L2 integrada que funcionaba a la misma velocidad que el propio procesador. Una diferencia importante con coppermine es que finalmente conseguiría soportar AGP 4X , lo que era crítico para avanzar en el rendimiento del vídeo. Antes de esto el vídeo estaba limitado a 1X- 2X, lo que resultaba muy poco para permitir que AGP animara
a los jugadores ansiosos que necesitaban vídeo a gran velocidad.
El pentium 4 es el primer diseño de procesador realmente novedoso de intel desde que apareció el Pentium Pro a menos de 200 Mhz. Los procesadores Pentium Pro, Pentium II, Xeon y Celeron estaban todos ellos basados en la misma microarquitectura P6. Intel añadió algunas cosas como MMX, SSE, y caché integrada a lo largo de los años, y modifico el modo en que se fabricaban los procesadores, pero todos tenían el mismo diseño básico.
El P4 está basado en la radicalmente nueva arquitectura NetBurst de intel, y es algo completamente diferente. Recuerde que la microarquitectura P6 llegaba hasta aproximadamente 1Ghz; para sobrepasar la barrera de 1 Ghz, la microarquitectura Netburst del Pentium 4 está diseñada para funcionar comodamente a grandes frecuencias de reloj. No solo eso, si no que además los ingenieros de intel tenían que sortear otro obstáculo con este diseño. Si Netburst va a tener que estar presente tantos años como P6 lo ha hecho. necesitará proporcionar ventajas de rendimiento sustanciales a medida que pasen los años y se incrementan las frecuencias de reloj. Así que la escalabilidad tenia que formar parte del orden del día.
La filosofia de diseño de intel proporciona a la microarquitectura NetBurst un caracter distintivo. Por ejemplo, el rendimiento de reloj a reloj , o el número de instrucciones por reloj ( instrucciones per clock, IPC) que el chip puede procesar deberia ser relaltivamente bajo, Pero las velocidades de reloj son muy altas .
Los pentium añaden una caché de seguimiento de ejecución . Los procesadores X86 contemporáneos como PIII y el Athlon descomponen las instrucciones X86 en operaciones más pequeñas antes de procesarlas. ( Intel llama a eso micro-ops.) Esta práctica permite que los procesadores X86 tengan un diseño más parecido ARISC, pero la decodificación de instrucciones X86 necesita un tiempo. La caché de seguimiento de ejecución de NetBurst sustituye a la caché L1 de instrucciones convencional, y almacena micro-operaciones en lugar de instrucciones X86. Intel resulta evasiva acerca del tamaño exacto de la caché de seguimiento , pero dice que puede almacenar más de 12,000 micro-operaciones.
Más pequeño significa más rápido. El Pentium4 incorpora una pequeña caché L1 de datos de baja latencia. Con sólo 8KB, la caché L1 de datos de NetBurst tiene la mitad de tamaño que la Pentium III, y sólo una fracción del tamaño de la caché de datos de 64 Kb del Athlon de AMD, Intel ha escogido este pequeño tamaño de caché por que memorias caché más pequeñas presentan latencias menores. Mientras que las cachés de datos de Athlon y PIII tienen una latencia de tres ciclos , la latencia de la caché de los P4 es de dos ciclos. Todo forma parte del plan de alimentar bien las vias de instrucciones.
La caché L2 del Pentium 4 es de 256 Kb, al igual que la Athlon y PIII, pero es mucho, mucho más fría. La interfaz de caché L2 del P4 es de un tamaño de 256 bits, y envia datos en cada ciclo de reloj. En un Pentium 4 a 1.4 GHz, eso funciona con un ancho de banda de 44.8 Gb por segundo. Eso supone casi cuatro veces más ancho de banda que la caché L2 de PentiumIII a 1Ghz. En cuanto al Athlon, su caché L2 es incluso más lenta, pero he oido como los ingenieros de AMD dicen que la caché L2 del Athlon no está realmente limitada en cuanto al ancho de banda. Sea como sea, la caché L2 de Pentium 4 es terriblemente rápida.
El bus Net Burst envia datos cuatro veces por ciclo de reloj, así que escuchará hablar a mucha gente sobre que es ün bus de 400Mhz". También nos seguiremos refiriendo a ella como a un bus cuadruplicado de 100 Mhz.
Intel ha añadido un conjunto de 144 nuevas instrucciones al Pentium 4, apodado SSE2, Como las extensiones originales de flujo SIMD (Streaming SIMD Extensions,SSE, SSE2 implica ejecutar simultáneamente una única instrucción sobre múltiples datos (single instruccion on multiple data, SIMD). Aún más importante SSE" maneja operaciones matemáticas de 128 bits, de coma flotante de precisión doble. La habilidad de manejar números de coma flotante más precisos hace de SSE" la llave para acelerar una gran cantidad de tareas multimedia, 3D de ingeniería, y del tipo de las que realiza una estación de trabajo (una vez que el software se haya optimizado adecuadamente para aprovecharse de ello).
La unidad de coma flotante del Pentiu 4 no es tan capaz como la FPU de PentiumII, y es un poco menos potente que la FPU del Athlon y es un poco menos potente que la FPU del Athlon. Por decirlo llanamente, la FPU del P4 no puede realizar tanto trabajo al mismo tiempo , y en algunos casos presenta latencias mayores. Los programas optimizados para SSE2 serán capaces de evitar la FPU en muchos casos, pero sin ninguna optimización especial , el P4 lo pasará mal tratando de reralizar los cálculos. Vistas en su conjunto, estas decisiones de diseño resultan realmente radicales.a profundidad de las vias del P4, combinada con su FPU no demasiado maravillosa.