Fehlende L1-Cache-Eigenschaft

436
user2551229

Ich schrieb ein einfaches Programm (mit Hilfe von Igor Ostrovskys Artikel "Galerie der Prozessor-Cache-Effekte"), das die Cache-Ebenen in meinem Prozessor untersuchen soll. Laut Coreinfo, das von Microsoft bereitgestellt wird, verfügt mein Prozessor über folgende Cache-Ebenen:

+------------------------+---------------+----------+-------------+ | *- Data Cache 0 | Level 1 32 KB | Assoc 8 | LineSize 64 | | *- Instruction Cache 0 | Level 1 32 KB | Assoc 8 | LineSize 64 | | -* Data Cache 1 | Level 1 32 KB | Assoc 8 | LineSize 64 | | -* Instruction Cache 1 | Level 1 32 KB | Assoc 8 | LineSize 64 | | ** Unified Cache 0 | Level 2 3 MB | Assoc 12 | LineSize 64 | +------------------------+---------------+----------+-------------+ 

aber wenn ich renne:

#include <vector> #include <iostream> #include <omp.h>  int main(int argc, char* argv[]) { int sz = 256; for (size_t s = 0; s < 18; s++) { std::vector<int> arr(sz, sz); int steps = 64 * 1024 * 1024; double start = omp_get_wtime(); for (int i = 0; i < steps; i++) { arr[(i * 16) % arr.size()]++; } double end = omp_get_wtime(); std::cout << "size: " << (4 * sz) / 1024 << "KB\t\t"; std::cout << "avg time: " << (end - start)*1000000000 / steps << "ns" << std::endl; sz *= 2; } } 

Ich erhalte folgende Ausgabe:

size: 1KB avg time: 4.36752ns size: 2KB avg time: 4.27807ns size: 4KB avg time: 4.19745ns size: 8KB avg time: 3.93159ns size: 16KB avg time: 3.95425ns size: 32KB avg time: 3.88134ns size: 64KB avg time: 3.8112ns size: 128KB avg time: 3.60893ns size: 256KB avg time: 3.61895ns size: 512KB avg time: 3.62264ns size: 1024KB avg time: 3.63614ns size: 2048KB avg time: 4.34382ns size: 4096KB avg time: 24.5113ns size: 8192KB avg time: 28.271ns size: 16384KB avg time: 28.1093ns size: 32768KB avg time: 28.3462ns size: 65536KB avg time: 28.2305ns size: 131072KB avg time: 28.4871ns 

Ein plötzlicher Anstieg der Zugriffszeit zwischen 2048 KB und 4096 KB ist aufgrund des L2-3-MB-Caches offensichtlich. Aber warum sehe ich keine ähnliche Steigerung zwischen 32 KB und 64 KB aufgrund von L1 32 KB Cache? Meine Prozessor-Spezifikation: Link

2
Da Sie scheinbar nur einen konstanten 64-Bit-Schritt verwenden, sollte der Hardware-Prefetcher schnell trainiert werden und Cacheblöcke genau vorauslesen. Paul A. Clayton vor 9 Jahren 0

0 Antworten auf die Frage