Dies könnte ein bisschen zu viel Leistung für das sein, was Sie versuchen, aber ich würde mir Intels Xeon Phi ansehen.
Hier sind einige Hintergrundinformationen zum Gerät
Die Mikroarchitektur von Larrabee (in Entwicklung seit 2006) führte sehr breite (512 Bit) SIMD-Einheiten in ein auf x86-Architektur basierendes Prozessordesign ein, das auf ein Cache-kohärentes Multiprozessorsystem erweitert wurde, das über einen Ringbus mit dem Speicher verbunden ist. Jeder Kern konnte 4-fach Multi-Threading ausführen. Aufgrund des Designs, das für GPU sowie für die allgemeine Berechnung vorgesehen ist, enthielten die Larrabee-Chips auch spezielle Hardware für die Texturabtastung. Das Projekt zur Herstellung eines GPU-Einzelhandelsprodukts direkt aus dem Larrabee-Forschungsprojekt wurde im Mai 2010 beendet. Ein weiteres zeitgemäßes Intel-Forschungsprojekt zur Implementierung der x86-Architektur auf einem Multi-Multicore-Prozessor war der "Single Chip Cloud Computer" (Prototyp wurde 2009 eingeführt). ein Design, das ein Cloud-Computing-Computer-Rechenzentrum auf einem einzigen Chip mit mehreren unabhängigen Kernen nachahmt - der Prototypentwurf enthielt 48 Kerne pro Chip mit Hardwareunterstützung für die selektive Frequenz- und Spannungssteuerung der Kerne, um die Energieeffizienz zu maximieren, und enthielt ein Maschennetz für interchip Messaging. Dem Design fehlten Cache-kohärente Kerne und konzentrierten sich auf Prinzipien, die es dem Design ermöglichten, auf viele weitere Kerne zu skalieren. Der Teraflops Research Chip (Prototyp 2007 vorgestellt) war ein experimenteller 80-Core-Chip mit zwei Gleitkommaeinheiten pro Core, der nicht x86, sondern eine 96-Bit-VLIW-Architektur implementierte. Das Projekt untersuchte Intercore-Kommunikationsmethoden und Pro-Chip-Power-Management und erreichte 1,01 TFLOPS bei 3,16 GHz, wodurch 62 W Energie verbraucht wurden.
Intel Xeon Phi-Artikel @ Wikipedia
Es erfüllt die folgenden Anforderungen, die Sie oben angegeben haben
- Läuft Linux
- Verwendet PCI-E als Verbindung
- Alles in einem System
Ich bin nicht zu 100% sicher, dass er den Speicherbus eines anderen bereitgestellten Systems lesen kann, aber ich würde annehmen, dass er in Betracht ziehen kann, dass er hauptsächlich für Rechencluster verwendet wird. Dies scheint ein Merkmal zu sein, das für die Marketingstrategie des Xeon der Schlüssel ist Phi.
Ich sollte erwähnen, dass ich ein ehemaliger Intel-Mitarbeiter bin, aber ich habe keine Verbindung zu Intel oder Dritten, die Intel-Produkte verwenden. Ich bewerbe keine Intel-Produkte aus irgendeinem finanziellen Grund, es klingt einfach so, als ob sie den Spezifikationen für das entsprechen könnten, wonach Sie suchen.