Fraunhofer-Gesellschaft

Publica

Hier finden Sie wissenschaftliche Publikationen aus den Fraunhofer-Instituten.

Cluster basiertes Rendern mit verteilten Frame Buffern

 
: Benz, M.
: Knuth, M.; Fuhrmann, A.

Darmstadt, 2005, 76 S.
Darmstadt, TU, Dipl.-Arb., 2005
Deutsch
Diplomarbeit
Fraunhofer IGD ()
large model visualization (LMV); clustering; multi-thread rendering; parallel processing

Abstract
Im Laufe der letzten Jahrzehnte sind die Anforderungen an die Graphische Datenverarbeitung rasant gestiegen. Darzustellende Objekte werden zunehmend detaillierter und komplexer um eine immer genauere Simulation der Realität auf dem Bildschirm zu erreichen. Mit Hilfe von Laser Scannern wurden bereits Modelle mit mehr als 300 Millionen Dreiecken generiert. Das entspricht einer Datenmenge von ungefähr 3.7 Gigabyte.
Auf einem einzelnen Rechner lässt sich eine solche Datenmenge gar nicht oder nur sehr schwer visualisieren. Aus diesem Grunde bietet es sich an, zur Visualisierung ein Clustersystem zu verwenden. Solche Systeme haben einen hohen Kosten/Nutzen Faktor und stellen eine günstige Alternative zu vergleichbaren Großrechnern dar.
Es gibt verschiedene Ziele die man bei der parallelen Bildberechnung anstreben kann. Uns war es wichtig mit niedrigen Vorberechnungszeiten auszukommen und trotzdem eine hohe Bildwiederholrate zu erreichen. Darzustellende Objekte sollten sich zusätzlich animieren und deformieren lassen.
In dieser Arbeit werden nun verschiedene Ansätze zur parallelen Bildberechnung vorgestellt und analysiert. Es wird weiterhin ein Rechenmodell für sequentielle Sort-Last Systeme entwickelt, womit sich eine obere Schranke für die möglichen Bildwiederholraten berechnen lässt. Zudem stelle ich zwei Erweiterungen für den Binary Swap Algorithmus vor. Dabei handelt es sich erstens um eine weitere Möglichkeit der Parallelisierung des Algorithmus, und zweitens um adaptive Lastverteilung.
Aus diesen Beobachtungen heraus wurde ein Framework entwickelt, womit sich die einzelnen Algorithmen vergleichen und bewerten lassen. Dabei wurde besonders Wert auf die Widerverwendbarkeit und Erweiterbarkeit des Systems gelegt. Zudem wurden verschiedene Erweiterungen der Graphikkarten benutzt um das System weiter zu beschleunigen.

 

In the course of the last decades the requirements to computer graphics visualization rose rapidly. Models and Objects increased in detail and complexity to cope with the demand of realism in simulations. Today it is possible to generate huge models consisting of more than 300 Million triangles, with the help of laser scanners. The storage requirements for such a large object is roughly 3.7 Gigabyte.
On an individual computer it is nearly impossible to visualize a model which consists of that much triangles. For this reason it is more feasible to use a cluster of PCs for visualization. In our approach we use a ‚COTS' Cluster of PCs connected via Gigabit Ethernet. COTS stands for Commodity of the shelf. The advantage of a COTS Cluster compared to a specialized mainframe computer is, that it's cheaper and more versatile. In spite of that, both systems have roughly the same computing power if the program on the cluster is carefully implemented. Therefore a cluster of PCs has a better cost/use factor than a comparable mainframe computer.
There are many goals one can aim at in parallel image composition. We strive for very small precomputation times and a high frame rate. It should be possible to deform and animate objects in the scene. Therefore we did not use Out-Of-Core Algorithms due to their high precomputation time. We concentrated on Sort-First, Sort-Middle and Sort-Last systems.
In this work different approaches to parallel image composition are analyzed and evaluated. Further a computing model for sequential Sort-Last Systems is developed. With this mathematical system upper bounds for possible frame rates can be computed. Furthermore i present two extensions to the standard Binary Swap algorithm. The first one is a new parallelization approach (e.g. overlapping different stages of the algorithm), the second one is adaptive load balancing.
From the theoretical observations a framework was developed, which provides an easy way of comparing the different algorithms. The emphasis was put on reusability and extendability. Several graphic card hardware extensions were used in the implementation to further speed up the implementation.

: http://publica.fraunhofer.de/dokumente/N-35340.html