Forschungsbericht 2012 - Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG)

Cloud-Dienste für die Wissenschaft

Cloud services for scientists

Autoren
Yahyapour, Ramin; Wieder, Philipp
Abteilungen

Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen

Zusammenfassung
Cloud-Dienste finden zunehmend Verwendung in der Wissenschaft und bieten ihren Nutzern Vorteile wie dynamische Verfügbarkeit, Skalierbarkeit und Nutzungskontrolle. Auch die GWDG stellt den Instituten der Max-Planck-Gesellschaft gegenwärtig bereits Cloud-Lösungen für den vielfältigen Einsatz im wissenschaftlichen Alltag bereit und forscht parallel an der innovativen Weiterentwicklung solcher Dienste. Beispielhaft werden hier GWDG Cloud Share für Datenaustausch und -synchronisation sowie GWDG Compute Cloud zur flexiblen Bereitstellung von virtuellen Servern und damit Rechenleistung vorgestellt.
Summary
Cloud-based services are increasingly used for scientific application scenarios as they offer benefits like elasticity, scalability and measured service usage. GWDG already offer a selection of cloud services to support the institutes of the Max Planck Society, among which are GWDG Cloud Share providing data sharing and synchronization, and GWDG Compute Cloud offering virtual server capabilities. In addition, GWDG participates in various research and development projects to advance and complement existing services.

1. Einleitung

Cloud Computing hat sich in den letzten Jahren zu einem der wesentlichen neuen Paradigmen der Informationsverarbeitung entwickelt. Durch Cloud-Dienste vereinfacht sich der Zugriff auf entfernte Infrastruktur- oder Software-Ressourcen, zudem erlauben Selbstbedienungsfunktionen, die Dienste vom Betrieb der dahinterliegenden IT-Systeme zu entkoppeln. Dadurch können Nutzer sehr kurzfristig, dynamisch und frei skalierbar Dienste verwenden, ohne die Komplexität der Infrastruktur berücksichtigen zu müssen. Als Basis des Cloud Computing findet man daher zunehmend die Commoditization of IT, die durch Standardisierung, Skaleneffekte und eine umfassende Automation eine besonders hohe Kosteneffizienz bietet, die im klassischen IT-Betrieb kaum erreichbar ist. Gegen die Verwendung von Cloud-Diensten sprechen dagegen häufig die Anforderungen aus dem Datenschutz, die vom Großteil der Anbiete nur eingeschränkt und unzureichend erfüllt werden. Nutzer von Cloud-Diensten müssen sich bezüglich dieser und anderer Dienstgüteanforderungen typischerweise den Vorgaben des Anbieters unterwerfen und haben kaum Einfluss auf die Ausgestaltung der Rahmenbedingungen.

Ziel dieses Beitrages ist es, den Begriff des Cloud Computing greifbar zu machen und in Bezug zu den wissenschaftlichen Anforderungen an die Informationsverarbeitung zu setzen. Zudem werden einige Cloud-Dienste, wie sie von der Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG) für die Max-Planck-Gesellschaft angeboten werden, beschrieben. Abgerundet wird der Beitrag durch die Einführung einer Reihe aktueller Forschungsfragen, welche zukünftige Cloud-basierte Lösungen und Dienste zur Unterstützung der Wissenschaft motivieren.

2. Begriffliche Abgrenzung

Eine eindeutige Definition des Begriffs „Cloud Computing“ ist nicht möglich und auch nicht zielführend. Wie häufig bei der begrifflichen Abgrenzung einzelner Konzepte der IT hängt die Definition vom Bezugssystem ab. Es hat sich daher eingebürgert, in Publikationen und Projekten eine bestimmte Definition als Grundlage zu nehmen und die eigene Arbeit in Bezug dazu zu setzen. Hierbei wird insbesondere die Cloud-Computing-Definition des National Institute of Standards and Technology (NIST), einer US-Amerikanischen Standardisierungsorganisation, häufig referenziert [1]. Das NIST nennt fünf charakteristische Eigenschaften, die Cloud-Dienste ausmachen, sowie drei Arten von Modellen zur Diensterbringung. Demnach zeichnen sich Cloud-Dienste durch (i) bedarfsgerechte Abrufmechanismen für den Nutzer (on-demand self-service), (ii) Netzwerkzugriff (broad network access), (iii) provider-seitige Ressourcenbündelung (resource pooling), (iv) Elastizität (rapid elasticity) und (v) Nutzungskontrolle (measured service) aus. Ein solcher Cloud-Dienst lässt sich dann, je nach erbrachter Funktion, entweder als Infrastructure-as-a-Service (IaaS), Platform-as-a-Service (PaaS) oder Software-as-a-Service (SaaS) klassifizieren. Abbildung 1 ordnet beispielhaft einige Dienste den drei Klassen zu. Bekannte Anbieter für Cloud-Dienste sind Amazon mit EC2 oder S2 auf Infrastrukturebene [Amazon Web Services: http://aws.amazon.com/de], Google mit der App Engine auf Plattformebene [Google App Engine: https://cloud.google.com] und salesforce.com mit seiner CRM-Software [Sales Cloud: http://salesforce.com].

3. Cloud-Dienste für die Wissenschaft

Um den Wissenschaftlerinnern und Wissenschaftlern der Max-Planck-Gesellschaft die Vorteile von Cloud-Lösungen bieten zu können, stellt die GWDG Cloud-Dienste zur Verfügung und arbeitet parallel im Bereich der Forschung an der innovativen Weiterentwicklung solcher Dienste. Hierbei bleiben die verarbeiteten Daten innerhalb der GWDG-Rechenzentren und können damit den Datenschutzanforderungen der Max-Planck-Gesellschaft unterworfen werden. Gegenwärtig betreibt die GWDG bereits Cloud-Dienste für Datenaustausch und -synchronisation (GWDG Cloud Share: http://www.gwdg.de/cloud-share) und für das Hosting von virtuellen Servern (GWDG Compute Cloud: http://www.gwdg.de/compute-cloud), welche im Folgenden vorgestellt werden.

3.1 Datenaustausch und -synchronisation

GWDG Cloud Share ist ein Dienst für Datenaustausch und -synchronisation. Der Dienst ist einfach, schnell und sicher mittels einer entsprechenden Klienten-Software oder über eine Weboberfläche zu nutzen. Die Einsatzmöglichkeiten sind vielfältig, vor allem im Bereich des immer weiter verbreiteten mobilen Arbeitens. Dazu gehören insbesondere das Synchronisieren von Dateien zwischen verschiedenen Geräten, zum Beispiel dem PC am Arbeitsplatz und dem Laptop unterwegs. Ebenso erlaubt der Dienst kollaboratives Arbeiten mehrerer Benutzer an einer oder mehreren Dateien oder kann als Alternative zum Versand großer E-Mail-Anhänge genutzt werden. Die benötigten Daten sind durch diesen Dienst jederzeit und von jedem Ort per Internetverbindung nutzbar. Das Arbeiten an den so synchronisierten Dateien ist zudem auch offline möglich; Änderungen werden dann beim nächsten „Online-Gang“ übertragen beziehungsweise empfangen. Der Dienst wird gesichert im Rechenzentrum der GWDG betrieben und alle Daten werden auf eigenen Datenspeichern bei der GWDG gesichert. Damit wird den gängigen Datenschutzanforderungen Rechnung getragen, insbesondere bezüglich der wissenschaftlichen Nutzung.

3.2 Virtuelle Server

Die GWDG Compute Cloud stellt Nutzern virtuelle Server und damit Rechenleistung zur Verfügung. Wissenschaftler, IT-Administratoren oder Projektverantwortliche können auf diesem Weg Server über ein Selbstbedienungsportal entsprechend ihrem jeweiligen Bedarf einrichten und individuell konfigurieren (Abb. 2). Dabei kann zwischen mehreren Betriebssystemen und verschiedenen Größen von virtuellen Maschinen gewählt werden; das Starten der Server dauert nur wenige Sekunden. Des Weiteren können Nutzer selbst Netzwerk- und Firewall-Einstellungen konfigurieren, über den Browser auf die Server zugreifen, die aktuelle Serverauslastung überwachen und den eigenen Ressourcenverbrauch kontrollieren. Dadurch kann beispielsweise die Leistung eines Servers an den eigentlichen Verbrauch angepasst oder aber der virtuelle Server nach Beendigung eines Projektes abgeschaltet werden. Generell ist die Anschaffung eigener Hardware nicht notwendig, da die virtuellen Server in vollem Umfang per Netzzugriff verwaltet und genutzt werden können. Somit entfällt nutzerseitig die Notwendigkeit, regelmäßig aktuelle Server zu erwerben, da dies seitens der GWDG für die Nutzer transparent umgesetzt wird.

4. Forschungsthemen

Auch wenn eine Reihe von Cloud-Diensten, wie beispielsweise die oben genannten, Wissenschaftlern und Projekten bereits zur Verfügung steht, so ist deren Potenzial bei weitem noch nicht ausgeschöpft. Das betrifft einerseits die mögliche Nutzung von Cloud-basierten Technologien in neuen Anwendungsfällen und andererseits die Schaffung völlig neuer Dienste, die sich an spezielle wissenschaftliche Communities richten. Hier setzt eine Reihe nationaler und europäischer Forschungs- und Entwicklungsvorhaben an und schafft neue Infrastrukturen und Dienste. Beispielhaft sei hier das europäische Projekt PaaSage [PaaSage: Model-based Cloud Platform Upperware: https://paasage.ercim.eu/] aus dem 7. Rahmenprogramm genannt. Es hat mit Beteiligung der GWDG eine Cloud-Plattform entwickelt und Methoden erforscht, die es erlauben werden, Anwendungen auf der Basis von Cloud-Diensten mittels einer abstrakten Sprache zu beschreiben und möglichst automatisiert auszuführen und zu überwachen.

Ein wichtiger Aspekt derartiger Automatisierung ist die Integration der Cloud-Dienste in das übergreifende Management der IT-Dienste einer Einrichtung oder eines Projektes, das sogenannte IT service management (ITSM). Ein essentieller Bestandteil jeder ITSM-Lösung sind Dienstgütevereinbarungen zwischen dem Anbieter und dem Nutzer eines Dienstes, die sogenannten service-level agreements (SLAs), welche unter anderem die Anforderungen beschreiben, die an einen Dienst gestellt werden. In Bezug auf Clouds ergibt sich hier eine Reihe von Forschungsfragen, die beispielsweise die formale Beschreibung von SLAs oder deren automatische Verhandlung betreffen, an deren Beantwortung die GWDG mitarbeitet [2].

Ausblick

Betrachtet man die Entwicklung des Marktes für Cloud-Dienste, so ist das Angebot bereits heute so divers, dass es zunehmend schwierig wird, sämtliche Anbieter, Portfolios und Preise allein für eine Klasse von Diensten zu überblicken. Allerdings wird der Begriff Cloud gegenwärtig in steigendem Maße inflationär verwendet. Daher ist anzunehmen, dass er bei zunehmender Anzahl von Diensten, die der Definition des NIST genügen, in den Hintergrund rückt und die eigentliche Funktion eines Dienstes wieder in den Vordergrund treten wird.

Die GWDG wird das existierende Dienstangebot kontinuierlich auswerten und durch eigene Forschungs- und Entwicklungsanstrengungen die typischen, bisher noch generischen Cloud-Angebote an die wissenschaftlichen Erfordernisse anpassen und weiterentwickeln. So ist bereits absehbar, dass diese Dienste aufgrund der zunehmend daten- und rechenintensiven Forschung andere Leistungsmerkmale benötigen werden, als dies bei kommerziellen Angeboten der Fall ist. Die GWDG ist hierzu an mehreren Forschungsprojekten beteiligt, in denen unter anderem an der Integration und Anpassung von Cloud-Diensten in domänen-spezifische, virtuelle Forschungsumgebungen gearbeitet wird. Ein weiterer Schwerpunkt findet sich in einer für den Wissenschaftler einfach nutzbaren Integration von verschiedenen Cloud-Diensten zu einer Lösung für das Forschungsdatenmanagement. Auch hier gilt es, umfassende Anforderungen zur Vernetzung, Kollaboration und Nachnutzung von Informationen zu bedienen und gleichzeitig verlässliche Dienste für die Wissenschaft bereitzustellen.

Literaturhinweise

Mell, Peter; Grance, Timothy
The NIST definition of cloud computing
NIST Special Publication 800-145, National Institute of Standards and Technology, Gaithersburg, 2011
Wieder, P.; Butler, J. M.; Theilmann, W.; Yahyapour, R. (eds.)
Service level agreements for cloud computing
Springer New York, 2011. ISBN: 978-1-4614-1613-5
Zur Redakteursansicht