Hinweise zum Ablauf von Promotionsvorhaben, der Struktur einer Dissertation und ihrer Vorabversionen Udo Kelter Dieser Text ist geschrieben für Interessenten an einer Promotion an unserer Fachgruppe. Typischerweise handelt es sich um Personen, die kurz vor der Fertigstellung der Diplomarbeit stehen und die sich fragen, ob sie ein Promotionsvorhaben anschließen sollen. In diesem Text geht es vor allem darum, was eine Dissertation ist, wie man ihre Erstellung - die wesentlichste Leistung in einem Promotionsvorhaben in der Informatik - plant, und welche Risiken bestehen. Fragen dahingehend, warum man überhaupt promovieren sollte und wie sich eine Promotion auf das spätere Berufsleben, Einkommen usw. auswirkt, werden hier nicht detailliert behandelt. Die Promotion ist die höchste formale allgemeine Qualifikation, dies allein ist für viele Grund genug, sie anzustreben. Für bestimmte Berufe (z.B. Hochschullehrer) ist eine Promotion zwingend erforderlich, in der Industrie werden vielfach Leitungspositionen bevorzugt mit Promovierten besetzt, die Karrierechancen steigen also tendenziell. Entscheidend ist aber der jeweils aktuelle Arbeitsmarkt. Ein Promotionsvorhaben dauert meist 4 - 5 Kalenderjahre; so langfristige Prognosen zum Arbeitsmarkt sind sehr unsicher, diesbezügliche Diskussionen sind sehr spekulativ und sollen hier unterbleiben. Man sollte im übrigen nicht alleine wegen der Karrierechancen versuchen zu promovieren. Es muß auf jeden Fall Interesse an der Forschung und der Wille, sich einer Herausforderung zu stellen, vorhanden sein. Merkmale einer Dissertation Eine Dissertation muß eine wissenschaftliche Leistung darstellen. Es muß eine neue Erkenntnis gewonnen werden, es muß sozusagen Wissen geschaffen werden. Von einer [wissenschaftlichen] Diplom- oder Masterarbeit unterscheidet sich eine Dissertation in einem wesentlichen Punkt: - Das Hauptziel einer Diplom- oder Masterarbeit besteht darin zu zeigen, daß man ein umfangreiches und anspruchsvolles Problem unter Verwendung wissenschaftlicher Methoden (also unter Verwendung des Lehrstoffs von Kernvorlesungen, Spezialvorlesungen oder Seminaren, ferner ggf. auf Basis von wenigen wissenschaftlichen Originalpublikationen) lösen kann. Das Thema muß gemäß den Prüfungsordnungen so beschaffen sein, daß es in 6 Monaten (teilweise auch in 4 Monaten) bearbeitet werden kann. Von daher muß bei der Vergabe des Themas eine Projektplanung möglich sein, derzufolge alle notwendigen Arbeitsschritte im gegebenen Zeitrahmen durchführbar sind. - Das Hauptziel einer Dissertation besteht (zumindest in der Informatik und in den Ingenieurwissenschaften) darin, ein bisher offenes Problem zu lösen. Entscheidend ist der wissenschaftliche Beitrag; wie lange man dazu braucht, spielt keine Rolle. Es zählt das Resultat, nicht der Arbeitsaufwand. In der Informatik und in den Ingenieurwissenschaften erfordern leider gute Resultate fast immer viel Arbeit; die Bearbeitungszeiten liegen i.d.R. im Bereich von 3 - 5 Arbeitsjahren. Die Qualität eines Forschungsergebnisses wird typischerweise dadurch nachgewiesen, daß ein Papier darüber auf einer angesehenen (meist internationalen) Konferenz oder in einer Zeitschrift publiziert wird. In manchen Forschergruppen ist dies eine harte Bedingung für die Annahme der Dissertation. Ein derartiges Papier ist ca. 10 - 20 Seiten lang und päsentiert die wichtigsten Resultate der Dissertation in kompakter Form, wobei viele Details und weniger wichtige Nebenaspekte ausgelassen werden. Derartige Papiere können von jedem bei den Konferenzen bzw. Zeitschriften eingereicht werden - es handelt sich also um einen offenen Wettbewerb. Die eingereichten Papiere werden dann von 2 - 4 Fachleuten begutachtet und entweder abgelehnt oder (ggf. mit Änderungsauflagen) angenommen. Eine Dissertation muß explizit klarstellen, welches offene Problem sie löst. Dabei muß durch intensive Diskussion der einschlägigen Literatur - teilweise auch durch Vergleich mit existierenden Systemen - gezeigt werden, daß die vorhandenen Ansätze und Ideen das Problem noch nicht oder nicht in zufriedenstellender Weise lösen. Experte werden Aus dem vorigen Abschnitt folgt unmittelbar, daß ein Promotionskandidat alle für das Thema der Dissertation einschlägigen vorhandenen Lehrinhalte, Problemvarianten, Lösungsansätze und Denkkonzepte kennen muß. Zusammengefaßt muß er ein Experte sein, der auf seinem (notwendigerweise engen) Forschungsgebiet alles Relevante kennt. Das hierfür zu erwerbende Fachwissen geht weit über den Lehrstoff von Stammvorlesungen und Spezialvorlesungen hinaus. Innerhalb des Studiums werden i.d.R. nur sehr wenige wissenschaftliche Originalveröffentlichungen gelesen, und zwar im Rahmen von Hauptseminaren und der Diplomarbeit. Diese sind i.d.R. schon vom Betreuer vorselektiert worden, sowohl hinsichtlich der Lesbarkeit als auch der Relevanz für das zu bearbeitende Problem. In einem Promotionsvorhaben muß eine wesentlich höhere Zahl an Publikationen gelesen werden, typischerweise zwischen 50 - 200 Publikationen, darunter auch komplette Monographien und Dissertationen. Bei praktischen Arbeiten kann es sich auch darum handeln, vorhandene Systeme zu analysieren. Der Arbeitsaufwand hierfür beträgt typischerweise alleine 6 - 12 Arbeitsmonate. Ein ganz entscheidender Unterschied zum Diplomstudium besteht auch darin, daß ein weitaus höherer Grad an Selbständigkeit beim Erwerb dieses Fachwissens erwartet wird. Der betreuende Professor kann aus Zeitgründen nicht bei jedem einzelnen Verständnisproblem helfen. Eingrenzung des Themas der Dissertation Initial ist das Thema der Dissertation meist nur vage vorgegeben. Typischerweise ist in einer bestimmten Frage ein Wissensdefizit, ein Mißstand in der Praxis oder ähnliches Problem erkennbar und ggf. sogar die grobe Richtung klar, in der das Problem gelöst werden kann. Eine erste Arbeitsleistung besteht nun darin, sich den Stand des einschlägigen Wissens, das für dieses Problem relevant ist, komplett zu erarbeiten und dabei das Problem genauer zu analysieren, ferner darzulegen, warum und unter welchen Umständen das bisherige Wissen nicht ausreicht, das Problem zu lösen, und die ersten Lösungsideen zu verfeinern und zu überprüfen. An dieser Stelle ist sehr viel Frustrationstoleranz gefragt, weil man hier immer wieder zu Erkenntnisse wie den folgenden kommt: (a) das Problem ist vielschichtiger und kniffliger als ursprünglich angenommen, so daß neue oder zusätzliche Bedingungen beachtet werden müssen; (b) andere Forscher sind auch nicht dumm und haben schon gute Ideen gehabt; ursprünglich als Beitrag der Dissertation angedachte Ergebnisse sind leider schon publiziert - dies gilt besonders häufig bei grundlegenden Methoden, Techniken, Sprachen usw. - und man muß sich mit verbleibenden, weniger attraktiven Detailfragen beschäftigen; (c) die eigenen ersten Ideen erweisen sich als doch nicht so tragfähig und müssen schlimmstenfalls sogar verworfen werden, man muß nach neuen Lösungen suchen, was im Bereich der praktischen Informatik oft mit Systemarchitekturen und Implementierungsfragen zu tun hat. Infolge dieses Erkenntnisprozesses engt sich meist das Thema der Dissertation auf sehr detaillierte Fragen ein und bewegt sich nicht selten sogar aus dem ursprünglichen Themenzentrum heraus in benachbarte Gebiete. Dieser Forschungsprozeß wird vom betreuenden Hochschullehrer durch regelmäßige Gespräche begleitet, ferner durch Diskussionen mit Kollegen in der Fachgruppe. Diese Diskussionen dienen vor allem dazu, positive wie negative Kommentare zu erhalten. Wegen der wachsenden Komplexität der eigenen Konzepte wird man aber nach einiger Zeit nicht mehr umhin können, diese schriftlich zu fixieren; man kann diese Papiere als Vorstufen bzw. Entwürfe der Dissertation ansehen. Vorstufen von Dissertationen Im Laufe der Zeit habe ich diverse Entwürfe / Vorstufen von Dissertationen zum Lesen bekommen habe (nicht nur ich vermutlich, sondern wohl auch andere Kollegen / Bekannte). Typischerweise dauert es dann (zu) lange, bis ich die Texte gelesen habe. Dies liegt in erster Linie an meinem chronischen Zeitmangel und in zweiter Linie meist auch an den Entwürfen. Die Schwachpunkte der Entwürfe (auch der Dissertationen selbst) liegen zum Teil an Fehlannahmen, wie Dissertationen und ihre Vorstufen gelesen werden und was ein realistisches Ziel einer Vorabdurchsicht sein kann. Diese Fehler sind leicht vermeidbar, die folgenden Abschnitte enthalten einige Tips hierzu. Diese Tips sind kein Algorithmus, man muß also selbst nachdenken und mehrere Entwürfe ausprobieren, und viele Detailentscheidungen bleiben Ermessenssache. Zur Dissertation selbst Fangen wir mit dem Endprodukt an. Nehmen wir an, irgendeinem (potentiellen) Leser erscheint eine Dissertation vom Titel her interessant. Dann gibt es typischerweise 3 Stadien des Lesens einer Dissertation: a. die ersten 5 Minuten zum Lesen der Zusammenfassung: Vorne in einer Dissertation steht IMMER eine ca. 1-seitige Zusammenfassung auf deutsch und englisch, in der die wichtigsten Ziele und Ergebnisse zusammengefaßt werden. Danach sollte ein Leser grob entscheiden können, ob die Arbeit überhaupt in seinem Interessengebiet liegt und etwas subjektiv thematisch Interessantes enthält. Wenn diese Zusammenfassung unklar oder unverständlich ist, gilt das wohl auch für den Rest der Arbeit und man liest sie besser nicht. b. die nächste Stunde (in etwa): in der möchte ein Leser einigermaßen genau erfahren, welches Problem hier bearbeitet wird, wie die wesentliche Lösungsidee aussieht, in welcher Weise der Stand der Technik verbessert wird und ob es sich lohnt, die wertvolle Zeit zu opfern und den ganzen Text (von weit über 100 Seiten) zu lesen. Hierzu sollte ein einleitendes Kapitel mit typischerweise etwa 4000 - 6000 Worten (entspricht 15 - 25 Seiten, je nach Füllungsgrad und Zahl der Bilder) vorhanden sein, die folgendes enthalten: 1. allgemeine Begriffsdefinitionen, Zielsetzungen und Einordnung in die Informatik-Landkarte, 2. eine kompakte Diskussion des Stands der Technik und der aktuellen Probleme bzw. Mängel bisher bekannter Lösungen (mit einigen Referenzen) 3. eine (erweiterte) Zusammenfassung der wesentlichen Ergebnisse (Merkmale der vorgeschlagenen Konzepte, Architekturen, ....) (die angegebene Reihenfolge ist meist die beste, im Detail muß man manchmal etwas abweichen) c. Lesen des Rests der kompletten Werks. Dauer: Tage. Typischer Leser: hat gute Kenntnisse über das Themengebiet. Erläuterungen zu b: b1. die Einordnung: Dissertationen werden fast ausschließlich von anderen Forschern (insb. anderen Promovierenden) gelesen, für die schreibt man sie auch und nicht für Studenten im 5. Semester. Solchen fortgeschrittenen Lesern braucht man nicht mehr zu erklären, was ein DBMS ist oder was die grundlegenden Motivationen der Softwaretechnik sind. Generell sollte im einführenden Kapitel KEIN lehrbuchartig präsentierter Stoff enthalten sein (.. es war einmal eine Softwarekrise ....). Notwendige Definitionen sollte man kurz und knapp einführen, u.U. nur dann, wenn es keine fest etablierte Terminologie auf diesen (Teil-) Gebiet gibt und die Gefahr von Verwechslungen besteht. Ggf. bezieht man seine Terminologie explizit auf Lehrbuch X. Sofern aus irgendwelchen Gründen dennoch eine detaillierte Einführung in die Begriffswelt mit ca. 100 vollständigen Definitionen erforderlich ist, spart man sich diese für Kapitel 2 oder den Anhang auf, verweist hierauf und gibt hier nur die wichtigsten Begriffe an, ggf. nur informell und approximativ. Zur ``Informatik-Landkarte'': Man sollte explizit das Teilgebiet der Informatik (oder die Teilgebiete) benennen, in dem die Forschungsergebnisse liegen. Man kann die Themenklassifikation der ACM Computing Reviews nehmen oder irgendeine andere, allerdings sind die oft zu grob, um das Thema ausreichend exakt einzugrenzen, man muß sich für die genauere Eingrenzung dann selbst was einfallen lassen. Oft gibt es für ein Problem verschiedene Herangehensweisen oder Denkschulen (bspw. die verschiedenen Methoden zur Konstruktion von Syntaxeditoren). Diese haben alle ihre Vor- und Nachteile und ihre Existenzberechtigung; dies sollte aber HIER nicht weitschweifig diskutiert werden, stattdessen verweist man bzgl. einer ausführlichen Diskussion auf spätere Kapitel, passende Übersichtsartikel oder Lehrbücher, listet die wichtigsten Alternativen anhand ihrer Namen oder Merkmale kurz auf, definiert die eigene Auswahl und erläutert ggf. noch die wichtigsten Konsequenzen und Merkmale des Ansatzes. Nachdem man sich so einmal selbst positioniert hat und die wichtigsten Annahmen klargemacht hat, braucht man das anschließend nicht mehr ständig zu wiederholen und neu zu begründen. In dem so geschaffenen Kontext kann man meist die Ziele der Arbeit schon einigermaßen gut verständlich definieren (allerdings noch ohne auf die andere Literatur einzugehen). Manchmal kann man die Ziele erst später sinnvoll beschreiben. b2. Diskussion des Stands der Technik: Hier darf man nicht den Fehler begehen, ein Lehrbuch zu schreiben. Allgemeinwissen kann man weglassen. Ziel dieses Teils ist, auch die Fachleute auf diesem Teilgebiet zu überzeugen, daß das Problem, das man lösen will, mit vorhandenen Techniken nicht ganz bzw. nur mit den Nachteilen X und Y gelöst werden kann. Vorsicht hierbei! (a) anderen bitte nicht zu heftig auf die Füße treten und fair bleiben! (b) diesen Teil solange nur guten Freunden verraten, bis man die Lösung halbwegs fertig hat. Das Erkennen eines Schwachpunkts vorhandener Techniken ist oft eine wesentliche Leistung und das Finden einer Verbesserung ist oft davon kaum zu trennen! Die Maßstäbe, die man bei der Bewertung vorhandener Ansätze anlegt, beruhen natürlich immer auf irgendeiner Art von Anforderungsanalyse. Wenn diese Anforderungen bzw. Maßstäbe nicht offensichtlich klar sind, sollten sie kurz begründet und explizit benannt werden. Wenn sie nicht in kompakter Form begründbar sind, verweist man entweder auf die Literatur oder einen Anhang oder einen internen Bericht und faßt hier nur die wichtigsten Punkte zusammen. Wenn die Analyse der Anforderungen selbst einen wesentlichen Teil der Arbeit darstellt, muß sie sowieso in einem Hauptkapitel (ca. Nr. 3) ausführlich dargestellt werden. Ein weiterer möglicher Fehler ist, andere Ansätze zu sehr im allgemeinen / Abstrakten zu diskutieren. Die Knackpunkte liegen nämlich oft im Detail und man meint, die nicht ansprechen zu können, weil an dieser Stelle noch nicht die zugehörigen zwei Dutzend Definitionen und Voraussetzungen aufgezählt sind. Im Endeffekt wirkt der Text aber auf den Leser so, als ob andere Ansätze mit schwammigen, nicht stichhaltigen Argumenten abgetan würden, überzeugt also nicht (insb. solche Leser, die die anderen Ansätze schon im Detail kennen). Stattdessen lieber Mut zur Argumentationslücke und mit größeren Schritten auf die wirklichen Knackpunkte anderer Ansätze hinsteuern. Eventuell mit Beispielen argumentieren. Detailliertere Diskussionen können im Hauptteil des Textes und dann im passenden Kontext nachgeholt werden (ggf. Vorwärtsverweise dorthin). b3. Die Zusammenfassung der Ergebnisse: Für den Detaillierungsgrad gelten hier die gleichen Bemerkungen wie für die Diskussion anderer Ansätze. Entscheidendes Kriterium sollte immer sein, daß Personen, die auf dem gleichen Gebiet oder in der Nachbarschaft arbeiten, den Eindruck bekommen, daß hier was Spannendes passiert. Schön ist, wenn auch der gemeine Diplom-Informatiker noch verstehen kann, worin der Wert der Arbeit liegt. Auf alle Fälle sollten die Gutachter der Dissertation die entscheidende ``Botschaft'' verstehen. Oft erscheint es knifflig zu entscheiden, wo man den Schwerpunkt setzen will, man hat nämlich mehrere Teilergebnisse, die alle irgendwie wichtig erscheinen. Ursache hierfür kann sein, daß man kein klares Bild von seinen Zielen gehabt und sich auf diversen Nebenkriegsschauplätzen herumgetrieben hat, daran ist man selber schuld! Es ist daher sehr nützlich, möglichst früh eine erste Version der Zusammenfassung der Ergebnisse zu schreiben, damit eventuelle Lücken und Nebenkriegsschauplätze erkannt werden. Hintergrundmaterial Nach dem einleitenden Kapitel ist manchmal ein Kapitel mit der Überschrift ``Hintergrundmaterial'' oder ähnlich sinnvoll, in dem ausführliche Definitionen, Anforderungsauflistungen usw. nachgeholt werden, die nicht in die Einleitung passen, aber auch nicht in den Hauptteil, weil sie keine eigenen Resultate enthalten. Für manche Leser ist dieses Hintergrundmaterial wichtig und unverzichtbar, für andere langweilig. Für die zweite Lesergruppe sollte man ``Umleitungsschilder'' aufstellen (``.... Leser, die bereits mit XYZ vertraut sind, können Kapitel abc überspringen....''). Man kann diese Texte aber auch in Anhänge verschieben. Zum Hauptteil: Eine verbreitete Fehlannahme ist, daß eine Dissertation in einem Zug von vorne bis hinten gelesen wird. Viel eher wird sie in ``Zeitscheiben'' von 2 - 3 Stunden gelesen, zwischen denen Unterbrechungen von mehreren Tagen Dauer liegen können. Extrem hilfreich ist es daher, wenn der Text häppchenweise verstehbar und bewertbar ist. Hierbei hilft vor allem eine geeignete Gliederung. VOR jedem Kapitel sollte eine Definition der Ziele dieses Kapitels stehen, eine Art Fahrplan, damit man weiß, was im nächsten Kapitel auf einen zukommt. Am ENDE jedes Kapitels sollte eine Zusammenfassung der wichtigsten Punkte stehen, zur Selbstkontrolle beim ersten Lesen und als Hilfe bei einem späteren Rückwärtsblättern. Ggf. kann man die Zusammenfassung mit in die Definition der Ziele hineinpacken. Den Schluß der Dissertation (vor den Anhängen) sollte ein Abschnitt ``Zusammenfassung und Ausblick'' bilden. Hier werden noch einmal die wesentlichen Ergebnisse der Arbeit zusammengefaßt und bewertet und verbliebene Lücken bzw. denkbare weiterführende Arbeiten skizziert. Damit indirekt auch gesagt, was in dieser Arbeit NICHT enthalten ist. Zu den Vorabversionen Das typische Szenario sieht so aus: die Richtung der Arbeit liegt mehr oder weniger fest, für einige Kapitel liegt schon ein kompletter Entwurf vor, andere Kapitel sind noch eine Baustelle, weil noch nicht ausformuliert oder weil es sogar noch inhaltlich offene Punkte gibt. An dieser Stelle wären nun ein paar Tips seitens des Betreuers nützlich, wie man bei den offenen Details vorankommt, wo und wie man die Arbeit noch verbessern könnte, wohin man den Schwerpunkt setzen sollte und ob das Ganze überhaupt etwas taugt. Die Frage ist hier allerdings, was hiervon erreichbar ist. - Baustellen kosten mehr Lesezeit als Endprodukt. Eine große Gefahr liegt darin, daß man sich in zweitrangigen Details verheddert. - Eine Diskussion der inhaltlichen Ergebnisse der Arbeit kommt viel zu spät, wenn schon größere Mengen an Text vorliegen. Dann sind nämlich inhaltliche Änderungen kaum noch möglich. Für die inhaltliche Diskussion und Qualitätskontrolle ist das fachgruppeninterne Kolloquium gedacht. Normalerweise sollte man mit dem Ausformulieren erst beginnen, wenn der Inhalt einigermaßen ausgegoren ist. Man wird natürlich viele Notizen vorab anfertigen, sollte diese aber wirklich als Rohmaterial ansehen, bei dem man sich den großen Aufwand spart, daraus einen flüssig lesbaren Text zu machen. Wenn das Ziel einer Vorabdurchsicht sein soll, die groben Linien der Dissertation zu kontrollieren, dann sollte man eine gute Version der folgenden Teile des Endprodukts anfertigen: - die 1-seitige Zusammenfassung - das komplette einführende Kapitel - die Definition der Ziele jedes einzelnen Kapitels, ggf. zusätzlich die Zusammenfassung der Detailergebnisse - eventuell einige zentrale Definitionen / Bilder / Textteile im Detail Das sind insgesamt normalerweise nicht mehr als etwa 10.000 Worte. 3. Der Vorschlag für eine Dissertation Dies ist in gewisser Hinsicht eine extrem frühe Vorabversion, der Vorschlag erfüllt aber andere Zwecke. Der Vorschlag wird in einem Stadium angefertigt, wo das Thema und die Ziele grob festliegen, aber noch wesentliche Ergebnisse der Dissertation fehlen. Er dient primär folgenden Zwecken: - zu prüfen, ob das angedachte Thema tatsächlich tragfähig ist - bei potentiellen Zweitgutachtern anzufragen, ob sie zur Übernahme des Zweitgutachtens bereit sind, und ihnen Gelegenheit zu geben, Kommentare in einem so frühen Stadium zu äußern, daß sie tatsächlich noch in der Arbeit berücksichtigt werden können. Der Vorschlag sollte möglichst einen Umfang von 30 - 50 Seiten nicht überschreiten und folgendes enthalten: - eine Beschreibung der untersuchten Problematik - eine Zusammenstellung und Kurzbeschreibung der einschlägigen Literatur; hier kann, sofern vorhanden, auf vorhandene Lehrbücher und Übersichten verwiesen werden; ca. 5 - 10 besonders relevante Quellen sollten ggf. detaillierter diskutiert werden, beliebige viele weitere nur kurz. - Bewertung der vorhandenen Ansätze / Literatur hinsichtlich der untersuchten Problematik. Alle vorhandenen Ansätze sollten einen signifikanten Nachteil bei der untersuchten Problematik haben. Dieser Abschnitt sollte inhaltlich äquivalent zum o.g. Abschnitt der Dissertation ``b2. Diskussion des Stands der Technik'' sein. - Versuch einer Vorschau auf die zu erzielenden Resultate. Hellsehen kann natürlich niemand, aber Pläne sollte man haben. - Arbeitsplan: es sollten einzelne Fragestellungen / Teilprobleme identifiziert werden und ein grober Plan entwickelt werden, in welchem Zeitraum welches Teilproblem mit welchem Aufwand und welchen zusätzlichen Ressourcen (z.B. Diplomarbeiten) bearbeitet wird. Abhängigkeiten zu anderen, parallel laufenden Projekten und Dissertationsvorhaben sollten identifiziert werden, insb. wenn man für eigene Experimente / Implementierungen zum Zeitpunkt X ein funktionsfähiges Stück Software vom Kollegen Y benötigt. Die Arbeitsplanung sollte so konkret sein, daß man z.B. alle drei Monate prüfen kann, ob der geplante Fortschritt auch erreicht worden ist. weitere empfehlenswerte Lektüre: - Vorschläge früherer Dissertationsvorhaben - Anträge für DFG-Projekte und zug. Richtlinien